智谱 AI 刚发布面向视觉编程的大模型 GLM-5V-Turbo。它的最大亮点,是不止能读文字,还能直接“看懂”设计图和网页截图。
依托原生多模态的深度融合,GLM-5V-Turbo 让编程不再局限于纯文本输入。开发者只需上传草图或界面截图,模型即可自动生成可运行的前端代码。

视觉理解:从“读文档”到“看界面”
该模型提供 200k 的超长上下文窗口,能够处理庞大而复杂的代码库。不仅能识别页面布局,还能准确把握配色、组件层级以及细微的交互细节。
在实测中,GLM-5V-Turbo 在设计稿还原与视觉代码生成等任务上表现出色。这意味着从设计图到成品页面的转化效率将迎来大幅提升。

赋能智能体:让“龙虾”拥有观察力
智谱旗下 AutoClaw(龙虾)智能体接入该模型后,具备了真正的视觉能力。它可以像人类一样浏览网页,甚至能读懂复杂的 K 线图和券商研报中的图表。
目前,“龙虾”已上线“股票分析师”功能,支持四路数据源并行采集。它能在 60 秒内理解市场走势,并输出图文并茂的专业报告,显著拓宽了 AI 助手的能力边界。
这一步标志着 AI Agent 的感知链路正式从纯文本延展到视觉交互。当 AI 拥有“所见即所得”的能力,软件开发的门槛将进一步降低。
对前端开发者来说,交互式编辑是强力的催化剂。用户只需给出简单指令,就能让 AI 调整样式或新增弹窗,实现可视化且高效的迭代开发。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?