智谱发布 GLM-5V-Turbo:给 AI 编程装上“眼睛”,设计稿一键生成代码

智谱 AI 刚发布面向视觉编程的大模型 GLM-5V-Turbo。它的最大亮点,是不止能读文字,还能直接“看懂”设计图和网页截图。

依托原生多模态的深度融合,GLM-5V-Turbo 让编程不再局限于纯文本输入。开发者只需上传草图或界面截图,模型即可自动生成可运行的前端代码。

image.png

视觉理解:从“读文档”到“看界面”

该模型提供 200k 的超长上下文窗口,能够处理庞大而复杂的代码库。不仅能识别页面布局,还能准确把握配色、组件层级以及细微的交互细节。

在实测中,GLM-5V-Turbo 在设计稿还原与视觉代码生成等任务上表现出色。这意味着从设计图到成品页面的转化效率将迎来大幅提升。

image.png

赋能智能体:让“龙虾”拥有观察力

智谱旗下 AutoClaw(龙虾)智能体接入该模型后,具备了真正的视觉能力。它可以像人类一样浏览网页,甚至能读懂复杂的 K 线图和券商研报中的图表。

目前,“龙虾”已上线“股票分析师”功能,支持四路数据源并行采集。它能在 60 秒内理解市场走势,并输出图文并茂的专业报告,显著拓宽了 AI 助手的能力边界。

这一步标志着 AI Agent 的感知链路正式从纯文本延展到视觉交互。当 AI 拥有“所见即所得”的能力,软件开发的门槛将进一步降低。

对前端开发者来说,交互式编辑是强力的催化剂。用户只需给出简单指令,就能让 AI 调整样式或新增弹窗,实现可视化且高效的迭代开发。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享