4月2日,

核心亮点:看图有理解,写码有产出
作为原生多模态 Coding 基座,
-
多模态理解:原生读懂图片、视频、设计稿以及复杂文档版面,支持画框、截图、读网页等多种视觉工具的调用。
-
超长上下文:上下文窗口扩展至 200k,从容应对大型工程项目与超长技术资料。
-
性能领先:在多模态编程、GUI Agent(图形界面智能体)等关键评测中,以更小模型规模取得优于同类的成绩。

典型场景:从“草图”到“成品”的快速跨越
-
前端复刻:只需提供设计稿截图或一段操作录屏,模型即可理解布局、配色与交互逻辑,生成可直接运行的前端项目。
-
GUI 自主探索:结合 Claude Code 等框架,它能像真人一样浏览网页、梳理页面跳转并采集素材,实现整站的视觉级复现。
-
交互式编辑:通过对话即可增删模块、改样式、调布局,实现所见即所得的代码迭代。
赋能“龙虾”:AutoClaw 迎来视觉升级
当该模型接入智谱自研智能体
行业观察:编程不再是“盲人摸象”
随着


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?