4月2日,
核心亮点:能看懂画面,也能写代码
作为原生多模态 Coding 底座,
原生多模态感知: 可深入理解图片、视频、设计稿和复杂文档排版,支持画框、截图、读网页等多种视觉工具的调用。
超长视野: 上下文窗口扩展到 200k,让 Agent 能轻松处理大型工程项目与长篇技术资料。
性能跨越: 在多模态 Coding、GUI Agent(图形界面智能体)等关键基准上,以更小体量取得领先,同时保证纯文本场景的逻辑推理不打折。
典型场景:从“草图”到“成品”的秒级跃迁
前端复刻: 提供一张草图、设计稿截图或一段操作录屏,模型即可读懂布局、配色与交互逻辑,生成可运行的前端工程,细节还原精准。
GUI 自主探索: 结合
交互式编辑: 通过对话即可增删模块、修改文案或调整布局,完成可视化的代码迭代。
赋能“龙虾”:AutoClaw 迎来视觉升级
当该模型接入智谱自研智能体
深度解读图表: 现在可直接看懂 K 线走势、估值区间图以及券商研报中的图表。
高效产出: 支持四路数据源在 60 秒内并行采集,自动生成图文并茂的专业分析报告或 PPT。
行业观察:编程不再“盲人摸象”
伴随

















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?