谷歌 Gemini 测试版现身:加入图像标注工具与对话式局部编辑

谷歌最近在 Gemini 安卓应用 17.10.54.sa.arm64 测试版中,预览了一次面向生成式图像编辑的大升级。新版把“标记(Markup)”界面深度整合,并加入实时文字描述框,旨在解决 AI 图像二次创作时指令不够精准、操作流程脱节的问题,进一步增强 Gemini 对生成内容(如 Nano Banana 图像)的局部微调能力。

QQ20260318-104736.jpg

这次更新的重点在于重做交互逻辑。相比此前只能做基础涂鸦、还得先退出编辑界面再向机器人下指令的做法,新版允许用户点击“铅笔”图标后,直接在图像指定区域做精确标记,并可同时在底部新增的文本框里输入具体修改意图。

这种“视觉定位+自然语言”的双模态交互,让模型对局部修改的理解更加到位。此外,测试版还预留了调整大小(Resizing)与特效(Effects)的选项位置,显示出 Gemini 正在从单一的文生图工具,迈向集生成、修剪、滤镜处理为一体的综合图像工作站。

从行业趋势看,这一步表明生成式 AI 的竞争焦点,正从“从无到有”的简单生成,转向“可控精修”的精准编辑。把更丰富的标注工具直接放进移动端原生应用,谷歌希望在移动端 AI 影像与数字创作领域树立更高的交互门槛。

虽然这些功能目前仍处于代码解析阶段,尚未正式向公众开放,但其体现出的“标到哪儿改到哪儿”的思路,意味着多模态模型在理解用户细腻审美诉求上又前进了一步,也将加速 AI 绘画从娱乐化向专业创作流程的渗透。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享