告别AI图像“变脸”:OpenAI发布GPT Image1.5,聚焦精确编辑与视觉一致

OpenAI 正式推出新一代图像生成模型 GPT Image1.5,以回应谷歌在人工智能赛道的强势推进。根据 AIbase 报道,这一版本带来显著提升,包括更准的指令跟随、更细的编辑粒度,以及最高可达四倍的生成速度

 速度与准确双提:GPT Image1.5正面迎战谷歌

GPT Image1.5 自本周二起向所有 ChatGPT 用户和 API 用户全面开放。此次发布是在 OpenAI 首席执行官 Sam Altman 宣布进入“红色警戒”后,为夺回 AI 领先优势而推进的最新动作。

此前,谷歌的旗舰模型 Gemini3 与爆火的图像生成器 Nano Banana Pro 表现抢眼,在 LMArena 榜单占据前列并加速抢占市场。尽管 OpenAI 上周带来了其自称“迄今为止最先进”的 GPT-5.2,谷歌仍保持领先。据称,OpenAI 原定于 1 月上旬发布新图像模型,但为了应对竞争,此次发布时间被加速

QQ20251217-084853.png

 直逼专业后期:攻克 GenAI 图像一致性痛点

GPT Image1.5 延续 4 月发布的 GPT Image1 再度迭代,把图像生成从“原型尝鲜”推进到更可用的生产力阶段。新模型突出后期制作功能,与 Nano Banana Pro 类似,支持更精细的编辑控制,并在修改过程中保持关键的视觉一致性(如人脸相似度、光影、构图与色调)。

这对 GenAI 图像工具是一次重要突破。OpenAI 指出,许多现有工具在多轮微调时表现欠佳:当用户提出“调整面部表情”或“把光线调冷”这类需求,模型往往会重新诠释整幅图,导致前后不一致。GPT Image1.5 旨在解决这一指令跟随难题。

 整合“创意工作室”与视觉体验优化

OpenAI 应用首席执行官 Fidji Simo 在博客中表示,ChatGPT 现已通过侧边栏提供“更像是一个创意工作室”的专用入口来使用图片相关功能。全新的图像查看与编辑界面,帮助用户更容易做出贴合想法的作品,或从热门提示与预设滤镜中寻找灵感。

除全新图像生成器外,OpenAI 还计划以更多视觉元素完善 ChatGPT 的整体体验。Simo 称,未来的搜索结果将展示更多带有清晰来源的视觉元素,对于单位换算、查看体育比分等场景会更有帮助。

Simo 表示:“当你脑海里的点子与把它变成现实的能力距离越小,我们就能更好地为你服务。”

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享