终结AI图像“变脸”困扰:OpenAI发布GPT Image1.5,聚焦精准编辑与视觉一致性

OpenAI 正在推出新一代图像生成模型 GPT Image1.5,以回应谷歌在人工智能领域的迅猛攻势。据业内消息,这款新模型承诺带来明显的性能升级,包括更到位的指令跟随、更细腻的编辑控制以及最高可达四倍的图像生成速度

 速度与精度双升级:GPT Image1.5正面迎战谷歌

GPT Image1.5已于本周二面向所有 ChatGPT 用户和 API 用户开放。此次更新是在 OpenAI 首席执行官 Sam Altman 宣布进入“红色警戒”状态后,为重夺人工智能领导地位而采取的最新动作。

此前,谷歌推出的旗舰模型 Gemini3 以及其爆红的图像生成器 Nano Banana Pro 表现强劲,在 LMArena 榜单上名列前茅,并开始蚕食市场份额。尽管 OpenAI 上周发布了自称“迄今为止最先进”的模型 GPT-5.2,谷歌仍保持领先。据称,OpenAI 原计划在1月初发布新的图像生成器,但为应对竞争,此次发布被加速

QQ20251217-084853.png

 媲美后期制作:解决 GenAI 图像一致性难题

GPT Image1.5 是继4月份发布的 GPT Image1 之后的又一次迭代,它把图像生成器从原型探索推进到更具生产力的应用场景。新模型重点强化了后期制作功能,与 Nano Banana Pro 类似,提供更细粒度的编辑控制,从而在修改过程中保持关键的视觉一致性(如面部相似度、光线、构图与色调)。

这对 GenAI 图像工具而言是重要进步。OpenAI 指出,多数现有工具在连续编辑时表现不佳,例如当用户提出“调整面部表情”或“让光线更冷”时,模型常会重新诠释整张图,导致结果前后不一致。GPT Image1.5 旨在解决这一指令跟随痛点。

 整合“创意工作室”与视觉体验优化

OpenAI 应用负责人 Fidji Simo 在一篇博客文章中表示,ChatGPT 现已通过侧边栏提供一个“更像是一个创意工作室”的专用入口来使用图片功能。全新的图像查看与编辑界面,能让用户更容易创作出贴近想法的图像,或从热门提示与预设滤镜中获取灵感。

除新的图像生成器外,OpenAI 还计划通过引入更多视觉元素改进 ChatGPT 的整体使用体验。Simo 称,未来的搜索结果将展示更多带有清晰来源的视觉元素,这在单位换算或查看体育比分等任务中尤为实用。

Simo 总结道:“当你脑海中的想法与把它变成现实的能力之间的距离不断缩小,我们才能更好地为你服务。”

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享