OpenAI 正在推出新一代图像生成模型 GPT Image1.5,以回应谷歌在人工智能领域的迅猛攻势。据业内消息,这款新模型承诺带来明显的性能升级,包括更到位的指令跟随、更细腻的编辑控制以及最高可达四倍的图像生成速度。
速度与精度双升级:GPT Image1.5正面迎战谷歌
GPT Image1.5已于本周二面向所有 ChatGPT 用户和 API 用户开放。此次更新是在 OpenAI 首席执行官 Sam Altman 宣布进入“红色警戒”状态后,为重夺人工智能领导地位而采取的最新动作。
此前,谷歌推出的旗舰模型 Gemini3 以及其爆红的图像生成器 Nano Banana Pro 表现强劲,在 LMArena 榜单上名列前茅,并开始蚕食市场份额。尽管 OpenAI 上周发布了自称“迄今为止最先进”的模型 GPT-5.2,谷歌仍保持领先。据称,OpenAI 原计划在1月初发布新的图像生成器,但为应对竞争,此次发布被加速。

媲美后期制作:解决 GenAI 图像一致性难题
GPT Image1.5 是继4月份发布的 GPT Image1 之后的又一次迭代,它把图像生成器从原型探索推进到更具生产力的应用场景。新模型重点强化了后期制作功能,与 Nano Banana Pro 类似,提供更细粒度的编辑控制,从而在修改过程中保持关键的视觉一致性(如面部相似度、光线、构图与色调)。
这对 GenAI 图像工具而言是重要进步。OpenAI 指出,多数现有工具在连续编辑时表现不佳,例如当用户提出“调整面部表情”或“让光线更冷”时,模型常会重新诠释整张图,导致结果前后不一致。GPT Image1.5 旨在解决这一指令跟随痛点。
整合“创意工作室”与视觉体验优化
OpenAI 应用负责人 Fidji Simo 在一篇博客文章中表示,ChatGPT 现已通过侧边栏提供一个“更像是一个创意工作室”的专用入口来使用图片功能。全新的图像查看与编辑界面,能让用户更容易创作出贴近想法的图像,或从热门提示与预设滤镜中获取灵感。
除新的图像生成器外,OpenAI 还计划通过引入更多视觉元素改进 ChatGPT 的整体使用体验。Simo 称,未来的搜索结果将展示更多带有清晰来源的视觉元素,这在单位换算或查看体育比分等任务中尤为实用。
Simo 总结道:“当你脑海中的想法与把它变成现实的能力之间的距离不断缩小,我们才能更好地为你服务。”


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?