OpenAI 正式推出新一代图像生成模型 GPT Image1.5,以回应谷歌在人工智能赛道的强势推进。根据 AIbase 报道,这一版本带来显著提升,包括更准的指令跟随、更细的编辑粒度,以及最高可达四倍的生成速度。
速度与准确双提:GPT Image1.5正面迎战谷歌
GPT Image1.5 自本周二起向所有 ChatGPT 用户和 API 用户全面开放。此次发布是在 OpenAI 首席执行官 Sam Altman 宣布进入“红色警戒”后,为夺回 AI 领先优势而推进的最新动作。
此前,谷歌的旗舰模型 Gemini3 与爆火的图像生成器 Nano Banana Pro 表现抢眼,在 LMArena 榜单占据前列并加速抢占市场。尽管 OpenAI 上周带来了其自称“迄今为止最先进”的 GPT-5.2,谷歌仍保持领先。据称,OpenAI 原定于 1 月上旬发布新图像模型,但为了应对竞争,此次发布时间被加速。

直逼专业后期:攻克 GenAI 图像一致性痛点
GPT Image1.5 延续 4 月发布的 GPT Image1 再度迭代,把图像生成从“原型尝鲜”推进到更可用的生产力阶段。新模型突出后期制作功能,与 Nano Banana Pro 类似,支持更精细的编辑控制,并在修改过程中保持关键的视觉一致性(如人脸相似度、光影、构图与色调)。
这对 GenAI 图像工具是一次重要突破。OpenAI 指出,许多现有工具在多轮微调时表现欠佳:当用户提出“调整面部表情”或“把光线调冷”这类需求,模型往往会重新诠释整幅图,导致前后不一致。GPT Image1.5 旨在解决这一指令跟随难题。
整合“创意工作室”与视觉体验优化
OpenAI 应用首席执行官 Fidji Simo 在博客中表示,ChatGPT 现已通过侧边栏提供“更像是一个创意工作室”的专用入口来使用图片相关功能。全新的图像查看与编辑界面,帮助用户更容易做出贴合想法的作品,或从热门提示与预设滤镜中寻找灵感。
除全新图像生成器外,OpenAI 还计划以更多视觉元素完善 ChatGPT 的整体体验。Simo 称,未来的搜索结果将展示更多带有清晰来源的视觉元素,对于单位换算、查看体育比分等场景会更有帮助。
Simo 表示:“当你脑海里的点子与把它变成现实的能力距离越小,我们就能更好地为你服务。”

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?