GPT Image 2 — 首个会先思考再绘画的图像模型
OpenAI 的 gpt-image-2 把原生推理能力带入图像生成。支持 12 种以上语言的清晰文字渲染、多轮编辑保持上下文一致、最高 4K 分辨率输出,速度比上一代快一倍。Image Arena 全球第一,领先第二名 242 个 Elo 分。

正在生成图片...
请稍候...
获取最佳效果的建议
- • 为海报、PPT、信息图明确写出文字内容——GPT Image 2 在拉丁、中日韩和阿拉伯文字渲染上都极其精准
- • 用多轮编辑做精修——一次只描述一个改动,比重写整段提示词更高效
- • 做印刷物料请直接选 4K(4096×4096);探索阶段用 1K 出图更快
- • 复杂多主体场景请逐一列出每个对象——模型可以在单帧画面里稳住 100+ 个不同物体
- • 图表、地图、示意图这类强逻辑场景请配合「Thinking」模式——这是 GPT Image 2 全面碾压同类模型的核心能力
为什么选择 GPT Image 2
OpenAI 的下一代图像模型
首个具备原生推理能力的图像模型,Image Arena 全球第一,领先第二名 242 分。
原生推理架构
GPT Image 2 不只是「画」,它会「想」。模型先研究主题、规划构图、推演版面与结构,再生成第一个像素。非常适合信息图、技术示意图和需要逻辑自洽的概念图。
多语言文字渲染零乱码
在拉丁、中文、日文、韩文、阿拉伯文以及多语种混排场景下,都能渲染清晰可读、准确无误的文字。营销海报、招牌、PPT、漫画、信息图开箱即用。
最高 4K(4096×4096)输出
直接生成印刷级和大屏可用的 4K 画面。低分辨率快速迭代,再原生放大到 4K,无需任何外部工具。
上下文感知多轮编辑
告诉模型要改什么——「背景再暗一点」、「去掉左边人物」、「标题加大」——其他元素完全保留。小修小改不再需要从头重写提示词。
比上一代快 2 倍
更高画质,延迟却减半。更短的迭代循环、更适合生产流水线,单图成本相比 gpt-image-1 大幅下降。
Image Arena 全球第一(+242 Elo)
发布 12 小时内,gpt-image-2 横扫 Image Arena 所有分类登顶,以前所未有的 242 个 Elo 分差领先第二名。
三步用 GPT Image 2 创作
从一句提示词到 4K 大片——让模型为你思考、规划、渲染。
撰写或调整提示词
用任意语言描述你的想法——中文、英文、日文、韩文、阿拉伯文,或多语种混排。GPT Image 2 在落笔之前先规划好版面、字体和构图。
推理、规划、渲染
模型会研究主题、构建画面结构,并精细渲染细节——小字、UI 稿、信息图、密集场景以及复杂多主体版面,最高支持 4K 分辨率。
用多轮编辑迭代
无需推倒重来。说一句「换成日落背景」、「标题再大一点」或「替换左边角色」,GPT Image 2 会保留其他所有元素,跨多轮始终保持一致。
