OpenAI 最先进的图像生成模型。文字渲染准确率达 99% 以上,原生支持中日韩与阿拉伯文等多语种,具备推理驱动生成能力,最高支持 4K 分辨率 —— 将文字提示与参考图片转化为生产级视觉内容。
由 OpenAI 驱动 —— DALL-E 的继任者,现已具备推理能力

GPT Image 2 是 OpenAI 图像生成的全面重构,而非渐进式更新。它将推理引入生成流程,解决了长期以来的文字渲染难题,为设计、营销和出版等专业工作流交付生产级输出。
改变游戏规则的突破。GPT Image 2 在图像内渲染文字的准确率近乎完美 —— 标题、产品标签、UI 原型、路牌,甚至复杂的信息图表。中文、日文、韩文、阿拉伯文等多语种均可正确拼写,字体一致,排版规范。
与以往模型不同,GPT Image 2 能在生成前逐步推理复杂提示。它规划物体位置、验证文字准确性并检查自身输出 —— 即使面对最详尽的指令也能精准匹配。
上传最多 16 张参考图片,用文字指令进行编辑。GPT Image 2 自动以最高保真度处理所有输入图像,在保留精细细节的同时进行精确修改 —— 从风格转换到产品原型。
通过 API 可原生生成最高 4096x4096 像素图像,支持从 3:1 到 1:3 的多种宽高比。可输出 PNG、JPEG 或 WebP 格式并自定义压缩率 —— 适用于印刷、网页或社交媒体。
GPT Image 2 弥合了 AI 生成图像与专业设计工作流之间的鸿沟。首次实现了含文字设计、品牌素材和营销物料的可靠生成,满足商业标准。
GPT Image 2 将自回归生成与推理相结合,在指令跟随、文字准确度和视觉质量方面树立新标杆。
用自然语言描述任何图像(最长 20,000 字符),GPT Image 2 以出色的保真度将其呈现。从写实场景到风格化插画,模型精准地执行详细指令。
上传参考图片并用文字指令进行编辑。每次请求支持最多 16 张输入图片 —— 适用于批量编辑、风格转换、合成创作与多参考图生成。
在英语、中文、日文、韩文、阿拉伯语、印地语、孟加拉语等多种文字中准确渲染。创建本地化营销素材、多语种产品标签和国际标牌 —— 字符渲染均正确无误。
支持从 3:1 到 1:3 的多种宽高比。创建横幅、社交媒体帖子、手机壁纸、海报和幻灯片 —— 精确匹配您需要的尺寸。
GPT Image 2 的生成速度约为前代的两倍。更低延迟意味着更快的迭代周期和更高效的创意工作流。
高级来源分类器准确率达 99.8%。可配置的内容审核级别适应不同场景。图像包含 C2PA 元数据用于来源验证。
关于 aiimg.me 上 GPT Image 2 你需要了解的一切