OpenAI 正式推出 ChatGPT Images 2.0 图像模型,在复杂视觉任务的处理能力上实现显著提升。
核心升级亮点
- 精准理解与表达:大幅提升对指令的理解、对象摆放与关系表达的能力。
- 卓越文本渲染:支持多语言文本生成,能在图像中准确呈现非英文内容,并增强整体语义连贯性。
- 精细细节控制:可生成小字体、图标、UI元素等复杂构图,最高支持2K分辨率输出。
- 多样风格表现:稳定生成照片级真实画面、影视风格、像素风及漫画等多种视觉类型。
应用场景
该模型适用于游戏开发、分镜设计、营销素材制作等场景,具备从文案生成到设计构图的端到端任务处理能力。
开放计划
ChatGPT Images 2.0 已向所有 ChatGPT 与 Codex 用户开放。具备“思考能力”的高级图像功能面向 Plus、Pro 与 Business 用户开放(Enterprise 即将支持)。底层模型 gpt-image-2 也已开放 API 接入。