OpenAI Images 2.0登顶Image Arena:242分优势创纪录,中文渲染 breakthrough

4月22日,OpenAI正式发布ChatGPT Images 2.0,这是其图像生成技术的重大升级版本。基于全新的GPT Image 2模型,Images 2.0首次引入"思考能力",一经发布便迅速登顶Image Arena所有排行榜,在文生图榜单上以242分的巨大优势创下该领域最大分差纪录。

一、思考模式:从"渲染"到"设计"的质变

Images 2.0最显著的创新在于首次引入"思考能力"。当用户在ChatGPT中选择thinking或pro模型时,Images 2.0可以联网获取实时信息,从一个提示生成多张不同图像,并对自身输出进行复核。

OpenAI首席执行官山姆·奥特曼将此次更新形容为"从穴居人壁画到文艺复兴的飞跃"。在生成图像前,模型会先对任务进行拆解规划,搜索网络获取实时信息,根据一个提示词创建多个不同的图像,并自我复核其输出。这种"思考模式"将图像生成从单纯的渲染提升到了战略设计的高度。

二、多语言文本渲染 breakthrough

长期以来,AI图像生成的最大痛点在于难以准确渲染文字,尤其是中文、日文等非拉丁字母文字。Images 2.0在这方面取得了巨大突破,对中文、日文、韩文、印地语、孟加拉语等多语言文本的精准渲染能力被认为是此次最大的技术突破之一。

实测显示,Images 2.0能够生成以假乱真的界面截图、TikTok视频截图等复杂图像,中文文字生成准确率高。这一能力使其在生产力场景中可完成商品广告设计、论文海报生成等任务,并能基于联网搜索自动收集信息。

三、8张连贯图像生成,创作效率倍增

Images 2.0支持单次提示生成最多8张图像,并在不同场景中保持角色、物体及风格的一致性。这一功能大幅降低漫画页面、社交媒体系列配图及室内设计方案的创作门槛。

在图像质量方面,新版本支持最高2K分辨率,并将宽高比范围扩展至3:1与1:3,适配不同应用场景。针对像素艺术、漫画以及电影剧照等特定风格,该工具进行了优化,用户可以轻松创作出符合其风格偏好的作品。

目前,Images 2.0已向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放思考模式,所有用户均可通过ChatGPT及Codex直接调用基础模型,底层gpt-image-2模型也已通过API向开发者开放集成。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐

1 1

免费AI工具合集,点击进入

AI对话

玉米AI助手