OpenAI ChatGPT Images 2.0测评:联网搜索与8张连贯生图深度解析
今天,OpenAI正式发布了新一代AI图像生成工具ChatGPT Images 2.0。这款基于GPT Image 2模型构建的工具,最大的亮点在于引入了“思考”能力,并且从即日起,面向所有ChatGPT与Codex用户全面开放。

简单来说,用户现在可以用更自然的语言描述来生成图像。更值得关注的是,它的输入理解能力得到了显著增强,甚至能够解析像GitHub仓库链接这样复杂的指令,并据此生成产品卡片等具有特定用途的视觉内容。
那么,所谓的“思考能力”具体指什么?当用户开启这个选项后,工具在动手画图之前,会先进行一番“头脑风暴”。它可以主动联网搜索相关信息,分析用户上传的参考文件,并对最终图像的结构和布局进行逻辑推理。当然,这项更高级的功能目前主要面向ChatGPT Plus、Pro、Business和Enterprise级别的订阅用户。
对于需要批量出图的内容创作者而言,Images 2.0带来了一个实用的升级:它现在支持单次提示生成最多8张图像。关键在于,这组图像能在角色设定、物体特征和整体风格上保持高度连贯性。无论是创作漫画分镜、系列文章配图,还是展示一套设计方案的不同视角,这个功能都能派上大用场。
在技术规格上,新工具将图像最高分辨率提升至2K,并大幅扩展了宽高比的支持范围,新增了3:1和1:3等极端比例,为创作电影剧照般的宽幅画面或手机竖屏海报提供了便利。此外,它在像素艺术、漫画风格、影视感画面等特定风格的生成质量上,也做了针对性优化。
最后,为了服务更广泛的全球用户,ChatGPT Images 2.0显著提升了多语言文本的渲染效果,特别是对中文、日文、韩文、印地语、孟加拉语等语言的支持更加精准和自然。