ChatGPT-Image2 体验

ChatGPT-Image2 体验

AI 摘要
OpenAI新发布的GPT Image 2模型在图片准确度和中文处理上大幅提升。通过手绘水彩风格的城市地图测试,模型能较好呈现地标、美食等元素,中文标注基本无误,虽有个别细节偏差,但整体表现远超初代,一次成型效果令人惊喜。

前几天 ChatGPT 发布了新的图片模型 GPT Image 2,整个 Ai 圈炸了,跟之前图片模型甚至是 nanobanana 相比, 图片准确度和中文处理更友好,这点还是可以吹的。我用几段提示词生成了几张图片对比了一下, 确实比初代强太多了。

城市手绘水彩风格

临沂

生成一张手绘水彩风格的 临沂 城市地图,包括当地特色美食 炒鸡 糁 炸煎饼 摊煎饼 等,还有地标建筑和城市特色,需要高清,中文不能有错误, 16:9 比例宽度

这个图片有几处不准确,但是看到这个图片还是让我震惊,毕竟这是第一版直接输出。
糁标错了音,我们念 sa,但是标注 shen 是没错的, 输入法打 shen 可以打出来。 炸煎饼可能是我描述的不对,所以图片也不准确,临沂市人民政府大楼在临沂的三河口方向看过去位置是对的,大剧院位置应该在市政府东南方向,但是河道的方向是正确的。
于是我升级了几个提示词,最终又生成了 V2 版本,相对比孟良崮战役纪念馆有点不太准确。 临沂V2

我有顺便根据提示词生成了绍兴和塔什干,基本一次成型,暂时没有发现特别明显错误。

绍兴

生成一张手绘水彩风格的 绍兴 城市地图,包括当地特色美食 三臭 黄酒 风干鸡和风干鱼等,体现出 轻纺城,还有地标建筑和城市特色,需要高清,中文不能有错误, 16:9 比例宽度

塔什干

生成一张手绘水彩风格的 塔什干 乌兹别克斯坦 城市地图,包括当地特色美食 手抓饭 馕等,体现出 中亚枢纽 中亚名城,还有地标建筑和城市特色,需要高清,中文不能有错误, 16:9 比例宽度

直播间现场风格

抖音直播间风格

提示词:生成一张直播间的图片,直播间的氛围是李小龙和周杰伦在卖双截棍,伴随很多人的评论, 还有情何以堪 51 级在刷礼物,抖音一号

古诗词意境风格

滕王阁序

提示词:帮我生成一张 王勃《滕王阁序》的意境图,带整篇《滕王阁序》文字

中文生成还是多少有一点瑕疵,但是意境图和我想的却是很一致,完全可以身临其境。

长画轴风格

兰亭集序

提示词:帮我生成一张 王羲之 《兰亭序》 的长卷图,带整篇的《兰亭序》文字

这个版本错别字渲染有比较多, 处理这么多字的时候,还是有点失误,毕竟是对中文支持度不如英文,意境风格是没有问题

英文歌词版权

我给ChatGPT新的提示

帮我生成一张 迈克尔杰克逊的 Heal the world 歌词 展示图,需要包含整篇歌词以及迈克尔杰克逊的图片,意境图需要体会歌词意思
得到了拒绝的回答:非常抱歉,生成的图片可能违反了我们的内容政策。如果你认为此判断有误,请重试或修改提示语。

最后 AI 给我了新的提示词

极具感染力的音乐意境海报,主题围绕“Heal the World”, 画面表现温暖、治愈、希望与人类关怀,场景:夕阳下的地球、孩子们在草地上玩耍、不同肤色的人们牵手, 天空有光线穿透云层,象征希望与治愈,画面中有一位经典流行音乐风格的男歌手形象, 黑色卷发,舞台灯光下,富有感染力的表演姿态, 整体风格致敬80-90年代流行音乐传奇,画面叠加优雅排版的英文歌词片段(非完整歌词): “Heal the world, make it a better place For you and for me and the entire human race” 字体:柔和发光字体,类似音乐专辑封面设计, 风格:电影级光影、情绪感强、写实+艺术融合, 色调:暖金色+蓝色对比,治愈氛围, 构图:16:9 横版,高分辨率,适合作为封面或海报, 无水印,无UI界面

结果还是非常抱歉,生成的图片可能违反了关于与第三方内容相似性的防护限制。如果你认为此判断有误,请重试或修改提示语。

我尝试去生成周杰伦青花瓷意境图,也是提示版权,但是周杰伦和李小龙卖双截棍就没有提示我版权信息。 很是纠结。
UPDATE 重新开启会话,生成成功。 青花瓷

人物写实摄影图

一幅写实风格的肖像画,浅景深与柔和散景效果, 画面主体: 一位年轻的日本女性,气质温柔清新, 她微微回头看向镜头,脸上带着自然柔和的微笑, 五官精致,肤色细腻通透, 服饰: 身着浅米色和服,上面点缀橙色枫叶图案, 腰间系金色腰带,细节精致, 发型: 深色头发盘成优雅发髻, 几缕碎发自然垂落在脸颊两侧, 佩戴小巧珍珠耳环, 场景: 秋日庭院背景,红色枫叶盛开, 左上角有清晰的红枫叶作为前景点缀, 背景经过柔和虚化(bokeh), 氛围: 宁静、温柔、电影感, 光线柔和偏暖,具有日系胶片质感, 风格: 超写实摄影风格,电影级光影, 细节精致,高分辨率, 构图: 16:9 横版,无水印,无UI元素

我提供了几个提示词,甚至让 ChatGPT 自己修改提示词,一致提示错误,非常抱歉,该提示可能违反了我们的内容政策。如果你认为此判断有误,请重试或修改提示语。 最后的解决方案, 当本次会话提示错误,删除本次会话,开启新的会话,继续尝试,会成功的。

人物写实

说实话我有时候项目的logo或者在研究一些网页设计风格,我会让Ai先帮我生成创建几个风格。我再让设计师精修,但是也没有达到一次就满意的效果,但是这次新模型总的来说新模型表现的相当给力。前段时间我再用 Qwen的时候重新生成 SBTI 测试结果图,国产模型就表现的比chatgpt要好,尝试用 image2 重构对比下效果。

这次ChatGPT的中文表现是超乎我的想象的,现在各种新模型都在个拼实力,受益良多的还是我们用户。 新版本 ChatGPT 5.5 在Codex使用的时候会触发风险验证,这个问题之前 5.4 的时候没有,现在也没找到好的方案去解决,我准备让我的翻译尝试下,不知道可以不。 毕竟验证表单选择中国就说无法验证直接拒绝。

Ai 让生活更美好。

作者本文采用CC BY-NC-SA 4.0许可协议,转载请注明来源。