Compare: 实测GPT-image-2，设计行业真的完蛋了吗？

← Back to document 实测GPT-image-2，设计行业真的完蛋了吗？

Extracted Text

被炒的沸沸扬扬的GPT-image-2，终于在今天凌晨，一场直播后。正式上线了。而GPT-image-2的效果，我说实话，实测完以后，我确实只能用震撼来形容。比Nano Banana 2的效果，直接抬了好几个台阶。其实这才是我心中，之前对于Nano Banana 2的预期，可惜Google没做出来，但是，OpenAI做出来了。现在在ChatGPT中直接用创建图片，就可以直接触发。直接放几张样图吧。比如恋与深空老登版。然后莫名其妙的，又有人做了卡兹克版。。。我服了。。。比如马斯克和库克连麦打PK。还有最离谱的，AI直接生成的X上的Anthropic的图，注意，这是生成的，不是截图！！！从样图就可以看出来，这些图片的真实性，我自己可以说，已经几乎无法分辨了。作为一个曾经的设计师。我想说，从今天开始，AI生成的图片，就像AI生成的文字一样，正式步入了一个普通人无法分辨真假的年代。一个我们再也无法分辨，是照片、截图，还是AI生成的年代。一个绝大多数的设计，都不需要再找专业设计师的年代。一个我觉得可以对标coding领域，称之为Vibe Design时刻的年代。相比于之前的所有绘图模型，世界知识、文字渲染、修改精准度、还有图片审美，就是我觉得这次GPT-image-2最离谱的进步。我们一个一个来说。一. 文字渲染文字渲染这个事，一直是所有AI图像模型最大的痛点。没有之一。之前不管是DALL-E还是Seedream还是Nano Banana 2，你让它在图里生成比较多的文字海报，比如招聘海报之类的。大概率会出现各种各样的鬼畜。你想用AI做个文字海报？做个产品包装？或者做个文字信息很多的海报？不好意思，文字部分你完全解决不了。或者你就去用更加AI Native的方式吧，就是直接用HTML用代码画，但是代码渲染文字确实非常的准，可视觉效果，就是只能比较简单或者模板化，没有办法很复杂，视觉效果没有这么好可现在呢。都不说英文了，GPT-image-2的中文渲染，真的极度的离谱。比如，直接默写一个出师表。我第一次见到这么多次，绝大多数还稳定的，太离谱了。还有报纸。还能生成数学试卷。还有群友做的，能帮你代写情书。还有红楼梦的关系图。还有我直接把职位JD给GPT，然后直接生成的我们的招聘海报。说实话，中文渲染能做到这个水平，对我们国内用户而言，这才是设计的aha时刻。二. 世界知识这个是我觉得GPT-image-2最离谱的一个能力，也是我觉得跟其他所有模型拉开差距最大的地方。世界知识的意思，就是这个模型对真实世界长什么样，有着极其精准的理解。比如你让它生成一张YouTube首页的截图，它不是随便画一个红色播放按钮然后乱填一些文字。它会画出正确的布局、正确的按钮样式、正确的图标位置，甚至连各个视频的封面，都是正确的。就像昨晚我发朋友圈的一张图。直出，无任何修改。还有生成一张小红书界面个人主页截图但是是Grok的个人主页，或者看到朋友@李昂Lyon生成B站然后直接改图。我特么看到这些图的时候真的差点以为自己打开了小红书和B站。甚至它还还给Grok编了一套完整的人设。 128.6万粉丝、302.1万获赞、AI来自xAI，目标是理解宇宙并以幽默和真相回应一切问题。。。这个细节量，已经不是画图的范畴了。还有游戏的，生成一张三角洲跑刀代肝的图，得有一个大的1000比56。我甚至都没说，那1000和56是什么。他自己直接给我补上了1000万哈夫币比56人民币。甚至还补上了无数的优点，比如下面高效代肝、稳定比例、安全无封、全天接单四个卖点，还有那一句：效率看得见，实力不吹牛。这个文案的专业程度，说是一个真的工作室做出来的海报我都信。还有一个@歸藏做的case，他随手发了一张车的图，没有说是啥车，让GPT-image-2去给他做一个这个车的官网。然后。。。。。虽然藏师傅给的是YU7的图不是SU7，这个有失误，但，已经牛逼上天了。它的世界知识，比Banana还要再强好几个档次。三. 精准度第三个核心升级，修改精准度。这个能力我们之前在Nano Banana上就有体感了，但GPT-Image-2又把它往前推了一大步。而且不只是改图了，它对你意图的理解，已经可以到一个离谱的程度了。我举个实际案例。我们公司之前3D打印了一个桌面的小摆件，拿来直播的时候送粉丝玩的，是Claude Code那个吉祥物的周边，可以夹在显示器边上，头上举着一块小黑板，挺好玩的一个小东西。我把这张照片丢给GPT-Image-2，说了一句话，帮我生成一张图片，将该产品进行精修，可重新打光，精修优化，白色的背景。出来的效果，直接就是完美的电商产品抠图主图的水平。白色背景、柔光打光、产品居中、阴影自然，无敌。然后我跟他说，帮我做一张这个产品的电商详情页海报。它直接给我生成了一整张产品详情长图。不是哥们。这也太离谱了。。。你知道我看到这张图的时候在想什么吗？我在想，我靠，这要我去开个淘宝店。。。这个详情页，好像可以直接用？？？从一张手机随手拍的照片，到一整套电商级别的产品详情页，整个过程我只说了两句话。两句话。以前做这种详情页，我们设计师至少要搞两三天，拍产品照、修图、做排版、写文案、做分区详情、做场景图。现在两句话搞定了。我都不敢想很多设计师朋友，看到这个会是什么心情。还有一个纯搞的。我传了一张电影《闪灵》的经典画面，就是杰克·尼科尔森把脸怼进门缝里那张，然后配上了两张参考图，迪迦奥特曼和一只黄色猫咪。然后。。。你就看谁能不笑吧。然后，还换成了奥特曼和我自己。给我笑麻了。还能让这么一群人，在AIFUT大会上圆桌对谈。 GPT-image-2对各类物品的精准度极高。唯一可惜的就是，对亚洲人的一致性没有那么好。这个点是有点可惜的。四. 审美最后一个，也是我觉得最微妙但最重要的一个升级。审美。之前GPT画图就被人非常的诟病，审美上还是差。其实Banana的审美也有点一般，出来的图跟Midjourney比还是差。但，GPT-Image-2出来的图，不一样了。它有品味，审美是真的强。比如这张，我超级超级超级喜欢的K-POP女团第三张迷你专辑的概念海报。所有人都穿黑色系的造型，打光是侧逆光加柔焦，整体色调偏冷灰蓝，跟ECLIPSE（日食）的概念完全吻合。肢体、影子什么的，全是对的。脸部细节、发丝、饰品的光泽、布料的褶皱质感，每个人还有不同的pose和表情，也都有自己的气质，喜欢。然后是一张信息量极大的图。生成一张Mariah Carey 90年代生涯图的中文信息长图。这张图我必须多说两句，因为它展现的不只是审美，还有信息设计能力。左边是Mariah Carey的侧面照，配上「她的高音征服了世界，她的音乐定义了一个时代」，右边是1990到1999的年份时间线，每一年都有一段中文描述和代表单曲，旁边配上那一年的专辑封面。一直到1998，精选集《#1's》，代表单曲My All。 1999，传奇延续。这张图的信息密度已经非常恐怖了，但更恐怖的是，它好看。这种大量信息 + 美感 + 准确性的三角组合，说实话，以前只有比较不错的视觉设计师能做到。还有GPT-Image-2在纯艺术方向上的审美能力。比如暗黑风格的金克斯。这张图的呼吸感和节奏相当的顺畅，按这个完成度，要是搁几年前在一些绘画平台上发出来，我觉得能拿到相当多的赞。还有其他的。说实话，GPT-image-2吧设计的门槛，又一步拉的极低。现在，人人真的都可以。做设计了。写在最后这次GPT-image-2对设计行业的冲击。我觉得比以前所有的时刻，都要大。因为它好到了一个临界点，好到了让画图这件事本身，变得不再稀缺。我想起了一篇很多年前的文章。 2015年，知乎上有一个问题，叫「设计师这样的工作，可以做一辈子吗？」有一个叫大头帮主的人，写了一篇回答。那一年我刚入行没多久，看完那篇回答之后，我存了下来，反复看了很多遍。可以说，那篇回答，几乎塑造了我后来十年对设计这个行业的三观。至今我都奉为设计行业的圣经之一。里面有一段话，我可以倒背如流。 “不要忘了，设计师，绝对，绝对不是画图员。设计师的最终价值，在于思辨。在于面对纷繁复杂的现实问题时候，切中肯綮，直击要害，找到最优解。你可曾感受过，一个设计师思考力量之强大么?” 2015年看到这段话的时候，我觉得它是在告诉我，设计师应该追求什么。 2026年的今天，GPT-Image-2全量上线的今天，我重新看这段话时，我感觉有一种宿命的轮回。它变成了一句预言。 GPT-Image-2把画图这件事，彻底民主化了。任何人，不需要任何设计基础，只要会说话，就能做出80分甚至90分的设计。这是事实。但，画图从来都不是设计，画图是设计的执行层。而设计的核心，从来都是思考，是思辨。是理解一个商业问题、拆解用户需求、在无数种可能性中找到那个最精准的解法，然后，把它视觉化。所以回到标题的那个问题。设计行业完蛋了吗？画图员的时代，确实结束了。但设计师的时代，才刚刚开始。这个世界永远不缺画图的工具。但永远需要的，是真正的思考者、创造者、和问题的解决者。这才是我们应该穷尽一生，而努力的方向。风雨同舟。愿与诸君共勉。

Archived Raw HTML