← Back to document 实测GPT-image-2,设计行业真的完蛋了吗?
Open original site →
Extracted Text
被炒的沸沸扬扬的GPT-image-2,终于在今天凌晨,一场直播后。 正式上线了。 而GPT-image-2的效果,我说实话,实测完以后,我确实只能用震撼来形容。 比Nano Banana 2的效果,直接抬了好几个台阶。 其实这才是我心中,之前对于Nano Banana 2的预期,可惜Google没做出来,但是,OpenAI做出来了。 现在在ChatGPT中直接用创建图片,就可以直接触发。 直接放几张样图吧。 比如恋与深空老登版。 然后莫名其妙的,又有人做了卡兹克版。。。 我服了。。。 比如马斯克和库克连麦打PK。 还有最离谱的,AI直接生成的X上的Anthropic的图,注意,这是生成的,不是截图!!! 从样图就可以看出来,这些图片的真实性,我自己可以说,已经几乎无法分辨了。 作为一个曾经的设计师。 我想说,从今天开始,AI生成的图片,就像AI生成的文字一样,正式步入了一个普通人无法分辨真假的年代。 一个我们再也无法分辨,是照片、截图,还是AI生成的年代。 一个绝大多数的设计,都不需要再找专业设计师的年代。 一个我觉得可以对标coding领域,称之为Vibe Design时刻的年代。 相比于之前的所有绘图模型,世界知识、文字渲染、修改精准度、还有图片审美,就是我觉得这次GPT-image-2最离谱的进步。 我们一个一个来说。 一. 文字渲染 文字渲染这个事,一直是所有AI图像模型最大的痛点。没有之一。 之前不管是DALL-E还是Seedream还是Nano Banana 2,你让它在图里生成比较多的文字海报,比如招聘海报之类的。 大概率会出现各种各样的鬼畜。 你想用AI做个文字海报?做个产品包装?或者做个文字信息很多的海报?不好意思,文字部分你完全解决不了。 或者你就去用更加AI Native的方式吧,就是直接用HTML用代码画,但是代码渲染文字确实非常的准,可视觉效果,就是只能比较简单或者模板化,没有办法很复杂,视觉效果没有这么好 可现在呢。 都不说英文了,GPT-image-2的中文渲染,真的极度的离谱。 比如,直接默写一个出师表。 我第一次见到这么多次,绝大多数还稳定的,太离谱了。 还有报纸。 还能生成数学试卷。 还有群友做的,能帮你代写情书。 还有红楼梦的关系图。 还有我直接把职位JD给GPT,然后直接生成的我们的招聘海报。 说实话,中文渲染能做到这个水平,对我们国内用户而言,这才是设计的aha时刻。 二. 世界知识 这个是我觉得GPT-image-2最离谱的一个能力,也是我觉得跟其他所有模型拉开差距最大的地方。 世界知识的意思,就是这个模型对真实世界长什么样,有着极其精准的理解。 比如你让它生成一张YouTube首页的截图,它不是随便画一个红色播放按钮然后乱填一些文字。 它会画出正确的布局、正确的按钮样式、正确的图标位置,甚至连各个视频的封面,都是正确的。 就像昨晚我发朋友圈的一张图。 直出,无任何修改。 还有生成一张小红书界面个人主页截图但是是Grok的个人主页,或者看到朋友@李昂Lyon生成B站然后直接改图。 我特么看到这些图的时候真的差点以为自己打开了小红书和B站。 甚至它还还给Grok编了一套完整的人设。 128.6万粉丝、302.1万获赞、AI来自xAI,目标是理解宇宙并以幽默和真相回应一切问题。。。 这个细节量,已经不是画图的范畴了。 还有游戏的,生成一张三角洲跑刀代肝的图,得有一个大的1000比56。 我甚至都没说,那1000和56是什么。 他自己直接给我补上了1000万哈夫币比56人民币。 甚至还补上了无数的优点,比如下面高效代肝、稳定比例、安全无封、全天接单四个卖点,还有那一句: 效率看得见,实力不吹牛。 这个文案的专业程度,说是一个真的工作室做出来的海报我都信。 还有一个@歸藏做的case,他随手发了一张车的图,没有说是啥车,让GPT-image-2去给他做一个这个车的官网。 然后。。。。。 虽然藏师傅给的是YU7的图不是SU7,这个有失误,但,已经牛逼上天了。 它的世界知识,比Banana还要再强好几个档次。 三. 精准度 第三个核心升级,修改精准度。 这个能力我们之前在Nano Banana上就有体感了,但GPT-Image-2又把它往前推了一大步。 而且不只是改图了,它对你意图的理解,已经可以到一个离谱的程度了。 我举个实际案例。 我们公司之前3D打印了一个桌面的小摆件,拿来直播的时候送粉丝玩的,是Claude Code那个吉祥物的周边,可以夹在显示器边上,头上举着一块小黑板,挺好玩的一个小东西。 我把这张照片丢给GPT-Image-2,说了一句话,帮我生成一张图片,将该产品进行精修,可重新打光,精修优化,白色的背景。 出来的效果,直接就是完美的电商产品抠图主图的水平。 白色背景、柔光打光、产品居中、阴影自然,无敌。 然后我跟他说,帮我做一张这个产品的电商详情页海报。 它直接给我生成了一整张产品详情长图。 不是哥们。 这也太离谱了。。。 你知道我看到这张图的时候在想什么吗? 我在想,我靠,这要我去开个淘宝店。。。 这个详情页,好像可以直接用??? 从一张手机随手拍的照片,到一整套电商级别的产品详情页,整个过程我只说了两句话。 两句话。 以前做这种详情页,我们设计师至少要搞两三天,拍产品照、修图、做排版、写文案、做分区详情、做场景图。 现在两句话搞定了。 我都不敢想很多设计师朋友,看到这个会是什么心情。 还有一个纯搞的。 我传了一张电影《闪灵》的经典画面,就是杰克·尼科尔森把脸怼进门缝里那张,然后配上了两张参考图,迪迦奥特曼和一只黄色猫咪。 然后。。。 你就看谁能不笑吧。 然后,还换成了奥特曼和我自己。 给我笑麻了。 还能让这么一群人,在AIFUT大会上圆桌对谈。 GPT-image-2对各类物品的精准度极高。 唯一可惜的就是,对亚洲人的一致性没有那么好。 这个点是有点可惜的。 四. 审美 最后一个,也是我觉得最微妙但最重要的一个升级。 审美。 之前GPT画图就被人非常的诟病,审美上还是差。 其实Banana的审美也有点一般,出来的图跟Midjourney比还是差。 但,GPT-Image-2出来的图,不一样了。 它有品味,审美是真的强。 比如这张,我超级超级超级喜欢的K-POP女团第三张迷你专辑的概念海报。 所有人都穿黑色系的造型,打光是侧逆光加柔焦,整体色调偏冷灰蓝,跟ECLIPSE(日食)的概念完全吻合。 肢体、影子什么的,全是对的。 脸部细节、发丝、饰品的光泽、布料的褶皱质感,每个人还有不同的pose和表情,也都有自己的气质,喜欢。 然后是一张信息量极大的图。 生成一张Mariah Carey 90年代生涯图的中文信息长图。 这张图我必须多说两句,因为它展现的不只是审美,还有信息设计能力。 左边是Mariah Carey的侧面照,配上「她的高音征服了世界,她的音乐定义了一个时代」,右边是1990到1999的年份时间线,每一年都有一段中文描述和代表单曲,旁边配上那一年的专辑封面。 一直到1998,精选集《#1's》,代表单曲My All。 1999,传奇延续。 这张图的信息密度已经非常恐怖了,但更恐怖的是,它好看。 这种大量信息 + 美感 + 准确性的三角组合,说实话,以前只有比较不错的视觉设计师能做到。 还有GPT-Image-2在纯艺术方向上的审美能力。 比如暗黑风格的金克斯。 这张图的呼吸感和节奏相当的顺畅,按这个完成度,要是搁几年前在一些绘画平台上发出来,我觉得能拿到相当多的赞。 还有其他的。 说实话,GPT-image-2吧设计的门槛,又一步拉的极低。 现在,人人真的都可以。 做设计了。 写在最后 这次GPT-image-2对设计行业的冲击。 我觉得比以前所有的时刻,都要大。 因为它好到了一个临界点,好到了让画图这件事本身,变得不再稀缺。 我想起了一篇很多年前的文章。 2015年,知乎上有一个问题,叫「设计师这样的工作,可以做一辈子吗?」 有一个叫大头帮主的人,写了一篇回答。 那一年我刚入行没多久,看完那篇回答之后,我存了下来,反复看了很多遍。 可以说,那篇回答,几乎塑造了我后来十年对设计这个行业的三观。 至今我都奉为设计行业的圣经之一。 里面有一段话,我可以倒背如流。 “不要忘了,设计师,绝对,绝对不是画图员。设计师的最终价值,在于思辨。在于面对纷繁复杂的现实问题时候,切中肯綮,直击要害,找到最优解。你可曾感受过,一个设计师思考力量之强大么?” 2015年看到这段话的时候,我觉得它是在告诉我,设计师应该追求什么。 2026年的今天,GPT-Image-2全量上线的今天,我重新看这段话时,我感觉有一种宿命的轮回。 它变成了一句预言。 GPT-Image-2把画图这件事,彻底民主化了。 任何人,不需要任何设计基础,只要会说话,就能做出80分甚至90分的设计。 这是事实。 但,画图从来都不是设计,画图是设计的执行层。 而设计的核心,从来都是思考,是思辨。 是理解一个商业问题、拆解用户需求、在无数种可能性中找到那个最精准的解法,然后,把它视觉化。 所以回到标题的那个问题。 设计行业完蛋了吗? 画图员的时代,确实结束了。 但设计师的时代,才刚刚开始。 这个世界永远不缺画图的工具。 但永远需要的,是真正的思考者、创造者、和问题的解决者。 这才是我们应该穷尽一生,而努力的方向。 风雨同舟。 愿与诸君共勉。
Archived Raw HTML