Document Text
3,903 characters
被炒的沸沸扬扬的GPT-image-2,终于在今天凌晨,一场直播后。<br>
正式上线了。<br>
而GPT-image-2的效果,我说实话,实测完以后,我确实只能用震撼来形容。<br>
比Nano Banana 2的效果,直接抬了好几个台阶。<br>
其实这才是我心中,之前对于Nano Banana 2的预期,可惜Google没做出来,但是,OpenAI做出来了。<br>
现在在ChatGPT中直接用创建图片,就可以直接触发。<br>
直接放几张样图吧。<br>
比如恋与深空老登版。<br>
然后莫名其妙的,又有人做了卡兹克版。。。<br>
我服了。。。<br>
比如马斯克和库克连麦打PK。<br>
还有最离谱的,AI直接生成的X上的Anthropic的图,注意,这是生成的,不是截图!!!<br>
从样图就可以看出来,这些图片的真实性,我自己可以说,已经几乎无法分辨了。<br>
作为一个曾经的设计师。<br>
我想说,从今天开始,AI生成的图片,就像AI生成的文字一样,正式步入了一个普通人无法分辨真假的年代。<br>
一个我们再也无法分辨,是照片、截图,还是AI生成的年代。<br>
一个绝大多数的设计,都不需要再找专业设计师的年代。<br>
一个我觉得可以对标coding领域,称之为Vibe Design时刻的年代。<br>
相比于之前的所有绘图模型,世界知识、文字渲染、修改精准度、还有图片审美,就是我觉得这次GPT-image-2最离谱的进步。<br>
我们一个一个来说。<br>
一. 文字渲染<br>
文字渲染这个事,一直是所有AI图像模型最大的痛点。没有之一。<br>
之前不管是DALL-E还是Seedream还是Nano Banana 2,你让它在图里生成比较多的文字海报,比如招聘海报之类的。<br>
大概率会出现各种各样的鬼畜。<br>
你想用AI做个文字海报?做个产品包装?或者做个文字信息很多的海报?不好意思,文字部分你完全解决不了。<br>
或者你就去用更加AI Native的方式吧,就是直接用HTML用代码画,但是代码渲染文字确实非常的准,可视觉效果,就是只能比较简单或者模板化,没有办法很复杂,视觉效果没有这么好<br>
可现在呢。<br>
都不说英文了,GPT-image-2的中文渲染,真的极度的离谱。<br>
比如,直接默写一个出师表。<br>
我第一次见到这么多次,绝大多数还稳定的,太离谱了。<br>
还有报纸。<br>
还能生成数学试卷。<br>
还有群友做的,能帮你代写情书。<br>
还有红楼梦的关系图。<br>
还有我直接把职位JD给GPT,然后直接生成的我们的招聘海报。<br>
说实话,中文渲染能做到这个水平,对我们国内用户而言,这才是设计的aha时刻。<br>
二. 世界知识<br>
这个是我觉得GPT-image-2最离谱的一个能力,也是我觉得跟其他所有模型拉开差距最大的地方。<br>
世界知识的意思,就是这个模型对真实世界长什么样,有着极其精准的理解。<br>
比如你让它生成一张YouTube首页的截图,它不是随便画一个红色播放按钮然后乱填一些文字。<br>
它会画出正确的布局、正确的按钮样式、正确的图标位置,甚至连各个视频的封面,都是正确的。<br>
就像昨晚我发朋友圈的一张图。<br>
直出,无任何修改。<br>
还有生成一张小红书界面个人主页截图但是是Grok的个人主页,或者看到朋友@李昂Lyon生成B站然后直接改图。<br>
我特么看到这些图的时候真的差点以为自己打开了小红书和B站。<br>
甚至它还还给Grok编了一套完整的人设。<br>
128.6万粉丝、302.1万获赞、AI来自xAI,目标是理解宇宙并以幽默和真相回应一切问题。。。<br>
这个细节量,已经不是画图的范畴了。<br>
还有游戏的,生成一张三角洲跑刀代肝的图,得有一个大的1000比56。<br>
我甚至都没说,那1000和56是什么。<br>
他自己直接给我补上了1000万哈夫币比56人民币。<br>
甚至还补上了无数的优点,比如下面高效代肝、稳定比例、安全无封、全天接单四个卖点,还有那一句:<br>
效率看得见,实力不吹牛。<br>
这个文案的专业程度,说是一个真的工作室做出来的海报我都信。<br>
还有一个@歸藏做的case,他随手发了一张车的图,没有说是啥车,让GPT-image-2去给他做一个这个车的官网。<br>
然后。。。。。<br>
虽然藏师傅给的是YU7的图不是SU7,这个有失误,但,已经牛逼上天了。<br>
它的世界知识,比Banana还要再强好几个档次。<br>
三. 精准度<br>
第三个核心升级,修改精准度。<br>
这个能力我们之前在Nano Banana上就有体感了,但GPT-Image-2又把它往前推了一大步。<br>
而且不只是改图了,它对你意图的理解,已经可以到一个离谱的程度了。<br>
我举个实际案例。<br>
我们公司之前3D打印了一个桌面的小摆件,拿来直播的时候送粉丝玩的,是Claude Code那个吉祥物的周边,可以夹在显示器边上,头上举着一块小黑板,挺好玩的一个小东西。<br>
我把这张照片丢给GPT-Image-2,说了一句话,帮我生成一张图片,将该产品进行精修,可重新打光,精修优化,白色的背景。<br>
出来的效果,直接就是完美的电商产品抠图主图的水平。<br>
白色背景、柔光打光、产品居中、阴影自然,无敌。<br>
然后我跟他说,帮我做一张这个产品的电商详情页海报。<br>
它直接给我生成了一整张产品详情长图。<br>
不是哥们。<br>
这也太离谱了。。。<br>
你知道我看到这张图的时候在想什么吗?<br>
我在想,我靠,这要我去开个淘宝店。。。<br>
这个详情页,好像可以直接用???<br>
从一张手机随手拍的照片,到一整套电商级别的产品详情页,整个过程我只说了两句话。<br>
两句话。<br>
以前做这种详情页,我们设计师至少要搞两三天,拍产品照、修图、做排版、写文案、做分区详情、做场景图。<br>
现在两句话搞定了。<br>
我都不敢想很多设计师朋友,看到这个会是什么心情。<br>
还有一个纯搞的。<br>
我传了一张电影《闪灵》的经典画面,就是杰克·尼科尔森把脸怼进门缝里那张,然后配上了两张参考图,迪迦奥特曼和一只黄色猫咪。<br>
然后。。。<br>
你就看谁能不笑吧。<br>
然后,还换成了奥特曼和我自己。<br>
给我笑麻了。<br>
还能让这么一群人,在AIFUT大会上圆桌对谈。<br>
GPT-image-2对各类物品的精准度极高。<br>
唯一可惜的就是,对亚洲人的一致性没有那么好。<br>
这个点是有点可惜的。<br>
四. 审美<br>
最后一个,也是我觉得最微妙但最重要的一个升级。<br>
审美。<br>
之前GPT画图就被人非常的诟病,审美上还是差。<br>
其实Banana的审美也有点一般,出来的图跟Midjourney比还是差。<br>
但,GPT-Image-2出来的图,不一样了。<br>
它有品味,审美是真的强。<br>
比如这张,我超级超级超级喜欢的K-POP女团第三张迷你专辑的概念海报。<br>
所有人都穿黑色系的造型,打光是侧逆光加柔焦,整体色调偏冷灰蓝,跟ECLIPSE(日食)的概念完全吻合。<br>
肢体、影子什么的,全是对的。<br>
脸部细节、发丝、饰品的光泽、布料的褶皱质感,每个人还有不同的pose和表情,也都有自己的气质,喜欢。<br>
然后是一张信息量极大的图。<br>
生成一张Mariah Carey 90年代生涯图的中文信息长图。<br>
这张图我必须多说两句,因为它展现的不只是审美,还有信息设计能力。<br>
左边是Mariah Carey的侧面照,配上「她的高音征服了世界,她的音乐定义了一个时代」,右边是1990到1999的年份时间线,每一年都有一段中文描述和代表单曲,旁边配上那一年的专辑封面。<br>
一直到1998,精选集《#1's》,代表单曲My All。<br>
1999,传奇延续。<br>
这张图的信息密度已经非常恐怖了,但更恐怖的是,它好看。<br>
这种大量信息 + 美感 + 准确性的三角组合,说实话,以前只有比较不错的视觉设计师能做到。<br>
还有GPT-Image-2在纯艺术方向上的审美能力。<br>
比如暗黑风格的金克斯。<br>
这张图的呼吸感和节奏相当的顺畅,按这个完成度,要是搁几年前在一些绘画平台上发出来,我觉得能拿到相当多的赞。<br>
还有其他的。<br>
说实话,GPT-image-2吧设计的门槛,又一步拉的极低。<br>
现在,人人真的都可以。<br>
做设计了。<br>
写在最后<br>
这次GPT-image-2对设计行业的冲击。<br>
我觉得比以前所有的时刻,都要大。<br>
因为它好到了一个临界点,好到了让画图这件事本身,变得不再稀缺。<br>
我想起了一篇很多年前的文章。<br>
2015年,知乎上有一个问题,叫「设计师这样的工作,可以做一辈子吗?」<br>
有一个叫大头帮主的人,写了一篇回答。<br>
那一年我刚入行没多久,看完那篇回答之后,我存了下来,反复看了很多遍。<br>
可以说,那篇回答,几乎塑造了我后来十年对设计这个行业的三观。<br>
至今我都奉为设计行业的圣经之一。<br>
里面有一段话,我可以倒背如流。<br>
“不要忘了,设计师,绝对,绝对不是画图员。设计师的最终价值,在于思辨。在于面对纷繁复杂的现实问题时候,切中肯綮,直击要害,找到最优解。你可曾感受过,一个设计师思考力量之强大么?”<br>
2015年看到这段话的时候,我觉得它是在告诉我,设计师应该追求什么。<br>
2026年的今天,GPT-Image-2全量上线的今天,我重新看这段话时,我感觉有一种宿命的轮回。<br>
它变成了一句预言。<br>
GPT-Image-2把画图这件事,彻底民主化了。<br>
任何人,不需要任何设计基础,只要会说话,就能做出80分甚至90分的设计。<br>
这是事实。<br>
但,画图从来都不是设计,画图是设计的执行层。<br>
而设计的核心,从来都是思考,是思辨。<br>
是理解一个商业问题、拆解用户需求、在无数种可能性中找到那个最精准的解法,然后,把它视觉化。<br>
所以回到标题的那个问题。<br>
设计行业完蛋了吗?<br>
画图员的时代,确实结束了。<br>
但设计师的时代,才刚刚开始。<br>
这个世界永远不缺画图的工具。<br>
但永远需要的,是真正的思考者、创造者、和问题的解决者。<br>
这才是我们应该穷尽一生,而努力的方向。<br>
风雨同舟。<br>
愿与诸君共勉。
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 海报 问题 文字 设计师 产品 世界 画图 模型 时候 电商 信息 精准度 详情页 能力 概念 文案 时代 闪灵 红楼梦 代肝 办法 专辑 布料 图片 方向 行业 背景 样式 按钮 无法 白色 个人主页 离谱 朋友 黄色 整体 加柔 奥特曼 饰品 程度 专业 褶皱 光泽 实力 风雨同舟 所有人 纷繁复杂 现实 夫币 案例 马斯克 群友 红色 目标 桌面 大会 亚洲 生涯 时间 绘画 全量 感觉 人民币 实际 连麦 数学试卷 播放按钮 宇宙 摆件 圆桌 一致性 中文信息 年份 平台 上线 宿命 万哈 公司 跑刀 经典 画面 音乐 三角洲 水平 照片 分区 普通人 细节 图主图 吹牛 单曲 代表 范畴 封面 黑色 肢体 就可以看 步入 创造者 美感 |
Verification