Document Text
3,865 characters
摘要:<br>
没有AI水印,完全可以“以假乱真”。当技术的保护网尚未织好,风暴已然来临时,我们还能相信什么?<br>
凤凰网科技 出品<br>
作者|赵子坤、尚志芳<br>
编辑|董雨晴<br>
像素级复刻,来了<br>
4月21日,GPT-Image-2上线,我们实测后得出结论——中文互联网“眼见为真”的信任,被彻底打破了。<br>
不同于早期AI生成图片“一眼假”的突兀感,这个新模型对真实世界的复刻,达到了像素级别。<br>
而且,不需要复杂的提示词,只需要简单的指令,就可以生成任何你想要的社交软件截图。<br>
提示词:生成一张罗永浩抖音直播截图画面,包括主播、评论、互动数据等;生成一张微信朋友圈截图画面,分享旅游打卡,带图片带文案,带互动点赞评论<br>
“仿造”一个小红书百万粉丝账号,手拿把掐。甚至AI会自动设计“天生我材必有用,千金散尽还复来”和明月高悬的账号背景。<br>
不过,还是有微微漏洞——按出生日期推断,李白应是浪漫的双鱼座。<br>
以及,按照现有的小红书生态,百万级账号和笔记点赞十万的场景应该很难出现——也许是AI按照人物名气的“合理推算”?<br>
不只是抖音、朋友圈、小红书等社交账号,“新闻”也是可以被轻易伪造的。<br>
这里的给出提示词仅是:生成一张微博热搜截图,其中一条消息是知名演员官宣去送快递。不知为何AI自动提取了张颂文……<br>
可以看出,生成的热搜词条非常丰富且还原:有职场话题、比赛成绩、生活常识、企业热点、娱乐新闻……<br>
不过细看,应该是因为GPT的“记忆”(静态知识库)只到2025年年底,生成的词条信息时间较为陈旧,都是2024年事件。<br>
而且,于2024年9月10日苹果秋季发布会上公布价格iPhone16,显然并不是在夏天(“莎头”组合巴黎奥运会夺冠时间倒是在7月的夏天。)。<br>
不过,在当年五月天巡演官宣时间中,成都站确实在9月9日官宣——时间上也能和iPhone16“圆”上。<br>
除了我们常用的社交软件,一些早被互联网“收录”的人脸也能生成逼真画面。<br>
这里的提示词是:生成一张几个科技大佬线下团建吃饭的照片,要有正脸。<br>
哎,扎克伯克怎么混进去了?<br>
那再试一次,同样的提示词。<br>
这下更“合理”了——中国互联网的半壁江山,悉数齐聚。<br>
一个小插曲是,当把这两张大佬聚餐图再喂给豆包,让判断出席人物时候,豆包得出了这样的结论:<br>
AI也能骗过AI,可能是核心提取了关键人物:马云和扎克伯克的关键会面。<br>
不过,不光是我们的本土AI“被骗”。有测试显示,包括Gemini在内的主流AI系统都难以识别GPT-Image-2生成的UI伪造图像。<br>
不光是国内,海外名人更是“重灾区”。不过,目前测试结果是,无法“指定”某个具体人物,只能“虚指”。<br>
图源|凤凰网科技,真实截图<br>
又比如,“明星”不可以,但“演员”可以。<br>
提示词:生成一张实拍画面,国外知名演员在菜市场买菜砍价,跟人吵起来<br>
我们的测试感受也从“惊喜”:生成速度快,不需要“排队”;操作极简,简单一句话指令都能生成的逼真自然。<br>
再到“恐慌”——因为没有水印,不细看真容易被骗。<br>
于是又实验了几个极端场景,看是否存在安全漏洞,容易被有心之人利用。<br>
比如生成一张身份证照片、银行转账截图、医疗结算单……<br>
GPT都还无法生成。<br>
但,如果去掉具体细节,指令范围大一点,不聚焦某一具体信息,依旧能够执行。<br>
人物的形态、毛发,甚至脸上毛孔都清晰可见。身份证上的人脸也能对得上。生日日期和身份证号完美匹配,310115也正是浦东新区的通用代码。<br>
虽然模型对“精确伪造特定人物身份证”有拒绝机制,但对生成“虚构但逼真的证件模板”的约束很弱,这为套用模板进行诈骗、伪造文书等行为留下了空间。<br>
“伪造”聊天记录,也是真实感极强——针对个人,尤其是信息辨别能力差的老人,这种图片完全能够骗过。<br>
生成出来的“模仿”手机后置镜头的拍摄,能把反光、手机裂痕都清晰还原。<br>
骗家长说,自己在埋头苦学,也有了“证据”。<br>
指令:帮我生成一个学生在课堂上偷拍老师讲课的实拍画面<br>
更是可以轻易“伪造”不在场证明,截图、照片,以后也许都没办法直接当作证据了。<br>
“你那天晚上在哪里”,“在看电影呀”(PS:当年《奥本海默》在国内公映时间正是8月30日)<br>
给企业“伪造”后台交易数据,AI也能手到擒来。<br>
为了不进一步“教学”,我们就不放更多测试成果了。<br>
技术发展太快,保护网跟不上了<br>
四年前,当文生图工具 Midjourney 爆火时,在专业领域还能掀起“人类 PK AI”孰优孰劣的激情讨论,和AI“抄袭”的声讨。<br>
彼时,大家还在庆幸AI没有“灵魂”,生成的图片僵硬、无细节,风格化不强,“一眼假”的效果也让不少制图领域的专业人士浅松了一口气。<br>
但随着技术进步,质疑、对抗的声音愈发微弱。从2022年的Midjourney、2023年的stable diffusion,到2025年的kling veo3,再到2026年Seedance、GPT-Image-2,模型迭代以无法阻挡的趋势滚滚向前。<br>
如今,生图模型的进化速度,已经没给人类留出太多适应时间了。<br>
GPT-Image-1从上线到 1.5,用了8个月。1.5 到 2,只用了4个月——更新时间缩短一半不说,每一代都在解决上一代的核心短板,并打开了新的可能性。<br>
2026 年初还刚凭借 Nano Banana Pro 确立行业地位的 Google,被迅猛追赶,倍感压力。早期测试报告显示,GPT-Image-2在真实感、文字渲染和世界知识三个维度上同时超越了 Nano Banana Pro,这种三连胜并不常见。<br>
在社交平台上,有不少尝鲜用户晒出自己生成的“千禧年风”照片,被不知情的围观者质疑:“这是真实拍的吧?”<br>
图源|小红书<br>
OpenAI是怎么做到的?<br>
相比于上一代模型,此次更新,最核心的代际跃迁是首次引入“思维链”推理能力。通过内置的推理架构,它能在生成前自动分解复杂指令、规划空间布局、验证数字逻辑并搜索实时信息。<br>
与此呼应,GPT-Image-2分为两种运行模式:一是面向所有用户开放的即时(Instant)模式,强调生成速度;二是仅对付费用户开放的思考(Thinking)模式,该模式下模型会执行更复杂的逻辑推演和多步骤规划。<br>
而且,GPT-Image-2解决了长期以来非拉丁文字渲染的痛点。无论是中文、日文、还是韩文,能够精准渲染极小字号文本、书法字体,可一次性生成含密集文字的海报、多格漫画、数据图表,文字位置和格式零差错。<br>
在2026年4月的Image Arena权威评测中,GPT-Image-2以1512分登顶,领先第二名242分,在文字渲染、指令遵循、真实感、风格控制四大核心维度均断层领先。<br>
文字渲染的进步,意味着生成信息图、海报、产品包装、排版复杂的图表,都变得更可靠了,也意味着能够能够切入更广阔的商业领域。<br>
图源|小红书<br>
GPT-Image-2能生成与真实软件界面极为相似的图像,包括浏览器窗口、移动端应用界面、数据可视化图表,保真度是上一代产品无法比拟的。也就是说,它不仅能够制作信息图表、科学海报、教学指南、漫画分镜等场景,在UI界面原型与电商编目方面同样潜力巨大。<br>
目前OpenAI的API已支持2K分辨率输出,4K模式正在测试。可以预见的,AI生成的图片,未来会更清晰,也就更加“真实”。<br>
从前期测试可看出,这款“史上最强”的模型,对于身份证等高度敏感、涉及精确个人信息的场景,模型有拒绝机制;但对于泛化的、不指向具体真实人物的伪造场景,约束较弱,而这正是风险所在。<br>
随着真实度提高,“造假”成本也被无限下放,只能靠人类为数不多的记忆经验来“鉴AI”。尤其是,目前GPT生成图片并无水印,提高了辨别难度。<br>
图源|小红书<br>
当前,AI检测技术的迭代速度明显滞后于生成技术。<br>
OpenAI确实为GPT-Image-2部署了多层安全防护。根据其技术部署,GPT-Image-2沿用了OpenAI的C2PA内容凭证体系,在文件元数据层嵌入带数字签名的来源信息,用户可通过Content Credentials验证图片是否由该模型生成。在面向企业级用户的Microsoft Foundry部署中,微软进一步将OpenAI的图像生成安全缓解措施与Azure AI内容安全相结合,加入了针对敏感内容的过滤器和分类器。<br>
然而,这套护栏存在明显短板。C2PA元数据在用户对图片进行截图、转发至社交平台、或被平台压缩处理后,会直接丢失,凭证随之失效。换言之,C2PA能在“源头”自证清白,却无法阻止图片在传播链条中被“洗白”。C2PA元数据在截图、转发或压缩后容易丢失。对于普通用户而言,收到一张微信截图或朋友圈图片时,元数据或许早已不复存在,辨别真伪的窗口也随之关闭。<br>
从GPT-Image-1上线到1.5版本用了8个月,1.5到2只用了4个月——技术迭代在不断加速。而与之相对,欧盟AI法案的透明度条款更是从立法到生效横跨了超过两年,中国《人工智能生成合成内容标识办法》从酝酿到施行走了一年多。安全护栏能否有效拦截恶意使用,取决于普通用户会不会被截图后的AI假图欺骗,而这恰恰是当前护栏最薄弱的环节。检测技术能否追平生成能力的代际差距也仍是一个巨大的未知数。而法规的落地效果,“持证上岗”在纸面与实操之间,还有一段相当艰难的距离。<br>
当AI生图的进化已经精确到毛孔和反光,保护网的每一根线,都还太稀疏了。在这场速度不对等的竞赛中,每一位普通用户,或许都需要先学会一件事:对屏幕上的一切,多留一分警惕。
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 数据 模型 信息 图片 技术 身份证 人物 文字 小红书 账号 照片 海报 图表 界面 内容 核心 图源 指令 社交 能力 模板 场景 中文 时间 科技 领域 互联网 用户 记忆 效果 漫画 手机 发布会 出生日期 无法 领先 维度 模式 法规 代际 面向 证件 克伯克 细节 文本 字号 速度 凤凰网 银行 图像 真实感 像素 编目 电商 半壁江山 企业 成绩 规划 朋友圈 空间布局 逻辑 课堂 董雨晴 科学 编辑 纸面 教学 指南 毛孔 新闻 保真度 断层 平生 生图 豆包 出品 中国 毛发 作者 测试报告 透明度 重灾区 菜市场 文生 行业 版本 压力 法案 名人 买菜 工具 地位 上线 尚志 倍感 条款 精准 制图 镜头 后置 |
Verification