GPT-Image-2正式发布!设计师可以告别“古法设计”了

凤凰网科技 ifeng
Document Text 2,201 characters
比Nano Banana更超神的GPT-Image-2,刚刚正式发布!<br> 请注意,这不是截图,这不是截图:<br> 输入提示词“生成一张和GPT的对话截图”,你就能得到:<br> 再看一眼这样的TikTok短视频截图:<br> 这谁还能分得清是真是假?关键是没给参考图,提示词也非常简短:生成一张TikTok的妆教视频截图。<br> 官方给出的产品正式名称是ChatGPT Images 2.0。<br> 自动播放<br> 细看1分49秒的宣传片,会发现这个全新图像生成模型,真的能让很多复杂的工序变成一句话+几秒钟就能搞定的事……<br> 这一回,设计师们真得好好规划一下设计领域的“Vibe Coding”时代了……<br> 实测:简单Prompt,超强效果<br> 官方介绍,ChatGPT Images 2.0是OpenAI首个具备“思考”能力的图像模型。<br> Thinking能力的加入,使得模型可以处理更复杂的任务,在准确性、时效性、一致性和视觉连贯性上有更加强大的表现。<br> 中译中就是,以假乱真不费劲,并且是真&middot;生产力工具。<br> 关于ChatGPT Images 2.0有多乱真,我们再做个简单测试:<br> 1,2,3……<br> 左边是ChatGPT Images 2.0生成,右边是真实页面,第一眼看,你猜对了吗?<br> 尽管在生成文字上还是出现了小瑕疵,但在颠覆设计工作流这方面,不得不说GPT-Image-2在Nano Banana之后,又把历史进度条往后拖了一大截。<br> 下面,我们就进入更真实的生产力场景。<br> 商品广告<br> 量子位最近刚好在迭代周边T恤的版本,直接把这个工作交给ChatGPT Images 2.0,来看看它的完成度如何。<br> 提示词:为科技自媒体量子位设计定制T恤,生成宣传图<br> 图中中文文字不少,但还真一个没出错。并且在没有补充量子位背景信息的情况下,从logo到定位,ChatGPT Images 2.0看样子都自己联网把信息收集到位了。<br> 论文海报<br> 再提升一点复杂度,直接抛给ChatGPT一篇论文,让它解读完生成对应的宣传海报。<br> 这样复杂的长图,ChatGPT Images 2.0同样是在短短一句话的提示词下,一次性成功输出了。<br> 并且有了联网搜索能力的加持,某些场景中,用ChatGPT Images 2.0生成类似信息量丰富的海报、卡片,甚至能省去自己搜集资料这一步。<br> 比如,“生成关于原神玩法的推荐海报,官方设定风格”。<br> 更多玩法<br> 当然,如果再开开脑洞,ChatGPT Images 2.0还可以实现更多离谱玩法。<br> 比如,生成作业……<br> 它可不是乱给答案的,不信你算……<br> (妈妈再也不用担心我的作业不够写)<br> 网友们探索出的玩法还有,生成360度照片:<br> 奥特曼本人也po出了ChatGPT Images 2.0制作的团队故事4格漫画。<br> 这么实测观察下来,官方的总结并非吹牛不打草稿,确实是有那么点“我OpenAI又杀回来了”的气势在:<br> 为图像生成带来了划时代的细致度和保真度。在API中,ChatGPT Images 2.0最高支持生成2K分辨率的图像。<br> 具备更强的多语言理解能力。<br> 支持最宽3:1、最窄1:3的图片比例。<br> 引入更新的世界知识,知识截止时间为2025年12月。<br> 一次提示最多可生成8个输出,并且图中的角色和物体能保持连续性。<br> 另外,在大模型竞技场上,ChatGPT Images 2.0已登顶第一,并且在文本到图像任务中,断层领先第二名Nano Banana 2 240分。<br> 现在, ChatGPT Images 2.0已全量上线到ChatGPT、Codex和OpenAI API中。API具体的价格如下:<br> GPT-Image-2背后研究团队<br> 这次ChatGPT Images 2.0发布,奥特曼身旁又是一水儿东方面孔。<br> 研究团队的Leader是Gabriel Goh(右二),他博士毕业于加州大学戴维斯分校数学专业,2019年从苹果离职后加入OpenAI。<br> 出镜的几位中依然少不了华人。<br> 陈博远,江苏人,OpenAI研究科学家,本科毕业于伯克利,后于麻省理工取得博士学位。<br> 他的研究侧重于世界模型、具身智能和强化学习。而在研究之余,他还是一位热爱珍珠奶茶的大厨。<br> One More Thing,根据陈博远的个人主页信息,GPT图像生成模型团队的人数看上去并不多:<br> 我是为数不多的从事训练GPT图像生成模型的研究者之一。<br> 参考链接:<br> [1]https://openai.com/index/introducing-chatgpt-images-2-0/#textmode<br> [2]https://x.com/OpenAI/status/2046670977145372771<br> “特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。<br> Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”
Metadata
Publisher 凤凰网科技
Site ifeng
Date N/A
CMS Category 媒体报道
Keywords 图像 模型 海报 官方 量子 信息 团队 规划 物体 伯克利 任务 玩法 戴维斯 加州大学 能力 一致性 陈博远 生产力 图图 T恤 广告 场景 商品 总结 吹牛 奥特曼 分校 麻省理工 以假乱真 进度条 网友 语言 比例 全量 珍珠奶茶 中译 历史 作业 理解能力 图片 上线 大厨 视觉 时效性 科学家 本科毕业 一水儿 研究者 准确性 产品 毕业 数学 世界 背景 专业 断层 文字 原神 中文 个人主页 面孔 风格 视频 妆教 打草稿 设计师 领域 角色 连续性 江苏 华人 漫画 连贯性 博士 故事 科技 媒体 领先 情况 侧重于 智能 照片 人数 文本 博士学位 联网 名称 离谱 论文 复杂度 信息量 卡片 版本 效果 链接 工具 竞技场 气势 分辨率