AI 25%

DeepSeek更新“前夜”,有些问题得提前理一理

凤凰网科技 ifeng
Document Text 2,423 characters
摘要:<br> V4是不是DeepSeek的分水岭?<br> 凤凰网科技 出品<br> 作者|Dale<br> 编辑|董雨晴<br> 4月10日,据多位知情人士向《创智记》透露,DeepSeek创始人梁文锋在内部沟通中首次明确了V4的发布节奏——备受期待的新一代旗舰大模型DeepSeek V4计划于4月下旬正式与公众见面。<br> 凤凰网科技就此消息向DeepSeek方面询问,截至发稿未取得回应。<br> 此前,DeepSeek刚刚完成版本更新。首次在模式上进行分层,推出了快速和专家两个模式。在点击开始入口处,原本“体验DeepSeekV3.2”的字样也消失不见了。<br> 优等生DeepSeek的烦恼<br> DeepSeek V4的扑朔,建立在一个复杂的背景之上。<br> 2025年初,R1的发布,曾经是国内大模型创企挥之不去的“阴影”。用了半年时间,这些曾经的明星企业才凭借新的旗舰模型回到公众视野,或上市、或开启新一轮融资。<br> 在成名前,梁文锋曾与少部分VC进行过会谈,但据当时与其有过接触的人士向凤凰网科技表述,梁文锋的本意也不是融资,而是看看机构的风格。<br> 《晚点LatePost》也在报道中写道,梁文锋曾在会面中提出类似OpenAI与微软投资协议的回报上限条款,但无机构接受,此后再无投资人会面。<br> 2025年成名后,DeepSeek的风格是更加对内收敛,一些原本在社交媒体更新的员工账号开始停更。<br> 据《晚点LatePost》报道,DeepSeek不加班,他们不打卡、没有明确的绩效考核,平日多数成员会在下午6点至7点左右离开公司。<br> 但随着智谱、MiniMax等公司上市后激增的市值,DeepSeek的估值问题正成为内部压力点。DeepSeek员工对手中未定价的期权有了更多疑问,梁文锋近期开始考虑公司估值的问题。<br> 除此之外,从2025年秋天起,梁文锋开始更多提及“产品化和商业化”。在公开的招聘信息中,官方HR也表述有产品、设计、数据百晓生等岗位开放。甚至是职能岗也在扩充, 早在2025年11月,DeepSeek还开放过行政招聘,据相关人士表述“是因为团队大了,需要更多的行政伙伴”。<br> 变化之下,可能让拖延数月的V4存在诸多变数,但其掀起的热潮不会迁移。<br> OpenRouter平台数据显示,2026 年 2 月,中国大模型在 OpenRouter 上周调用量首次超过美国模型,这一态势一直持续到3月。本周,排在前五位的模型,依旧有三个来自中国,分别是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。<br> 毫无疑问,DeepSeek V4的到来,有望延续这份优势。<br> V4算不算DeepSeek的分水岭?<br> 把R1和V4放在一起看,这个变化的轮廓会变得更清晰。<br> R1的突破是范式性的——它在学术层面开创了“纯强化学习激发推理能力”的新路径,论文登上Nature封面,以586万美元的成本实现了对标GPT-4的性能,彻底改变了全球对中国AI模型的认知。<br> Hugging Face在“DeepSeek时刻一周年”回顾中指出,R1“降低了技术与应用门槛,不仅是中国AI发展的转折点,更在全球范围内引发了开源模式的深刻变革”。<br> V4的战略意义截然不同。它不再回答“中国能不能做出世界级模型”,而是在回答两个更具体的问题:“中国AI能不能在算力封锁下持续进化”,以及“大模型能不能变成能赚钱的企业级产品”。<br> 所以,V4算不算DeepSeek的分水岭?<br> 如果说R1是DeepSeek在“纯推理”路线上站住脚、打响全球名声的第一枪,那么V4就是DeepSeek证明自己不只是“技术奇才”、而是能在中国AI产业生态中找到不可替代位置的标志性产品。<br> R1的意义在于“做了一件别人觉得中国公司做不了的事”。V4的意义在于“在一个被封锁的环境中,自己铺了一条能走下去的路”。<br> 与此同时,站在学术界,新的风向也在产生。DeepSeek的使命一度是探索未知,追求AGI。<br> 去年底,姚顺雨、林俊旸、杨植麟、唐杰等人在清华同台,探讨的是底层范式的话题。在海外,Yann LeCun言称LLM是“死胡同”,Jim Fan说“视觉是连接大脑、运动系统和物理世界的最高带宽通道”。甚至一些观点认为,追求AGI的重任或许该落在世界模型身上了。<br> 敏感的VC,是最早嗅到市场风向的人。颇为巧合的是,代表世界模型阵营的李飞飞和杨立昆,均刚刚完成10亿美元级别的新融资,国内代表生数科技4月10日也刚刚官宣获得了A++轮融资,融资金额近20亿人民币。<br> 绘图|DeepSeek<br> 就目前披露的信息而言,DeepSeek选择的仍然是基于LLM架构的优化和工程化落地。而V4最核心的突破是集中在这三件事上:万亿参数MoE架构、原生多模态能力和国产芯片适配。<br> 对于DeepSeek来说,在算力和资金都存在约束的情况下,把资源投向架构效率和国产化适配,比追逐一个距离产品化还很遥远的范式,更务实、更符合它“少花钱办大事”的底色。<br> 值得注意的是,DeepSeek并非完全没有多模态的积累。此前开源的DeepSeek-OCR系列已经展示了将视觉作为文本压缩媒介的探索,通过将文本以图片方式输入,极大减少token消耗。<br> 但这些探索的方向仍然是“优化文本模型的效率和成本”,而不是“构建对物理世界的理解和预测”。<br> 如果拉长时间线来看,DeepSeek的这条“分水岭”可能还有更深的一层含义——它不是一条岔路,而是一道选择题:在中国AI产业的现实土壤上,是追随“世界模型”的范式革命,还是在现有架构上把工程优化和自主可控做到极致?<br> 当然,如果DeepSeek未来真的在视觉和空间推理上投入更多资源,以它的架构创新能力,切入“轻量级世界模型”领域并非不可能。但在当下,V4的任务很清楚:在中国AI产业最需要的方向上,交出一份能打的答卷。<br> 这个选择是否成立,不需要等太久。4月下旬V4正式发布后,市场的反馈会给出最诚实的答案。
Metadata
Publisher 凤凰网科技
Site ifeng
Date N/A
CMS Category 媒体报道
Keywords 模型 中国 科技 架构 世界 凤凰网 全球 产品 风向 问题 产业 效率 公司 文本 数据 员工 模式 公众 能力 人士 产品化 人民币 大事 梁文锋 模态 原本 视觉 上市 媒体 清华 算力 唐杰 封锁 风格 条款 资源 机构 阵营 原生 代表 范式 投向 站住脚 替代 出品 作者 估值 消失 明星 绩效考核 官方 行政 层面 截然不同 社交 字样 企业 成员 信息 伙伴 学术 战略意义 论文 技术 李飞飞 视野 编辑 开源 旗舰 芯片 生态 国产 定价 消息 百晓生 彻底改变 岗位 现实 系统 路径 国产化 会面 工程化 标志性 范围 选择题 商业化 金额 绘图 距离 花钱 底色 门槛 入口处 物理 体验 理一理 见面 账号 资金