Before the DeepSeek V4 Update, Some Issues Need to Be Clarified

Full text · 原文 2,423 字

摘要： V4是不是DeepSeek的分水岭？ 凤凰网科技出品 作者｜Dale 编辑｜董雨晴 4月10日，据多位知情人士向《创智记》透露，DeepSeek创始人梁文锋在内部沟通中首次明确了V4的发布节奏——备受期待的新一代旗舰大模型DeepSeek V4计划于4月下旬正式与公众见面。 凤凰网科技就此消息向DeepSeek方面询问，截至发稿未取得回应。 此前，DeepSeek刚刚完成版本更新。首次在模式上进行分层，推出了快速和专家两个模式。在点击开始入口处，原本“体验DeepSeekV3.2”的字样也消失不见了。 优等生DeepSeek的烦恼 DeepSeek V4的扑朔，建立在一个复杂的背景之上。 2025年初，R1的发布，曾经是国内大模型创企挥之不去的“阴影”。用了半年时间，这些曾经的明星企业才凭借新的旗舰模型回到公众视野，或上市、或开启新一轮融资。 在成名前，梁文锋曾与少部分VC进行过会谈，但据当时与其有过接触的人士向凤凰网科技表述，梁文锋的本意也不是融资，而是看看机构的风格。 《晚点LatePost》也在报道中写道，梁文锋曾在会面中提出类似OpenAI与微软投资协议的回报上限条款，但无机构接受，此后再无投资人会面。 2025年成名后，DeepSeek的风格是更加对内收敛,一些原本在社交媒体更新的员工账号开始停更。 据《晚点LatePost》报道，DeepSeek不加班，他们不打卡、没有明确的绩效考核，平日多数成员会在下午6点至7点左右离开公司。 但随着智谱、MiniMax等公司上市后激增的市值，DeepSeek的估值问题正成为内部压力点。DeepSeek员工对手中未定价的期权有了更多疑问，梁文锋近期开始考虑公司估值的问题。 除此之外，从2025年秋天起，梁文锋开始更多提及“产品化和商业化”。在公开的招聘信息中，官方HR也表述有产品、设计、数据百晓生等岗位开放。甚至是职能岗也在扩充, 早在2025年11月，DeepSeek还开放过行政招聘，据相关人士表述“是因为团队大了，需要更多的行政伙伴”。 变化之下，可能让拖延数月的V4存在诸多变数，但其掀起的热潮不会迁移。 OpenRouter平台数据显示，2026 年 2 月，中国大模型在 OpenRouter 上周调用量首次超过美国模型，这一态势一直持续到3月。本周，排在前五位的模型，依旧有三个来自中国，分别是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。 毫无疑问，DeepSeek V4的到来，有望延续这份优势。 V4算不算DeepSeek的分水岭？ 把R1和V4放在一起看，这个变化的轮廓会变得更清晰。 R1的突破是范式性的——它在学术层面开创了“纯强化学习激发推理能力”的新路径，论文登上Nature封面，以586万美元的成本实现了对标GPT-4的性能，彻底改变了全球对中国AI模型的认知。 Hugging Face在“DeepSeek时刻一周年”回顾中指出，R1“降低了技术与应用门槛，不仅是中国AI发展的转折点，更在全球范围内引发了开源模式的深刻变革”。 V4的战略意义截然不同。它不再回答“中国能不能做出世界级模型”，而是在回答两个更具体的问题：“中国AI能不能在算力封锁下持续进化”，以及“大模型能不能变成能赚钱的企业级产品”。 所以，V4算不算DeepSeek的分水岭？ 如果说R1是DeepSeek在“纯推理”路线上站住脚、打响全球名声的第一枪，那么V4就是DeepSeek证明自己不只是“技术奇才”、而是能在中国AI产业生态中找到不可替代位置的标志性产品。 R1的意义在于“做了一件别人觉得中国公司做不了的事”。V4的意义在于“在一个被封锁的环境中，自己铺了一条能走下去的路”。 与此同时，站在学术界，新的风向也在产生。DeepSeek的使命一度是探索未知，追求AGI。 去年底，姚顺雨、林俊旸、杨植麟、唐杰等人在清华同台，探讨的是底层范式的话题。在海外，Yann LeCun言称LLM是“死胡同”，Jim Fan说“视觉是连接大脑、运动系统和物理世界的最高带宽通道”。甚至一些观点认为，追求AGI的重任或许该落在世界模型身上了。 敏感的VC，是最早嗅到市场风向的人。颇为巧合的是，代表世界模型阵营的李飞飞和杨立昆，均刚刚完成10亿美元级别的新融资，国内代表生数科技4月10日也刚刚官宣获得了A++轮融资，融资金额近20亿人民币。 绘图｜DeepSeek 就目前披露的信息而言，DeepSeek选择的仍然是基于LLM架构的优化和工程化落地。而V4最核心的突破是集中在这三件事上：万亿参数MoE架构、原生多模态能力和国产芯片适配。 对于DeepSeek来说，在算力和资金都存在约束的情况下，把资源投向架构效率和国产化适配，比追逐一个距离产品化还很遥远的范式，更务实、更符合它“少花钱办大事”的底色。 值得注意的是，DeepSeek并非完全没有多模态的积累。此前开源的DeepSeek-OCR系列已经展示了将视觉作为文本压缩媒介的探索，通过将文本以图片方式输入，极大减少token消耗。 但这些探索的方向仍然是“优化文本模型的效率和成本”，而不是“构建对物理世界的理解和预测”。 如果拉长时间线来看，DeepSeek的这条“分水岭”可能还有更深的一层含义——它不是一条岔路，而是一道选择题：在中国AI产业的现实土壤上，是追随“世界模型”的范式革命，还是在现有架构上把工程优化和自主可控做到极致？ 当然，如果DeepSeek未来真的在视觉和空间推理上投入更多资源，以它的架构创新能力，切入“轻量级世界模型”领域并非不可能。但在当下，V4的任务很清楚：在中国AI产业最需要的方向上，交出一份能打的答卷。 这个选择是否成立，不需要等太久。4月下旬V4正式发布后，市场的反馈会给出最诚实的答案。

Site key	ifeng
Policy area	人工智能
Category	report
CMS	媒体报道
AI score	0.25

Before the DeepSeek V4 Update, Some Issues Need to Be Clarified

DeepSeek更新“前夜”，有些问题得提前理一理