AI 35% high 2026-03-23

Interview with Jia Peng, Founder of Zhijian: The Fastest Embodied AI Unicorn Raises 20 Billion in Half a Year, Only 'All-Round Warriors' Survive

至简贾鹏:最快具身独角兽半年融资20亿,做“六边形战士”才能活

晚点LatePost latepost
This is a media interview with Jia Peng, founder of the embodied AI company Zhijian, discussing his background, the company's rapid fundraising, and his strategic vision for competing in the embodied intelligence sector by building integrated capabilities.
Document Text 14,089 characters
具身智能的竞争,本质是体系的竞争。<br> 文丨 程曼祺<br> 半年融资 20 亿元人民币,创下最快具身智能独角兽记录后,至简动力创始人贾鹏首次亮相,接受《晚点》深度访谈。<br> 至简是当下中国具身投资热潮的一个代表:从 2025 年 7 月正式成立至今,已连续完成 5 轮融资,投资方包括元璟资本、蓝驰创投、红杉中国等一线财务机构,并聚齐了腾讯、阿里两家大型互联网公司。<br> 这家公司也符合中国投资具身智能的一种典型审美——创始团队有量产经验;在被认为与具身关系密切的自动驾驶战场,打过硬仗、打过胜仗;且核心成员之间磨合已久,分工默契。<br> 至简创始人兼 CEO 贾鹏 1987 年出生,创业前是理想汽车智驾技术研发负责人。过去十几年里,他一直是一位战斗着的工程师:2016 年初成为英伟达中国智驾团队一号员工,亲历产业拓荒;5 年后,加入刚开始自研智驾的理想,后来带领团队逆袭。<br> 至简的两位联创,则是贾鹏前上司、理想前 CTO 王凯,以及和贾鹏并肩战斗过五年的理想智驾前量产负责人王佳佳。<br> “贾鹏、王凯、佳佳,是看着自动驾驶起来、下去,再起来的。相信他们的心性。” 至简的首轮投资方,元璟资本管理合伙人刘毅然说。“他们经历了整个自动驾驶从学术研究到产业落地完整链路,有很强的组织力。” 蓝驰创投合伙人曹巍说。<br> 贾鹏将过往经验作为如今创业的推演基点,他在寻找可复制的成功,也思考其中差异。<br> 这包括对终局的设想:<br> 我觉得具身智能会进入每个家庭;但它和智驾、手机不同的是:它的格局会更分散,可能会形成 “分散垄断”。<br> 至简的定位:<br> 我们想做 “六边形战士”。自动驾驶早年也有很多只做算法、模型或数据的供应商,但最后真正活下来的,都是特斯拉、华为这种深度集成型玩家。<br> 数据选择:<br> 至少真正做过量产落地的人都有个共识:合成数据有用,但绝不是主力。<br> 模型设计:<br> 特斯拉 FSD v14 也是个大一统的模型。去年理想在 i8 的量产方案上也做到了一体化。至简也继续坚持做大一统的模型。<br> 以及技术落地和扩张方式:<br> 我目前的想法是先建立扎实的 Infra 能力,然后在几个小场景实现闭环,收敛方法论再扩张。<br> 不是所有人都相信,具身智能会复刻自动驾驶的落地路径。但路是探出来的,在合适时机上路最重要。<br> 贾鹏离开理想时,李想对他说:“此刻做具身创业问题不大,方向、时间都 OK。” 因为 “行业里第一个做的通常会死,但最后成功的一定是第一批”,现在还是第一批。<br> “具身智能一定是人类社会的重大技术方向。” 投资了傅利叶、星动纪元等多家具身智能公司的元璟刘毅然说,“最终大方向都会找到自己的路,哪怕现在有浮躁。”<br> 这次访谈中,贾鹏完整回顾了从英伟达到理想的智驾探索,再到具身智能的创业思考。<br> 至简目前的选择是:六边形战士、体系竞争,同时追求结构简单的模型、产品和组织。贾鹏相信 “大道至简”:“越简单的东西,越容易规模化。”<br> 自动驾驶技术格局已定,是时候做新东西了<br> 晚点:你在 24 年底开始思考具身智能创业,当时看到了什么信号?<br> 贾鹏:首先是当时理想在预研的 VLA 模型和已经量产的 “双系统” 表现出色,验证了数据驱动范式。(注:双系统指理想 2024 年下半年上车推送的智驾系统,快系统部分是一个端到端自动驾驶模型,负责即时反应;慢系统是一个 VLM 多模态模型,提供对更复杂场景的常识性理解。)<br> 但对我触动最大的,还是当时特斯拉正在开发的 FSD v14,我又惊喜、又失望。惊喜是,他们的思路和理想类似,也要把世界模型和 VLA 统一;失望是,理想甚至做得更早,在 24 年就引入了语言能力和长思维链。<br> 那一刻我看到,自动驾驶的技术方法可能已经走到终局了,无非是数据驱动、一体化模型和堆算力。我就想,等做完手头的工作就去做新的事。<br> 晚点:“新的事” 有哪些选项?怎么定位到具身智能的?<br> 贾鹏:当时考虑过几个,但都排除了——大模型已是大公司游戏;AI Agent 门槛低,易陷入红海;AI 硬件更偏 C 端运营逻辑,AI 含量没那么高。<br> 看了一圈,还是具身智能最合适我:终局规模足够大,AI 是核心驱动力,也和我的背景最契合——这是一个软件、硬件、算法必须强结合的领域。这就是我想要的战场。<br> 晚点:有人为创业而创业;有人是因为想做一件事,觉得创业的方式最可能做成。听起来你更偏向前者?<br> 贾鹏:我想找一件能让自己安心做十年、二十年的事,把它做成,做好。<br> 晚点:没有考虑在理想内部继续做具身吗?李想近期说肯定会做人形机器人,马上会拿出成果,这说明内部可能已经做了一段时间了。<br> 贾鹏:是,有个小团队已探索了近一年。但我还是想挑战自己的极限,自己做公司。而且具身在理想是第二曲线,我更希望将所有精力和资源都 all in 具身。<br> 晚点:后来怎么和李想提离职的?他说了什么?<br> 贾鹏:他说此时此刻做具身创业,问题不大,方向、时间都 OK。他的经验是,行业里第一个做的通常会死,但最后成功的一定是第一批。<br> 晚点:为什么现在仍是具身智能创业的第一批?<br> 贾鹏:一个新技术的商业落地都会经过 to A(to academic,做学术研究)到 to B,再到 to C 的阶段。具身智能现在正处于 to A 到 to B 转换的阶段,还有新公司入场空间。这可能会持续到今年底到明年初。<br> 晚点:大语言模型的创业窗口关闭极快,为什么具身智能的早期阶段更长?<br> 贾鹏:大模型有 3 个特点:技术范式相对清楚,早期可以跟随 OpenAI;有现成的海量数据;应用环境的容错率高,即使有幻觉也已经可用到大量场景。<br> 具身智能则完全相反:范式未收敛、先天缺数据、且容错率极低——机器人的任务成功率必须接近 100% 才能工作。所以周期长得多。<br> 晚点:当你自己开始创业后,你从李想身上学到了什么?<br> 贾鹏:一是想哥(李想)经常说的一句话,“技术要服务产品,产品要服务商业”。你做的是商业公司,不是 research lab。二是要在意组织文化,让大家对公司有强烈认同感。否则顺风顺水时都好,一旦遇到困难,人心马上就散了。三是决策权要集中。这是他在汽车之家时期的深刻体会,如果决策权太分散,这家公司是不稳的。<br> 我走之前,他和我着重强调了第一点和第三点。<br> 黄仁勋的脑门温度比别人高一度,英伟达的战略定力来自能抗外压、愿景分享和主业强劲<br> 晚点:你从 2015 年到 2020 年在英伟达工作,是英伟达中国智驾团队的首个员工。你对这家公司和黄仁勋有什么观察?<br> 贾鹏:我加入时,英伟达全球还只有几千人,每年去参加 GTC,老黄都会和全球团队代表一起喝酒。有时也会带我们去他家里,展示一下跑车,分享点儿人生感悟。<br> 老黄的精力实在太旺盛了,他说自己每天四、五点起床开始读邮件或看论文,有次,他突发奇想去测了他和太太的脑门的温度,发现自己的脑门温度比太太高一度,说明他的大脑在高速运转。<br> 晚点:像 GPU 那样发热了。他当时会直接关注智驾这种新业务吗?<br> 贾鹏:会。当时英伟达每人每周要写一封 top five 邮件,分享一周里 5 件最重要的事。老黄每周会抽一些邮件自己回复。我的也被抽到过,聊起中国智驾业务,他很 tough,会问:为什么还没有量产?为什么还在 demo?也会关心具体是芯片、硬件还是软件设计的问题。中国是他重点关注的市场。<br> 晚点:为什么智驾的量产速度不如黄仁勋的预期?<br> 贾鹏:整个智驾行业真正起量是在 2019 年,尤其是新势力开始推进量产之后。所以最开始在英伟达的那 5 年,还处于 to A 到 to B 的阶段,而到 2019 年 Orin 那一代之后,一批车企采用,量马上就起来了。<br> 晚点:那前几年你们在做什么呢?<br> 贾鹏:主要在服务一些 L4 的自动驾驶公司,如小马、文远等,先打高性能上限。<br> 晚点:其实 2015 年前后,一批中国的新势力就陆续成立了,为什么没有更早定位到这批客户?<br> 贾鹏:英伟达当时的思路是以芯片为基础做生态,而非做最终客户交付。在自动驾驶行业早期,对高性能芯片需求最大的就是 Waymo 路线的一批 L4 公司。英伟达因为入场早也有不少前期投入,包括收购高精地图公司 DeepMap,建了很大的规控团队写不同场景的代码等等,这导致后来转方向需要时间。<br> 所以在技术驱动的领域,技术判断很重要。对创业公司尤其如此,你可能没有试第二次的机会。<br> 晚点:英伟达的一个特点就是会提前很多年投入一些早期领域,包括早在 2014 年就推出了专门给机器人用的芯片系列 Jetson,不少新业务多年来的利润和收入占比都很小。英伟达为什么还会持续投入?<br> 贾鹏:老黄的 vision(愿景)和眼光非常长远,战略定力非常强。CUDA 也是做了十年才真正被大规模使用。<br> 支撑这种定力的,首先是他能抗外部压力。做 CUDA 那会儿,股价最低掉到过 7 块。智驾等端侧芯片也是,最初几年的营收占比都只有百分之零点几,我 2020 年离开时也不到 2%,但英伟达照样持续投入。<br> 二是老黄很愿意在公司里分享他的愿景,英伟达是一个纯工程师团队,而工程师都很纯粹,只要他们相信你的分析和逻辑,相信一个漂亮的目标,大家就愿意去做。<br> 最后,英伟达的第一曲线很强,GPU 显卡的收入和利润都很好。<br> 晚点:你在英伟达的核心的成长是什么?<br> 贾鹏:从一个纯算法人员变成了有软硬件综合能力的 “架构师”。这是因为英伟达组织扁平、开放,可以横向看不同团队的代码,从底层硬件优化到传感器驱动,再到上层算法加速,都能学习;当时中国团队的人也少,为了把智驾这套系统做起来,我们从底层系统到顶层应用的开发都得上手干。<br> 所以现在,无论聊芯片、硬件、软件系统还是算法,我都能跟上,这对具身智能创业至关重要。<br> 理想智驾逆袭:“任何人都会掉坑,就看谁能更快爬出来”<br> 晚点:后来为什么在 2020 年时从英伟达离开加入了理想?<br> 贾鹏:我想去一家能让技术真正落地的产品公司。和几家车企聊下来,理想最契合。想哥当时有两个认知很打动我:一是技术必须服务产品,产品必须服务商业;二是行业其他人还在谈模型、算法时,他就说数据闭环最重要。<br> 同时,他认为上半场电动化拉不开差距,真正决定生死的是下半场的智能化,智驾是重中之重。李想的 vision 是先搞定车上的智能,让车变成 “第二个家”;然后等这套技术栈成熟,也可以进入家庭做服务机器人。他所有的逻辑都是服务好 “我的家”。<br> 晚点:2020 年时你们就讨论过家庭机器人?<br> 贾鹏:他已经有这个想法了,所以公司最开始叫 “车和家”。<br> 晚点:理想的智驾自研起步相对晚。24 年《晚点》专访你和郎咸朋的文章就叫《后进生怎么提前交卷了》。你们怎么做到的?<br> 贾鹏:首先是团队核心层的认知要高度一致,就是要做特斯拉模式,这免去了大量内耗。剩下的就是强大的执行力,成为一个战斗团队,之前理想每年基本要封闭开发两三次。<br> 理想智驾团队也没有太多组织架构,都是围绕项目来工作,每开启一个项目就起一个名字,从全员挑人,封闭开发。这让理想速度极快。<br> 晚点:光靠极限执行够吗?智驾是技术竞争,怎么保证方向不跑偏?<br> 贾鹏:这是我想说的另一点,PD(Product Development,交付)和 RD(Research Development,预研)并行。无论仗打得多难,我们一直有一部分人跳出当下的交付去看前沿:将来会发生什么?有没有更好的路?<br> 所以理想最近两年的顶会论文数比其他智驾团队加起来还多,在端到端、VLA、双系统这些方向上很早就有论文产出。等哪一天时机成熟了,觉得要和对手拉开差距了,就会把 RD 成果转入 PD 序列。<br> 晚点:最难的仗是哪几场?<br> 贾鹏:首先是 2021 年自研的第一仗,目标是基于双 J3(地平线征程 3 芯片),在 100 天内量产高速 NOA(自动辅助导航驾驶),代码要从零开始写。当时就是一分钟掰成三分钟用,100 天做出 300 天的效果。<br> 另一个印象深刻的是 2023 年从有图切无图,这场仗体现了前面提到的 RD 的价值。22 年底交付有图方案时,预研小团队已在深圳跑通了无图 demo。虽然当时性能不如有图,但能看出 “这事有戏”,于是第一版有图刚发,我们就立马开始切无图研发。<br> 但切换初期,因为数据还不够多,产品体验有下降,想哥又对产品瑕疵零容忍,他会高频试用最新版本,结果那年春季的战略会直接变成了智能驾驶的批判会。<br> 晚点:压力这么大,你就没有想过干脆走了算了。<br> 贾鹏:我心里还是憋着一口气。我觉得把智驾做成了再走,才是我。<br> 晚点:外界的一种观察是,理想无图转身快,是因为理想有图的积累不如一些更早自研的公司,比如小鹏。<br> 贾鹏:我觉得更多是认知和做事风格,如果觉得一个新方向好,就敢推翻重来、形成合力。<br> 李想说过,“没有任何人可以避开坑,就看谁能更快地爬出坑”;“要掉坑一起掉,要错一起错”,不要一些人掉坑了,另一些人站在坑外说,“你看吧,我就说这不对”。这种团队肯定完蛋。<br> 晚点:你说要在理想把智驾做成再走,何时觉得 “成了”?<br> 贾鹏:25 年初端到端双系统交付时。我衡量 “成” 有三个标准:<br> 一是产品核心指标:日活,智驾里程占比和 NPS(净推荐值)当时都大幅提升。前两个反映用户是否真的在用,第三个是好评度。<br> 二是商业化,理想分 Max 和 Pro 两个平台,Max 配备高级智驾能力,多卖 3 万块。早期 Max 销量占比低,现在已突破 70%。说明用户实打实愿意为智驾掏钱了。<br> 三是行业认可度,现在聊中国智驾谁做得好,大家普遍认为理想是第一梯队。<br> 越简单的东西越能规模化,具身智能会形成 “分散垄断”<br> 晚点:为什么给公司取名至简动力?<br> 贾鹏:越简单的东西,越能规模化。我希望模型结构要简单,减少人为设计,这才能承载大量数据。产品要简单,开盒即用,不需要大量调试和部署。最后组织也要简单,规模小、效率高,以项目驱动。<br> 所以公司中文名是至简动力,英文名是 simplexity robotics,“大道至简”。<br> 晚点:现在市场对具身公司有不同划分:有的长于本体,有的侧重大脑;有的强调商业落地,有的追求智能突破。至简想要做一家怎样的具身智能公司?<br> 贾鹏:我们想做 “六边形战士”。具身大脑、本体、产品、品牌、组织、战略都要强。参考自动驾驶,早年有很多只做算法、模型或数据的供应商,但最后真正活下来的,都是特斯拉、华为这种软硬结合,甚至有自研芯片的深度集成型玩家。<br> 具身也类似,深度集成背后有两个机制:一是数据飞轮,模型与产品应用都做才能形成数据闭环,让二者一起迭代;二是规模效应,销量能摊薄成本,更重要的是能带来更多数据。数据、模型、产品这几个环节层层递进、环环相扣。<br> 这是从特斯拉学到的一个很好的经验:最好的技术公司,一定也是商业和产品做得最好的公司。<br> 晚点:除了深度集成,你对具身终局还有哪些判断?<br> 贾鹏:我觉得具身智能会进入每个家庭,甚至一人一台。我创业还有一个私人动机:我大女儿 2018 年出生,当时中国一年有 1700 万新生儿;到 3 年后小女儿出生时,就只有 900 万新生儿了。等她们长大、老去,社会服务会变得极其昂贵和稀缺。具身智能最大的机会一定是家庭机器人。<br> 但具身和智驾、手机不同的是:它的格局会更分散,可能会形成 “分散垄断”——人形机器人会占据最大一部分市场。但在各种垂直领域和场景里,也有大量比人形高效的机器人形态,几十个垂直领域里可能每个都会有几家头部公司。<br> 晚点:这个行业未来没有水平分工的机会吗?<br> 贾鹏:巨头可能去做生态底座。具身智能本质是 “Physical Agent(物理智能体)”:底层是大公司做的通用模型,上层则是不同具身智能公司用自有数据、具身模型与硬件去落地。<br> 晚点:你们和阿里、腾讯会有类似合作吗?两家公司都投了至简。<br> 贾鹏:我们确实和 Martin(刘炽平)、吴妈(吴泳铭)都聊过。大公司更希望做底层的多模态生成与理解模型。我们以此为基础用自有数据训练出具身基础模型。<br> 晚点:你怎么看具身模型的独立性?之前它石智航创始人陈亦伦告诉我们,具身模型肯定不是大模型上长出一个动作的头,否则这个行业无法独立存在。<br> 贾鹏:我同意简单改造 LLM 或 VLM 做不好具身。VLM 缺乏具身需要的空间理解、推理和生成能力。但大公司也都在探索能力更全面的基础模型,可以为具身行业所用。至于最后的落地应用部分的累活,其实很多巨头不会去做。这就像现在的一些垂类 Agent 和核心 AI Lab 的关系。<br> 一个很好的范本是 Gemini。Gemini 一开始就是原生多模态模型,陆续整合了推理、代码等通用能力。它可以支持 Chatbot、NotebookLM、Nano Banana,乃至 Waymo、Robotics 等不同的智能应用。这是大公司在 Physical Agent 里的角色。<br> 追求 “大一统” 模型,AI 的竞争本质是体系效率的竞争<br> 晚点:沿着出发时的核心判断,至简成立半年多主要做了哪些事?<br> 贾鹏:我把研发分成了三层:<br> 最底层是 Infra(基础设施),包括云端世界模型、关键零部件、本体,以及训练和推理框架;<br> 中间层是具身基础模型;<br> 最上面是应用层,是面向工厂、商超、物流或服务业去满足需求。<br> 前半年我们主要在做 Infra。我相信 AI 竞争的本质是体系效率的竞争,而关键就在于数据处理、训练、推理优化等 Infra 地基。<br> 同时我们也在以 RD 方式做具身基础模型。现在行业里有好几派:双系统、端到端 VLA、世界模型等等。而我们想做 “一体化” 的模型,把这些能力合在一起。<br> 晚点:这是不是有点像 OpenAI 后来把推理模型 o 系列和主模型 GPT 系列合并了?<br> 贾鹏:没错。OpenAI 2022、2023 年时,语言和视觉模态是分开的,有 GPT、也有 CLIP(图像理解)和 DALL-E(图像生成),但后来 GPT-4o(2024 年 5 月发布)实现了原生多模态,去年 10 月发 GPT-5 时又融合了 o 系列的思考能力。<br> 更极致的是 Gemini,它从 1.0 (2023 年底发布)开始就是原生多模态,多模态进、多模态出,到去年的 Gemini 3.0,这种架构的后劲显现了出来。<br> 特斯拉 FSD v14 也是个大一统的模型。它输入是多模态,输出包括 3D 生成,这部分偏 3D 世界模型,还有 CoT 和 action(动作)。<br> 去年理想在 i8 的量产方案上也做到了一体化,整合了快慢系统,理想应该算业内第一个在真实物理环境里实现这套东西的团队。至简也继续坚持做大一统的模型。<br> 晚点:你们准备怎么获得数据?<br> 贾鹏:数据现在逐渐形成共识了。坦白说,25 年夏天刚创业时,我曾担心数据来源太少。但 25 年 7 月前后,我和 Sunday(一家美国具身智能创业公司)聊完发现,他们已经找到了解决方式,就是通过可穿戴式设备去大规模采集多样化的半真机数据。<br> 晚点:用可穿戴设备采集数据,我们近期采访的它石和千寻也都在做这个。<br> 贾鹏:智驾也给我们带来了不一样的数据思考,有 “一头一尾” 两个经验。<br> 头上是数据来源:商业化和数据获取永远是一体的。只有把产品卖出去,才能带来 “真实用户的真实场景数据”,其它数据都无法取代。做过智驾的人最有体会:最后 90% 精力都是在解决最后 10% 的长尾问题。各种奇葩长尾问题,只在真实世界才有,合成的人根本想不出来。<br> 尾上的问题是评估:就是经历了这么多数据迭代后,模型到底变没变好?特斯拉的 “影子模式” 提供了借鉴:不管用户是否购买自动驾驶,特斯拉都标配 FSD 双芯片方案,采数据的同时,还能测试新模型——在真实行驶场景中用额外的算力做对比测试,对比新模型、老模型和人类驾驶行为;当规模足够大时,甚至可以同时在后台测十个版本。<br> 晚点:你认为真实数据是共识,也有银河通用、Hillbot 等公司则更侧重仿真数据和合成数据。后者现在是少数派了吗?<br> 贾鹏:至少真正做过量产落地的人都有个共识:合成数据有用,但绝不是主力。它的价值是 “扩增”,比如在真实场景里抓到一个罕见的 corner case 后,可以通过合成 pipeline 构造 100 条相似数据。<br> 晚点:你的老东家,英伟达黄仁勋也非常推崇合成数据在具身智能领域的作用。怎么看他的技术判断?<br> 贾鹏:英伟达还是一个生态公司,它核心还是聚焦在具身的基座技术,满足所有用户的需求。<br> 不做流水线替代,寻找适合具身智能的 “端到端” 任务<br> 晚点:创业之初你判断,具身智能从 to A 做科研到 to B 商业落地的转换期会在今年底到明年初结束。判断依据是什么?<br> 贾鹏:是因为行业已经能看到,基于 60-70 分的具身基础模型,能把单一任务的成功率做到接近 100%。这是具身智能商业化的条件,因为物理世界任务的容错率极低。<br> 大致的方法行业也有一定共识:用特定任务和场景的数据,在具身基础模型上做 SFT(监督微调)和真机 RL(强化学习)。<br> 需要探索的部分是怎么提升这个过程的效率:比如我迁移到另一个任务时,能不能数十分钟内也实现 100% 的成功率。这考验具身基础模型的泛化能力和整套 Infra 的效率。<br> 晚点:至简会优先选什么任务,什么场景?<br> 贾鹏:有几个标准:一是标准化,未来可以规模化;二是能拿到多样化的数据来迭代模型;三是节拍不能太快。<br> 所以很多朋友想让我们去成熟流水线上替代某个工位,我直接说做不了。因为:一,节拍要求太高,现在的硬件本体抗不住,速度、散热、寿命都是问题;二,容错率太低,流水线一个工位就能卡死整条线,损失巨大;三,动作太单一了,数据不够丰富。<br> 我们想做 “端到端” 的任务。<br> 晚点:什么是端到端的任务?可以举一些例子。<br> 贾鹏:比如从仓库取料、上料、下料、质检、去毛刺,最后再回到仓库,整个过程都交给机器人干。<br> 这样,第一,我们不需要强行把机器人塞进已有的流水线;第二,可以拿一个统一模型,从头到尾迭代自己的 Skill Set(技能集)。第三,更容易标准化,在这家做成后,可以加一点数据在另一个类似场景快速落地。<br> 选任务时,也要和现阶段的技术契合。具身的终局是通用和泛化,但要分阶段实现。此刻大家能做到的是 “通用的移动”+“物品泛化”+“简单通用操作”;移动能力已相对成熟;物品泛化 VLM 比较擅长;操作说实话还没有解决得特别好,但可以做抓拿取放、搬运等简单动作。怎么把这三种能力串在一起,形成产品,能够落地,是我们在思考的事。<br> 晚点:这种端到端的任务多吗?生产场景里,大部分高价值或容易自动化的部分是不是已经自动化了?<br> 贾鹏:远远没有。很多行业的柔性生产、散件生产,传统机器人根本解决不了,因为它们毫无泛化能力。另外,欧美人工成本很高,如商超里 80%-90% 的人工都在理货、补货、整理仓库,这类任务需要移动能力和物体泛化能力,但不需要高难度的灵巧操作,现阶段的具身智能完全可以做。<br> 晚点:你们算过这类端到端任务的市场规模有多大吗?至简靠这一类场景能做到什么规模?<br> 贾鹏:一年几十亿收入。<br> 晚点:当单个公司到这个体量时,具身智能行业会不会像智能智能电动车这样陷入多数公司不盈利的价格战?<br> 贾鹏:几十亿收入和汽车比还是太小了,也就是卖几万台车。电动车的竞争是整个供应链极其成熟和超大规模生产带来的。不过从终局看,如果每个家庭都需要智能机器人,那也会有价格战。<br> 晚点:至简什么时候会考虑进入家庭?或者说,达到什么条件可以开始进入家庭,进入 to C 阶段?<br> 贾鹏:一定是找到了解决安全交互的方法。技术上,先解决物品泛化、通用操作、环境泛化、灵巧手操作,最后是和人交互的泛化。场景上,先工业、物流、商业,最后是家庭。我们还是要敬畏家庭场景,因为任何事故都可能伤害到人。<br> 没有组织架构,全员灵活 “开荒”<br> 晚点:你现在的合伙人是王凯,王佳佳。在元璟、蓝驰等投资人眼中,你们这支团队最核心的资产是 “磨合过、打过硬仗”。你们现在是一个什么样的组织?当年的一些工作方式哪些能用上,哪些要重新调整?<br> 贾鹏:核心有两点。一个是共事多年带来的分工默契,和基于大家各有擅长带来的分工明确。我们几个认识超过 10 年,在理想配合了五年,理想智驾从有图到无图、再到端到端、VLA 的关键交付都是我们一起完成的。我们继续打配合,我负责算法和软件,佳佳负责硬件、产品和交付,凯哥则负责战略管理与资源把控。<br> 需要重新学习的是硬件。智驾领域车是成熟的,做好电子电气架构即可;但具身硬件远未定型。这半年我们迭代了两三版硬件。<br> 晚点:你们现在的硬件形态是怎样的?<br> 贾鹏:目前是半人形:上半身双臂,下半身轮式。在我们现有的应用场景里,这是效率最高、最通用的方式。<br> 这也是一个行业经验,去年 Milan 从 Optimus 离开,也是因为硬件本体团队和算法团队配合不好,因为硬件追求全人形的高自由度,而现阶段模型用不起来这么高自由度的东西。我们还是坚持 Simplexity(至简),根据此刻模型需求定义硬件,避免硬件团队在没有意义的地方 “自嗨”。(注:Milan Kovac,Optimus 前项目负责人,2025 年 7 月离职,曾在特斯拉工作 10 年。)<br> 晚点:马斯克还是坚持做人形,你觉得他们的逻辑是什么?<br> 贾鹏:马斯克看终局,觉得人形最通用,想一步到位。这确实对整个行业有好处:通过极其复杂的硬件构型倒逼供应链。比如我们的战略伙伴绿的谐波,就有一些现成的一体化关节可以直接用。我们在苏州的创新中心就在绿的谐波边上,研发和量产的结合效率非常高。<br> 晚点:你们现在的 80 多人是怎么组织的?<br> 贾鹏:就是 3 波人,直接挂在我们 3 个下面,没有组织架构。我负责算法、基模和推理框架等 Infra,佳佳负责硬件、底层软件和产品,凯哥负责融资、财务、法务。重大决策由我们三个人组成的 “战略委员会” 讨论,最后由我来拍板。<br> 这种扁平化是因为我们现在还处于 “开荒” 阶段。“荒地理论” 是我在理想时 CFO 铁哥(李铁)提过的:这里有很多荒地,你可以跳出自己的专业领域去尝试新东西。这种灵活性不仅能发挥自驱力,还能保持团队的敏锐度。在至简,现在没有一个萝卜一个坑的严密流程,每个人可能要同时 cover 两三件事。<br> 晚点:这种开荒模式,在早期研发阶段之后还能持续吗?<br> 贾鹏:我觉得其实问题不大,我们过去这么多年一直是这么做的。<br> 晚点:团队不会抢活干,导致重复投入?<br> 贾鹏:并没有,工程师的癖好就是尝试新东西。所以不设固定组织架构就是为了让人才流转。我希望在公司创造这种氛围:你首先在原本专业领域要强,同时要有探索新领域的欲望,这种探索和创新意愿是我们筛选人才的标准。<br> 晚点:那在英伟达这种更大的公司呢?那么大的工程师团队也能保持灵活的开荒吗?<br> 贾鹏:这正是英伟达的魅力所在。它本质是一个通用计算平台,工程师可以持续利用底层计算能力去开拓和支持新领域,从游戏、加密货币、数据中心到机器人和自动驾驶,上层应用和新领域的开拓都基于一套知识库和工具链。这是英伟达能持续创新的核心。<br> 晚点:那在智驾和具身智能这种面向具体应用的研发上,你觉得组织形式会有何不同?其实理想从 2020 年开始学华为,就是在更多引入流程和跨研发、产品、商业化的矩阵式配合。当时你们的感受是什么?<br> 贾鹏:最大的变化是沟通成本变多了。以前只需项目内纵向沟通,有共识后直接开干。有了横向配合后,必须跨部门了解:这件事对产品卖车是否有贡献?投入产出比(ROI)怎么算?有了拆解和对齐的额外工作。<br> 晚点:你们在有什么对标的组织吗?<br> 贾鹏:特斯拉的 Auto pilot 团队和 OpenAI 产品团队。他们都是以小几百人体量做出了顶级产品。他们都不讲究复杂的流程和组织划分,每个人 cover 多项任务,快速迭代。这是我初期想要的组织状态。<br> “最爽的,是打从 0 到 1 的逆风局”<br> 晚点:在现在的具身智能行业,有哪些重要,但少被讨论的问题?<br> 贾鹏:硬件还不成熟。业内常说硬件已经差不多了,缺的是数据和算法,但真正做了两代硬件迭代后,会发现坑非常大。<br> 最典型的问题是一致性:同一家供应商生产的两个同型号的本体,把 A 的动作数据录下来让 B 运行,行为都不同。其次,可靠性也极低,行业内硬件返修率几乎是 100%,很少有能持续稳定工作而不出故障的。机器人硬件还处于 “手搓” 阶段,缺乏类似车规级那样的工业化标准。<br> 晚点:这种局面什么时候会改变?<br> 贾鹏:预期到 2026 年底,硬件的一致性和稳定性会提升很多。行业也有很多进展,比如今年春晚上的宇树机器人表演,已能做到多台机器人的动作高度一致、节拍精准。<br> 晚点:你觉得具身智能接下来会出现类似自动驾驶那样的泡沫和低谷吗?<br> 贾鹏:行业总会经历 “百家争鸣” 的阶段,而这往往就是泡沫的开始。<br> 晚点:那不就是现在吗?<br> 贾鹏:可能就是这一两年。<br> 晚点:至简要提前做什么准备?<br> 贾鹏:具身的量产落地是个体系化作战的过程,必须成为 “六边形战士”,要建立全栈能力,不能有短板。组织要有战斗力,能像特种兵一样打硬仗。<br> 最终还是拼一个体系能力,任何单点长板都不足以支撑一家具身公司持续经营。<br> 晚点:你觉得 2026 年行业或公司比较确定的事情是什么?<br> 贾鹏:确定的是技术范式和数据路径会逐渐收敛。大家在模型和数据闭环上的思路会趋同,不再有巨大差异。<br> 晚点:那不确定的事呢?<br> 贾鹏:还是硬件。<br> 晚点:创业半年多,从技术 leader 到 CEO,你个人最大的变化是什么?<br> 贾鹏:最大的提升是战略观。即思考 “要什么” 和 “不要什么”。初创公司的诱惑很多,我必须想清楚边界。比如我决定现阶段不碰灵巧手、不进家庭,把精力花在刀刃上。<br> 晚点:你觉得至简和你自己目前需要提升的地方还有哪些?<br> 贾鹏:我们比较谨慎,偏稳健。我目前的想法是先建立扎实的 Infra 能力,然后在几个小场景实现闭环,收敛方法论再扩张。<br> 但时间不等人,这是一个 bet,我也在持续思考,可能也会调整。<br> 晚点:你现在最担心什么?<br> 贾鹏:头部公司上市后的虹吸效应。他们上市后融资效率更高、确定性更强,对部分人才的吸引力会变大,这都带来竞争压力。<br> 晚点:感性地总结一下,创业这七八个月是什么体验?<br> 贾鹏:说实话,蛮爽的。<br> 因为我过去的职业生涯,最爽的是一直是打从 0 到 1 的逆风局,在不被看好时把东西做成,所以这半年多确实 “蛮爽”。<br> 晚点:你希望至简动力两三年后达到什么状态?<br> 贾鹏:像 2020 年的特斯拉。当行业 PMF(产品市场契合点)跑通时,我们的底线是 Infra(基建)和技术储备能立刻跟上;上限是我们自己就是那个范式的创造者。<br> 题图来源:至简<br> 特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。<br> Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.<br> var loadMessageError2 = function () {<br> // message加载失败降级到nginx,产品可以在load事件重新初始化<br> var cdnPath = 'https://dl.reg.163.com/webzj/ngx/message.js';<br> var script = document.createElement('script');<br> script.src = cdnPath;<br> document.body.appendChild(script);<br> }<br> var loadMessageError1 = function () {<br> // message加载失败降级备份cdn域名,产品可以在load事件重新初始化<br> var cdnPath = 'https://webzj.netstatic.net/webzj_cdn101/message4.js';<br> var script = document.createElement('script');<br> script.src = cdnPath;<br> script.onerror = loadMessageError2<br> document.body.appendChild(script);<br> } <br> //初始化反作弊<br> var wm = null;<br> // 只需初始化一次<br> initWatchman({<br> productNumber: 'YD00157343455660',<br> onload: function (instance) {<br> wm = instance<br> }<br> });<br> var isShowComments = true, tieChannel = "";<br> (function () {<br> if (window.isShowComments === undefined) {<br> window.isShowComments = true;<br> }<br> var config = {<br> "productKey": "a2869674571f77b5a0867c3d71db5856",<br> "docId": "KON16UTG0531M1CO", //"data.article.postid", "FNMG85GQ0514HDQI"<br> "target": document.getElementById("tie"),<br> "operators": ["up", "down", "reply", "share"],<br> "isShowComments": isShowComments, //是否显示帖子列表<br> "hotSize": 3, //热门跟贴列表 展示3 条<br> "newSize": 2, //最新跟贴列表 展示 10 条<br> "showPaging": false, //显示分页栏<br> "submitType": "commentPage" //新发帖子的展现形式:停留在当前页面(currentPage) | 跳转到跟贴详情页(commentPage)<br> };<br> Tie.init(config, function(data) {});<br> })();<br> /阅读下一篇/<br> 返回网易首页<br> 下载网易新闻客户端
Topics
artificial intelligence venture capital autonomous driving
Metadata
Publisher 晚点LatePost
Site latepost
Date 2026-03-23
Category report
Policy Area 人工智能
CMS Category 媒体报道
Keywords 贾鹏,晚点,李想,王凯,黄仁勋,独角兽,埃隆_马斯克