interview AI 36% 2026-01-27

Conversation with the founder of DEEPX: When AI chips move from the cloud to the real physical world

对话DEEPX创始人:当AI芯片从云端走向现实物理世界

观察者网 guancha
Document Text 2,320 characters
2026年1月,拉斯维加斯的CES展会刚刚落幕,在展会上一家名为DEEPX的韩国AI芯片公司连续第二年被评为“Must-See Booth”。 <br> 继而,1月22日,在上海举行的“百度文心Moment”大会上,DEEPX创始人兼CEO 金錄元(Lokwon Kim)正在向中国开发者详述着一个不同寻常的演示:两块芯片上各放置一块黄油,运行相同的AI负载——几分钟后,竞品芯片上的黄油完全融化,而DEEPX的芯片上,黄油纹丝不动。 <br> 这个看似简单的“黄油测试”,背后隐藏着AI产业正在发生的一场深刻变革。当全球科技巨头们还在为数据中心投入数万亿美元,竞相建造更大规模的GPU集群时,DEEPX却选择了一条截然不同的道路:让AI从云端走下来,真正嵌入到物理世界的每一个角落。 <br> 在百度大会的间隙,观察者网·心智观察所与金錄元进行了一次深度对话。这位曾在Apple领导A11 Bionic芯片开发、在IBM T.J. Watson研究中心从事AI处理器研究的工程师,谈起AI时却像一位哲学家:“我曾读到一句话——人类的苦难源于缺乏智慧。2015年,我意识到AI可能是人类克服缺乏智慧的终极解决方案。”正是这个信念,让他在2018年创立了DEEPX,并将其定位为“帮助人类向真正智能文明演进的公司”。 <br> DEEPX 创始人金錄元 <br> 从“不可能”到“必然” <br> 当被问及DEEPX的核心技术突破时,金錄元并没有急于展示复杂的架构图或性能参数,而是从一个更本质的问题切入:“为什么今天的生成式AI只能存在于数据中心?” <br> 答案显而易见:功耗、散热、成本。一块主流GPU运行AI推理需要消耗300瓦以上的功率,相当于三台家用电脑同时运行。这意味着你需要庞大的散热系统、稳定的电力供应,以及高昂的运营成本。“这种架构注定了AI只能是‘远程智能’——你必须通过云端访问它,承受延迟,支付数据传输费用,并且永远依赖网络连接。”金錄元向心智观察所阐述。 <br> DEEPX的DX-M2芯片打破了这个魔咒。它能在5瓦功耗下运行200亿到1000亿参数的大语言模型,相当于一个手机充电器的功率。“5瓦不只是一个数字,”金錄元强调,“它是物理可行性的分水岭。在这个功耗水平下,设备可以用电池供电,不需要风扇或散热片,也不会出现热节流。它把讨论从‘理论性能’转向了‘安装可行性’。” <br> 这种能效比的提升并非来自简单的工艺进步。金錄元解释道,DEEPX的方法论类似于从科学计算器到简易计算器的演进:“CPU就像科学计算器,可以执行各种类型的计算任务,但每个操作都很复杂。GPU专注于图形并行处理,减少了操作种类但增加了并行单元数量。而NPU则只专注于AI运算——我们深入研究AI数学运算的本质,剔除所有不必要的算子,针对每个应用场景,对处理器构架进行有针对性的剪裁与优化,这种“极简主义”哲学让DEEPX能够在相同工艺节点下实现数量级的能效提升。更重要的是,这家公司已经为这套方法论建立了坚固的专利护城河。据《福布斯》报道,DEEPX在美国注册的NPU专利数量已经超过高通、ARM、英特尔和英伟达,全球专利申请超过400项。“我们不只是保护具体的电路设计,”金錄元透露,“我们保护的是NPU的核心工作原理——就像高通当年用CDMA专利建立的地位一样。” <br> 从演示到量产:50个项目的实战考验 <br> 技术演示与商业落地之间,横亘着一道巨大的鸿沟。在AI芯片领域,这道鸿沟尤其宽广——许多初创公司拥有漂亮的PPT和实验室数据,却无法通过量产的四道关口:稳定性、可复制性、供应链、软件维护。 <br> DEEPX的第一代芯片DX-M1已经跨越了这道鸿沟。金錄元透露,基于DX-M1的产品已经在全球获得超过50个量产项目,覆盖机器人、国防、智能家电等领域。”量产验证的是供应链、质量控制和成本稳定性,“他说,“2026年将是DEEPX通过规模和实际案例建立信任的一年。” <br> 这种信任正在转化为实实在在的订单。现代汽车机器人实验室将在2026年开始量产搭载DEEPX芯片的MobED和DAL-e平台,初期预计出货1万台。POSCO(浦项制铁)这家韩国钢铁巨头同时推进着9个量产项目,从工厂自动化到物流系统,从工业事故监控到自动叉车。 <br> “POSCO DX制铁的案例很能说明问题,”金錄元解释,“他们之前尝试用GPU做工厂自动化,结果发现人工成本竟然比GPU卡便宜——这是很悲哀的现实。但当他们使用我们的芯片后,芯片价格已经低于人工成本,这才让大规模部署成为可能。” <br> 最大规模的部署来自中国大陆。在与百度的合作中,DEEPX预计2026年将在中国市场出货约4万台,应用于OCR相机、数据解析系统和无人机等场景。“ 百度 PaddleOCR 团队长期在寻找 真正适配其模型与应用需求的 AI 芯片解决方案,”金錄元回忆,“当他们测试我们的芯片时,发现性能比300瓦的GPU卡高出近5倍,而功耗只有5瓦。这才让他们相信,AI真的可以从数据中心转移到边缘设备。” <br> 这些量产项目的共同特点是:它们都在解决GPU无法解决的实际问题。“我们采访过全球700多家公司,每年与300家潜在客户深度交流,”金錄元说,“他们的需求很明确:功耗和成本最多比现有方案高20-30%,但必须达到GPU级别的性能。如果你要求他们接受双倍价格或双倍功耗,那就需要CEO级别的决策,因为这意味着整个系统架构要重新设计。” <br> 理解这个“20-30%原则”是DEEPX成功的关键。它意味着技术必须适配现有的产品形态和成本结构,而不是要求客户为技术改变一切。 <br> 1 <br> 2 <br> 下一页 <br> 余下全文
Metadata
Publisher 观察者网
Site guancha
Date 2026-01-27
CMS Category 媒体报道