Dialogue with DEEPX Founder: When AI Chips Move from Cloud to the Physical World

Full text · 原文 2,320 字

2026年1月，拉斯维加斯的CES展会刚刚落幕，在展会上一家名为DEEPX的韩国AI芯片公司连续第二年被评为“Must-See Booth”。 继而，1月22日，在上海举行的“百度文心Moment”大会上，DEEPX创始人兼CEO 金錄元（Lokwon Kim）正在向中国开发者详述着一个不同寻常的演示：两块芯片上各放置一块黄油，运行相同的AI负载——几分钟后，竞品芯片上的黄油完全融化，而DEEPX的芯片上，黄油纹丝不动。 这个看似简单的“黄油测试”，背后隐藏着AI产业正在发生的一场深刻变革。当全球科技巨头们还在为数据中心投入数万亿美元，竞相建造更大规模的GPU集群时，DEEPX却选择了一条截然不同的道路：让AI从云端走下来，真正嵌入到物理世界的每一个角落。 在百度大会的间隙，观察者网·心智观察所与金錄元进行了一次深度对话。这位曾在Apple领导A11 Bionic芯片开发、在IBM T.J. Watson研究中心从事AI处理器研究的工程师，谈起AI时却像一位哲学家：“我曾读到一句话——人类的苦难源于缺乏智慧。2015年，我意识到AI可能是人类克服缺乏智慧的终极解决方案。”正是这个信念，让他在2018年创立了DEEPX，并将其定位为“帮助人类向真正智能文明演进的公司”。 DEEPX 创始人金錄元 从“不可能”到“必然” 当被问及DEEPX的核心技术突破时，金錄元并没有急于展示复杂的架构图或性能参数，而是从一个更本质的问题切入：“为什么今天的生成式AI只能存在于数据中心？” 答案显而易见：功耗、散热、成本。一块主流GPU运行AI推理需要消耗300瓦以上的功率，相当于三台家用电脑同时运行。这意味着你需要庞大的散热系统、稳定的电力供应，以及高昂的运营成本。“这种架构注定了AI只能是‘远程智能’——你必须通过云端访问它，承受延迟，支付数据传输费用，并且永远依赖网络连接。”金錄元向心智观察所阐述。 DEEPX的DX-M2芯片打破了这个魔咒。它能在5瓦功耗下运行200亿到1000亿参数的大语言模型，相当于一个手机充电器的功率。“5瓦不只是一个数字，”金錄元强调，“它是物理可行性的分水岭。在这个功耗水平下，设备可以用电池供电，不需要风扇或散热片，也不会出现热节流。它把讨论从‘理论性能’转向了‘安装可行性’。” 这种能效比的提升并非来自简单的工艺进步。金錄元解释道，DEEPX的方法论类似于从科学计算器到简易计算器的演进：“CPU就像科学计算器，可以执行各种类型的计算任务，但每个操作都很复杂。GPU专注于图形并行处理，减少了操作种类但增加了并行单元数量。而NPU则只专注于AI运算——我们深入研究AI数学运算的本质，剔除所有不必要的算子，针对每个应用场景，对处理器构架进行有针对性的剪裁与优化，这种“极简主义”哲学让DEEPX能够在相同工艺节点下实现数量级的能效提升。更重要的是，这家公司已经为这套方法论建立了坚固的专利护城河。据《福布斯》报道，DEEPX在美国注册的NPU专利数量已经超过高通、ARM、英特尔和英伟达，全球专利申请超过400项。“我们不只是保护具体的电路设计，”金錄元透露，“我们保护的是NPU的核心工作原理——就像高通当年用CDMA专利建立的地位一样。” 从演示到量产：50个项目的实战考验 技术演示与商业落地之间，横亘着一道巨大的鸿沟。在AI芯片领域，这道鸿沟尤其宽广——许多初创公司拥有漂亮的PPT和实验室数据，却无法通过量产的四道关口：稳定性、可复制性、供应链、软件维护。 DEEPX的第一代芯片DX-M1已经跨越了这道鸿沟。金錄元透露，基于DX-M1的产品已经在全球获得超过50个量产项目，覆盖机器人、国防、智能家电等领域。”量产验证的是供应链、质量控制和成本稳定性，“他说，“2026年将是DEEPX通过规模和实际案例建立信任的一年。” 这种信任正在转化为实实在在的订单。现代汽车机器人实验室将在2026年开始量产搭载DEEPX芯片的MobED和DAL-e平台，初期预计出货1万台。POSCO（浦项制铁）这家韩国钢铁巨头同时推进着9个量产项目，从工厂自动化到物流系统，从工业事故监控到自动叉车。 “POSCO DX制铁的案例很能说明问题，”金錄元解释，“他们之前尝试用GPU做工厂自动化，结果发现人工成本竟然比GPU卡便宜——这是很悲哀的现实。但当他们使用我们的芯片后，芯片价格已经低于人工成本，这才让大规模部署成为可能。” 最大规模的部署来自中国大陆。在与百度的合作中，DEEPX预计2026年将在中国市场出货约4万台，应用于OCR相机、数据解析系统和无人机等场景。“ 百度 PaddleOCR 团队长期在寻找真正适配其模型与应用需求的 AI 芯片解决方案，”金錄元回忆，“当他们测试我们的芯片时，发现性能比300瓦的GPU卡高出近5倍，而功耗只有5瓦。这才让他们相信，AI真的可以从数据中心转移到边缘设备。” 这些量产项目的共同特点是：它们都在解决GPU无法解决的实际问题。“我们采访过全球700多家公司，每年与300家潜在客户深度交流，”金錄元说，“他们的需求很明确：功耗和成本最多比现有方案高20-30%，但必须达到GPU级别的性能。如果你要求他们接受双倍价格或双倍功耗，那就需要CEO级别的决策，因为这意味着整个系统架构要重新设计。” 理解这个“20-30%原则”是DEEPX成功的关键。它意味着技术必须适配现有的产品形态和成本结构，而不是要求客户为技术改变一切。 1 2 下一页 余下全文

Site key	guancha
Policy area	人工智能
Category	report
CMS	媒体报道
AI score	0.36

Dialogue with DEEPX Founder: When AI Chips Move from Cloud to the Physical World

对话DEEPX创始人：当AI芯片从云端走向现实物理世界