AI 25% high 2025-11-14

Spatial Intelligence to Become the Next Peak in AI Advancement

空间智能将成AI攀登的下一座高峰

科技日报 xinhua
This article reports on Stanford Professor Fei-Fei Li's perspective that spatial intelligence, which enables AI to understand and interact with the physical world, represents the next major frontier in artificial intelligence development, moving beyond the current limitations of large language models.
Document Text 1,914 characters
人工智能(AI)的发展正在进入一个全新阶段,或将从“理解语言”走向“理解世界”。<br> 11月10日,美国斯坦福大学教授、World Labs联合创始人李飞飞发文《从语言到世界:空间智能是AI的下一个前沿》,提出空间智能将成为AI攀登的下一座高峰。她指出,当前以大型语言模型为代表的AI系统虽然能熟练生成文字与图像,却仍停留在“语言的世界”中,困于“纸上谈兵”,缺乏对现实空间、物理规律与因果关系的真正理解。而具备空间智能的AI将突破这一瓶颈,像人类一样在现实世界中感知、推理和行动。<br> 李飞飞认为,当前以大型语言模型和图像分类器为主导的人工智能时代已经达到了极限。<br> 图片来源:pymnts.com网站<br> 从算法智能到空间智能<br> 当今的大型语言模型在阅读、写作和模式识别上表现出色,却在物理世界的表征与交互上存在根本局限。即使是最新的多模态大模型,在估算距离、方向、大小时的表现也往往不及随机水平。它们无法在空间中导航、辨识捷径,也不能稳定预测最基本的物理规律。此外,AI生成的视频虽令人印象深刻,却往往在几秒之内失去连贯性。<br> 这些局限使得AI难以真正赋能人类的创造性工作。无论是帮助学生理解复杂的分子化学概念,协助建筑师构思空间结构,还是为导演、游戏设计师构建虚拟世界,目前的AI距离这一目标尚远。<br> 在李飞飞看来,空间智能是人类认知建构的脚手架,驱动着想象、创造与推理,是连接感知与行动的核心能力。这种能力让人们轻松完成停车时估算车距、在人群中自如穿行等日常动作,其核心在于将想象、感知与行动融为一体,实现从“知道”到“理解”的跨越。<br> 她认为,空间智能代表着超越语言的边界,融合了想象、感知与行动,让机器不仅理解“看到了什么”,还理解“这些东西如何关联、意味着什么、为何重要”。这类AI将能真正拓展人类的创造力与理解力,从医疗健康到艺术创作,从科学探索到日常辅助,将会带来前所未有的变革。<br> 构建世界模型是实现路径<br> 李飞飞文中提出,要实现真正的空间智能,就需要突破现有大型语言模型的范式,转向一种更为根本的世界模型。这种新模型不仅能理解语义关系,更能在几何、物理和动态规则上一致地“想象”和“重建”世界。它应当能感知多模态输入,预测场景变化,并与环境进行交互。<br> 当前研究方向包括生成三维物体与场景的3D生成模型、模拟动态过程的物理引擎,以及通过交互学习的具身智能系统。但真正能整合上述全部能力的通用世界模型仍处于起步阶段。<br> 李飞飞创立的World Labs正尝试推动这一前沿研究。其团队研发的世界模型可在语义与几何层面理解复杂3D场景,推理其中的物理属性与交互关系,并生成连贯、可探索的虚拟空间,交互中还可遵守物理与几何规律。<br> 其开发的Marble平台已率先应用了这些能力,创作者无需传统3D建模工具,就能快速创建和编辑完整的虚拟世界。这意味着AI正在从理解语言迈向理解空间,从生成图像迈向生成世界。<br> 重塑人类如何与世界共处<br> “距自然界第一次在远古动物中孕育出空间智能,已过去近五亿年。如今,我们有幸成为可能赋予机器同样能力的一代技术人。”李飞飞文中写道。她认为,空间智能将重新定义AI的功能和行为方式。借助世界模型,机器将从被动分析转向主动规划和适应。例如,仓库机器人可绕过不断变化的库存规划路径,而不是在被阻挡时停止;自动驾驶汽车可预测行人的移动,而不是等待明确的信号;甚至有一天,数字助理也能解读手势、空间环境或共享的视觉框架。<br> 具体而言,在创意与叙事领域,空间智能将重新定义人类的创造方式。导演和游戏设计师可自由构建虚拟世界,建筑师能即时可视化结构与比例,个人创作者与学生也能借助虚拟现实、扩展现实技术在三维空间中“造世界”。<br> 在机器人领域,空间智能是实现具身智能的关键。它让机器人能在虚拟环境中高效训练、理解空间关系与人类意图,从实验室助手到家庭陪护都能安全协作。未来,从纳米医疗机器人到软体探测机器人,AI都将具备环境感知与自适应能力。<br> 在科学、医疗与教育中,空间智能将成为人类探索的倍增器:AI可模拟实验、预测结果,加速药物研发与影像诊断;在课堂上,它能让学生“走进”分子或历史现场,使抽象知识具象可感。<br> 李飞飞强调,空间智能的目标并非取代人类,而是增强人类的专业判断力、创造力与共情力,让技术更深地服务于人性。具备空间智能的AI将帮助人类理解疾病、重塑叙事形式、陪伴脆弱群体,加速科学发现与社会关怀。<br> 她认为,空间智能不仅将改变AI能做什么,更将重塑人类如何与世界共处。从语言到空间,从文字到世界,AI正迈向一个真正能理解现实的新时代。(记者 张佳欣)
Topics
artificial intelligence technology research spatial computing
Metadata
Publisher 科技日报
Site xinhua
Date 2025-11-14
Category report
Policy Area 人工智能
CMS Category 媒体报道
Keywords 空间,世界,智能,理解,人类