当全球AI竞争还在围绕大语言模型的参数和上下文长度打转时,人工智能先驱李飞飞(Fei-Fei Li)给出明确提醒:真正的智能不止会“说”,更要能理解并操控物理世界——这就是“空间智能”(Spatial Intelligence)。在最新博客中,她直言:如果AI无法掌握空间推理、物体关系和动态预测,所谓“通用人工智能”终究只是虚有其表。
空间智能:人类认知的底层引擎
李飞飞指出,空间智能是人类智慧的根基,出现远早于语言。婴儿伸手拿玩具、科学家借助X射线衍射推断DNA双螺旋;古希腊人用影子估算地球周长、工程师为自动驾驶规划路线——这些进步都离不开对空间、形状、运动与因果的深入理解。而如今许多主流大模型虽然能写得很顺畅,却常常在“杯子放在桌边会不会掉下去”这类基本物理常识上犯错。

跳出“预测下一个词”:打造AI的“世界模型”
要真正突破瓶颈,李飞飞提出必须构建新一代世界模型(World Model)——一种能生成、交互并预测物理环境状态的多模态系统。这个模型需要三项核心能力:
感知三维甚至四维(包含时间),而不是只看二维图像;
理解动作与结果之间的因果链条,比如“推倒积木塔”引发的连锁反应;
通过主动交互来学习,而非被动依赖人工标注数据。
要实现上述目标,面前有三大挑战:新的训练范式(替代“下一个词预测”)、从海量视频中抽取更深层的空间结构、以及支持3D/4D推理的新型神经架构。目前,李飞飞团队正在全力推进,把计算机视觉、具身智能与生成式AI深入融合。
三步走落地:从创意到科学,重塑人类生产力
李飞飞给出空间智能的演进路线:
近期:赋能电影、游戏与虚拟叙事,生成更真实的动态场景;
中期:让服务机器人真正看懂家庭环境,安全递送物品、帮助老人;
长期:推动科学发现(如分子折叠模拟)、精准医疗(手术路径规划)和沉浸式教育。
AI的使命是增强人类,而非取代
在技术热潮之中,李飞飞再次强调她的一贯观点:“AI的终极目标不是替代人类,而是拓展人的能力边界。”她呼吁学界与产业界共同建设开放、负责任的空间智能生态,让技术红利惠及所有人。
这份宣言不仅意味着技术路线的转向,也是在为AI的发展哲学校准。随着行业从“语言幻觉”回到“物理现实”,AI才更有可能走出聊天窗口,进入工厂、实验室与千家万户。这场空间智能的变革,或许正是通向真正智能机器的唯一道路。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?