“AI教母”李飞飞:Sora仍是二维图像,只有三维空间智能才能实现AGI|钛媒体AGI独家
“AI教母”李飞飞:三维空间智能才是实现AGI的关键
近日,斯坦福大学教授、“AI教母”李飞飞在Asian American Scholar Forum论坛上独家对钛媒体App表示,实现通用人工智能(AGI)的关键在于“空间智能”,而非当前的二维智能。李飞飞指出,尽管OpenAI的Sora模型能够生成视频,但它本质上仍然是一个二维模型,缺乏对三维世界的深刻理解。
李飞飞强调,当前的多数模型,如GPT4o和Gemini 1.5,都是基于语言输入和输出的语言类模型,即使是多模态模型,也仅限于二维平面图像。而实现AGI的关键在于具备三维视觉模型的空间智能。她以Sora展示的AI视频为例,指出如果希望从不同角度展现视频内容,Sora无法实现,因为该模型对三维世界没有真正的理解。
李飞飞进一步解释说,空间智能是关于在三维空间中生成视觉地图并进行推理和规划行动的能力。这种智能不仅涉及几何形状和物体间的关系,还涵盖了如何在复杂环境中活动、抓取、控制、制造工具和建造城市等方面。她认为,只有通过空间智能,机器人才能真正理解世界并执行任务,从而形成良性闭环。
空间智能的应用领域非常广泛,包括增强现实(AR)和虚拟现实(VR)等。李飞飞的观点为AGI的研究提供了新的视角和方向,引发了业界的广泛关注和讨论。
此次论坛的闭门会议吸引了众多专家学者参与,李飞飞的独到见解为与会者带来了深刻的启示。她的观点不仅为AGI的研究指明了方向,也为人工智能的未来发展提供了重要的理论支持。