烧钱一年,李飞飞的「空间智能」愿景有变化吗?

在近期由 a16z 普通合伙人 Erik Torenberg 主持的一场访谈中,李飞飞和 World Labs 早期投资者 Martin Casado 围绕「世界模型」和「空间智能」的话题探讨了她对 AI 技术的理解,并在创业项目启动一年后重新介绍了 World Labs 的任务和愿景。

目录

01. 创业一年后,李飞飞如何阐述 World Labs 的愿景?

成立一年的World Labs 发布过什么进展?World Labs 的愿景有变化吗?空间智能终于有望解锁了?...

02. 为什么没有空间智能的 AI 是不完整的?

LLM更流行,但李飞飞为什么选空间智能?世界模型于空间智能如何弥补LLM的天然缺陷?...03. 空间智能如何解锁从「单一现实」到「多元宇宙」的未来?

 「多元宇宙」的愿景具体指什么?为什么李飞飞没有更早重视 3D 表征?什么是技术的反直觉发展?...

04. 数据驱动并非易事,空间智能距离实现世界模型的愿景还有多远?

哪些前置技术的发展让世界模型迎来发展时机?李飞飞和Cadaso下一步要做什么?

01 创业一年后,李飞飞如何阐述 World Labs 的愿景?

自 2024 年 5 月媒体报道创业计划,而后在 9 月官宣,李飞飞的初创公司 World Labs 快速完成了两轮融资,累计募资 2.3 亿美元,估值突破 10 亿美元,成为 AI 领域备受瞩目的独角兽企业。在团队成立后,World Labs 目前陆续发布了「世界生成」模型、Forge 渲染器等工作。在最新的访谈中,李飞飞从不同的角度阐述了她对 AI 未来的看法。

1、李飞飞从强调空间智能和世界模型的重要性开始,完整阐述了 World Labs 的技术愿景、数据驱动 AI 的哲学、个人创业历程与投资人选择、空间智能的技术突破与应用场景、立体视觉缺失的个人经历以及未来多元宇宙的愿景。

2、李飞飞指出当前语言模型在描述和理解三维物理世界方面存在明显的局限性,空间智能则超越语言模型成为智能的关键组件,是世界模型理解、重建和生成物理世界的核心能力。

① 语言虽然是思想和信息的强大编码,但对 3D 物理世界而言是「有损的编码方式」,无法有效描述和操作三维空间。而空间智能代表着更为古老和根本的智能形式,是 AI 的关键组成部分。

3、在这一认知框架下,World Labs 试图构建能理解 3D 物理世界的 AI 系统,使人类能创造无限虚拟宇宙,进而应用于机器人、设计、社交等多个领域。

① 2024 年 12 月,该公司推出「世界生成」技术,仅需单张图片即可生成可交互的 3D 物理世界。[2-1]

② 今年 6 月,World Labs 开源了 3D 高斯泼溅渲染器 Forge,支持 Web 端实时渲染 AI 生成的 3D 场景。[2-2]

4、根据李飞飞的描述,World Labs 要解决的不是一个技术问题,而是智能的核心组件之一。其团队的进展和当前技术发展时机促使空间智能的技术突破正在成为可能。

① 目前,LLM 的成功为空间智能提供了方法论(如数据驱动、神经网络),但真正的突破需要跨学科整合(AI + 计算机图形学等)。

② 同时,随着算力、数据和工程能力的不断提升,集中攻关「世界模型」已经具备了现实的可能性。

02 为什么没有空间智能的 AI 是不完整的?

该场谈话的主要议题之一是李飞飞对技术路线的选择。当前 AI 领域主要集中在大语言模型(LLM)上,但李飞飞选择了一条不同的道路,专注于让 AI 理解 3D 物理世界的运作方式...

 关注????????「机器之心PRO会员」,前往「收件箱」查看完整解读 

免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。