当前所在位置: 首页 > 资讯

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT

2024-12-03 胖猫 【 字体:

今天凌晨,李飞飞空间智能首个产品惊艳亮相。

开局一张图,它就能生成一个 3D 视频游戏场景。虽说现在有不少 AI 都能把照片转化为 3D 模型,但 World Labs 带来的不只是建模,而是一个真正可交互、可编辑的活体世界。

除了原始输入的图片,所有内容都是通过 AI 生成。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图1)

World Labs 在博客中说道:

大多数生成式 AI 工具都制作图像或视频等 2D 内容。相反,以 3D 形式生成可以提高控制和一致性。这将改变我们制作电影、游戏、模拟器和物理世界的其他数字表现形式的方式。

实际上,当前市场不乏 3D 生成模型,但通常会出现许多问题。比如初创公司 Decart 的 Minecraft 模拟器 Oasis,要么画面不够清晰,要么场景布局经常混乱。

相比之下,World Labs 却创造出了一个稳定、真实且符合物理规则的 3D 世界。

一个活的世界,比一千张死的图片更有价值。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图2)

一张图生成一个 3D 游戏世界?李飞飞空间智能首秀

开局一张图,结局竟是一个世界?一起来看看 World Labs 产品生成的 3D 游戏世界。

使用鼠标或键盘 W/A/S/D 自由穿行,然后用鼠标单击并拖动来环顾四周:

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图3)

体验地址:https://www.worldlabs.ai/blog

场景生成好后,你就成了一个虚拟摄影师,在浏览器里实时操控相机,想拍什么角度就拍什么角度,如同专业摄影。

还能模拟浅景深,不过,只有距离相机一定距离的物体才能清晰对焦:

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图4)

推拉镜头也没问题。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图5)

World Labs 的核心突破在于,他们没有止步于像素级的表面呈现,而是直指 3D 场景生成的本质优势:

  • 恒久的现实:创造出来的 3D 世界是稳定的,不会消失或者偷偷改变。
  • 实时控制:生成场景后,想去哪去哪,甚至能凑近看花朵的每个细节。
  • 真实的物理规则:生成的世界遵循现实世界的物理法则,没有漂浮的物体,没有穿墙的 bug,就像现实世界一样自然

World Labs 还表示,通过深度贴图技术,他们成功让每个像素都有了真实的空间距离感。而图片中每个像素的颜色,都是由它和摄像头的距离来决定的。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图6)

不仅如此,World Labs 还给场景注入了灵魂——添加各种互动特效,打造动画效果,让整个世界活起来。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图7)

来都来了,脑洞大开的 World Labs 还能把梵高、霍珀这些大师的名画还原成可以探索的 3D 世界。不得不说,绝美。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图8)

而且原画里没有的东西,它都能「脑补」出来,而且出奇地合理。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图9)

联动 Midjourney,让创作者玩转 3D 新世界

说到创作过程,3D 生成的世界还能和其他 AI 工具完美配合,这意味着创作者可以用自己熟悉的工具,创造出全新的体验。

比如说,World Labs 可以先使用文本到图像模型生成图像,从而从文本创建世界。不同的模型有自己的风格,而这些独特的风格都能被保留下来。

来看个具体的例子。

World Labs 团队基于同一提示词,让不同的 AI 画了四个版本的青少年卧室。

A vibrant cartoon-style teenager's bedroom with a bed covered in colorful blankets, a cluttered desk with a computer, posters on the walls, and scattered sports gear. A guitar leans against the wall, and a cozy, patterned rug is in the center. Light from a window adds a warm, youthful vibe to the room.

一间充满活力的卡通风格青少年卧室,床上铺着五颜六色的毯子,杂乱的书桌上放着一台电脑,墙上贴着海报,运动装备散落。一把吉他靠在墙上,中间是一块舒适的图案地毯。窗外的光线为房间增添了温暖、年轻的氛围。

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图10)

已经有一些创作者通过与 World Labs 达成合作,提前用上了。比如,Eric Solorio 就展示了怎么用它来设计人物动作和控制镜头。

而 Brittani Natali 则把 World Labs 的技术和 Midjourney、Runway、Suno、ElevenLabs 等工具组合起来,设计丰富的镜头运动,并创作出富有情感张力的短片。

不过,World Labs 也坦言:

这些结果是我们生成 3D 世界的第一次早期预览。我们正在努力提高生成世界的大小和保真度,并尝试让用户与它们交互的新方式。

另外,想试试吗?现在可以去申请候补名单了。

附上地址:https://forms.gle/tkfW7yMqMsCXWw4F7

并且,World Labs 现在也在招人,总共开放应用 AI 研究工程师、业务运营、数据工程师、模型优化工程师、产品设计师等 8 类岗位。

感兴趣可以去看看:https://jobs.ashbyhq.com/worldlabs

「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT(图11)

值得注意的是,博客里提到页面上所有的图片均使用 FLUX 1.1 [pro]、Ideogram 或 Midjourney 生成,堪称巧妙联动。

李飞飞本人也第一时间在 X 平台站台宣传:

非常兴奋地向你展示我们团队 @theworldlabs 的最新成果!无论你如何构思这个概念,用语言来形容通过照片或句子生成的 3D 场景的互动感受都是相当有挑战性的。希望你能喜欢这篇博客!

阅读全文
相关推荐

功能饮料暗战:年轻人把便利店变成「同仁堂」

<strong>功能饮料暗战:年轻人把便利店变成「同仁堂」</strong>
「核心提示」当枸杞拿铁变成便利店“显眼包”,当熬夜达人们开始用黄芪水“干杯”,一...

开公司前期最重要的三要素!!!

<strong>开公司前期最重要的三要素!!!</strong>
第一:不要直接用身份证直接注册公司!注册公司可以用两个东西,第一个叫身份证,第二...

阿里前端第一人AI创业首秀,要做全球内容创作者的GitHub,公司俩月估值过亿,5k人排队内测

<strong>阿里前端第一人AI创业首秀,要做全球内容创作者的GitHub,公司俩月估值过亿,5k人排队内测</strong>
这就是躬身入局AI大模型创业的玉伯,对2024年创业现状的真实体感。但这位昔日的...

设计一套成就系统,让生活像游戏一样好玩

<strong>设计一套成就系统,让生活像游戏一样好玩</strong>
大家好呀。2024年马上就要过去了,我们很快就要迎来2025年啦。如果在过去的一...

向版权流氓说再见,微信公众号上线AI配图功能

向版权流氓说再见,微信公众号上线AI配图功能
继网易Lofter、虎嗅、百度百家号之后,微信公众号也开始拥抱AI配图了。日前微...

教老外认花花草草,就能月入8000万?

教老外认花花草草,就能月入8000万?
出海收割老外这块,世超见过菜得抠脚的,也见过强得可怕的。但强得可怕还没什么人知道...

最招恨的“劣迹网红”:暴揍老头,年入5亿

<strong>最招恨的“劣迹网红”:暴揍老头,年入5亿</strong>
58岁的“铁人”泰森,重返拳台。在上周末鏖战8回合后,泰森吃到对手杰克·保罗共7...

抖音爆火的“拆盲盒”直播,是如何将昂贵的废品卖给消费者的?

<strong>抖音爆火的“拆盲盒”直播,是如何将昂贵的废品卖给消费者的?</strong>
抖音直播间掀起了一股“拆盲盒”热潮。最初,这股热潮主要集中在拆卡直播间。一盒10...

低至4元的柠檬水,凭什么赚钱?

<strong>低至4元的柠檬水,凭什么赚钱?</strong>
柠檬水快卷疯了。入夏后,不少新茶饮品牌都从柠檬开刀,要么降价,要么推新,动作频频...

2分钟找到契合你的小众市场

<strong>2分钟找到契合你的小众市场</strong>
编者按:互联网是个长尾市场,越来越长尾。不要试图取悦所有人,到头来你会一场空。相...