「AI 教母」李飞飞空间智能首个产品亮相,一张图生成一个 3D 游戏世界,这次真不是 PPT
2024-12-03 胖猫 【 字体:大 中 小 】
今天凌晨,李飞飞空间智能首个产品惊艳亮相。
开局一张图,它就能生成一个 3D 视频游戏场景。虽说现在有不少 AI 都能把照片转化为 3D 模型,但 World Labs 带来的不只是建模,而是一个真正可交互、可编辑的活体世界。
除了原始输入的图片,所有内容都是通过 AI 生成。
World Labs 在博客中说道:
大多数生成式 AI 工具都制作图像或视频等 2D 内容。相反,以 3D 形式生成可以提高控制和一致性。这将改变我们制作电影、游戏、模拟器和物理世界的其他数字表现形式的方式。
实际上,当前市场不乏 3D 生成模型,但通常会出现许多问题。比如初创公司 Decart 的 Minecraft 模拟器 Oasis,要么画面不够清晰,要么场景布局经常混乱。
相比之下,World Labs 却创造出了一个稳定、真实且符合物理规则的 3D 世界。
一个活的世界,比一千张死的图片更有价值。
一张图生成一个 3D 游戏世界?李飞飞空间智能首秀
开局一张图,结局竟是一个世界?一起来看看 World Labs 产品生成的 3D 游戏世界。
使用鼠标或键盘 W/A/S/D 自由穿行,然后用鼠标单击并拖动来环顾四周:
体验地址:https://www.worldlabs.ai/blog
场景生成好后,你就成了一个虚拟摄影师,在浏览器里实时操控相机,想拍什么角度就拍什么角度,如同专业摄影。
还能模拟浅景深,不过,只有距离相机一定距离的物体才能清晰对焦:
推拉镜头也没问题。
World Labs 的核心突破在于,他们没有止步于像素级的表面呈现,而是直指 3D 场景生成的本质优势:
- 恒久的现实:创造出来的 3D 世界是稳定的,不会消失或者偷偷改变。
- 实时控制:生成场景后,想去哪去哪,甚至能凑近看花朵的每个细节。
- 真实的物理规则:生成的世界遵循现实世界的物理法则,没有漂浮的物体,没有穿墙的 bug,就像现实世界一样自然
World Labs 还表示,通过深度贴图技术,他们成功让每个像素都有了真实的空间距离感。而图片中每个像素的颜色,都是由它和摄像头的距离来决定的。
不仅如此,World Labs 还给场景注入了灵魂——添加各种互动特效,打造动画效果,让整个世界活起来。
来都来了,脑洞大开的 World Labs 还能把梵高、霍珀这些大师的名画还原成可以探索的 3D 世界。不得不说,绝美。
而且原画里没有的东西,它都能「脑补」出来,而且出奇地合理。
联动 Midjourney,让创作者玩转 3D 新世界
说到创作过程,3D 生成的世界还能和其他 AI 工具完美配合,这意味着创作者可以用自己熟悉的工具,创造出全新的体验。
比如说,World Labs 可以先使用文本到图像模型生成图像,从而从文本创建世界。不同的模型有自己的风格,而这些独特的风格都能被保留下来。
来看个具体的例子。
World Labs 团队基于同一提示词,让不同的 AI 画了四个版本的青少年卧室。
A vibrant cartoon-style teenager's bedroom with a bed covered in colorful blankets, a cluttered desk with a computer, posters on the walls, and scattered sports gear. A guitar leans against the wall, and a cozy, patterned rug is in the center. Light from a window adds a warm, youthful vibe to the room.
一间充满活力的卡通风格青少年卧室,床上铺着五颜六色的毯子,杂乱的书桌上放着一台电脑,墙上贴着海报,运动装备散落。一把吉他靠在墙上,中间是一块舒适的图案地毯。窗外的光线为房间增添了温暖、年轻的氛围。
已经有一些创作者通过与 World Labs 达成合作,提前用上了。比如,Eric Solorio 就展示了怎么用它来设计人物动作和控制镜头。
而 Brittani Natali 则把 World Labs 的技术和 Midjourney、Runway、Suno、ElevenLabs 等工具组合起来,设计丰富的镜头运动,并创作出富有情感张力的短片。
不过,World Labs 也坦言:
这些结果是我们生成 3D 世界的第一次早期预览。我们正在努力提高生成世界的大小和保真度,并尝试让用户与它们交互的新方式。
另外,想试试吗?现在可以去申请候补名单了。
附上地址:https://forms.gle/tkfW7yMqMsCXWw4F7
并且,World Labs 现在也在招人,总共开放应用 AI 研究工程师、业务运营、数据工程师、模型优化工程师、产品设计师等 8 类岗位。
感兴趣可以去看看:https://jobs.ashbyhq.com/worldlabs
值得注意的是,博客里提到页面上所有的图片均使用 FLUX 1.1 [pro]、Ideogram 或 Midjourney 生成,堪称巧妙联动。
李飞飞本人也第一时间在 X 平台站台宣传:
非常兴奋地向你展示我们团队 @theworldlabs 的最新成果!无论你如何构思这个概念,用语言来形容通过照片或句子生成的 3D 场景的互动感受都是相当有挑战性的。希望你能喜欢这篇博客!

猜你喜欢

宁德时代“一哥”地位不稳?氢能万亿巨头正在路上


9点1氪丨支付宝、微信支付收款码禁止商用系误读;董明珠22岁女秘书开始直播带货;世卫紧急会议讨论新型变异毒株


Web2没救了?新的连接方式正重新编织这张网


知识直播偷袭了电商直播?


你的充电焦虑,马上有救了


一文看懂财富创造的九种基本机制


增速放缓,互联网巨头投资“养家”


越丑越好卖,2022年破圈爆品,我赌这些“丑东西”


南极人拟花5亿元买吊牌,又想收割谁?


2021光伏白皮书:天地间一场好戏


功能饮料暗战:年轻人把便利店变成「同仁堂」

开公司前期最重要的三要素!!!


阿里前端第一人AI创业首秀,要做全球内容创作者的GitHub,公司俩月估值过亿,5k人排队内测

设计一套成就系统,让生活像游戏一样好玩


向版权流氓说再见,微信公众号上线AI配图功能

教老外认花花草草,就能月入8000万?

最招恨的“劣迹网红”:暴揍老头,年入5亿

抖音爆火的“拆盲盒”直播,是如何将昂贵的废品卖给消费者的?

低至4元的柠檬水,凭什么赚钱?

2分钟找到契合你的小众市场