Marble

可互动的多模态世界模型。...

Marble 为李飞飞团队 World Labs 推出的第一款产品,

该产品由多模态世界模型提供支持,任何人都可以从单个图像、视频、文本提示或 3D 布局创建高保真、持久的 3D 世界,并且用户可以在这些世界中移动、编辑和居住。

产品核心特点

1. 多模态的输入,支持通过文本、图像、视频和 360 全景图创建 3D 世界

2. 支持精确控制生成世界的 3D 布局

3. 允许交互式编辑,可调整特定元素或重塑整个 3D 世界

4. 可以拓展、编辑、组合生成的世界,以构建更大更身临其境的环境

5. 多功能输出,支持各种 2D 和 3D 格式的导出下载

2 个评论

localhost

一两个月前接触到的这个产品,说是世界模型的初步应用,当时点进去看了下,体验下来不能说惊艳,也不能说糟糕,只能说 普通或者将就,或者说新鲜。

它实际上是传入一张图或者一段视频,然后猜测深度,生成点云。

巧妙之处在于

点云是可以被导出直接做建模的,也就是说,这是可编辑的3d模型。

而更巧妙的是,你可以ai对话修改某个部分,或者上传其他的图并且让它修改、缝合进当前的点云。

这使得某些临时需要建模工作而完全不懂建模的人可以迅速地把这部分外包出去,这也是它的价值所在,像普通人用canvas功能生成一个有点小功能的网页。

糟糕之处在于,它能做的仅仅如此,你只能在原点看到精美的图本身(它甚至可能会理解错,比如它把黑神话钟馗里的钟馗理解成了小山丘,然后就抽象起来了),一旦移动,就会看到整个世界被模糊地拼凑起来。

并且,现在的世界生成速度还很慢,还不足以高强度地构建真实世界。

全是个可以期待未来的玩具吧

Taki

继具身智能后的炒股新概念继具身智能后的炒股新概念

语义网络本身也是一种高维空间信息,目前的模型面数和粗糙大贴图看不出来对于所描述的智能驾驶、距离感知、空间感知的助益