谷歌用文本创建虚拟世界:Project Genie推出,但仅限于超人工智能客户

雅加达 - 谷歌正式推出了Project Genie,这是一个基于网络的原型,允许用户仅通过文本命令或图像创建和探索由人工智能生成的3D世界。这项技术开辟了与AI进行交互的新方法,从创建静态图像到探索一个充满活力和活力的虚拟世界。

Project Genie 是 Genie 3 的用户界面版本,是 Google 最新的人工智能模型,旨在生成三维环境。该项目还利用了 Gemini 模型和 Google 的 AI 图像生成器技术 Nano Banana。

根据谷歌的说法,Project Genie中的世界构建过程始于World Sketching功能。在这个阶段,用户可以使用自然语言描述他们想要的世界,或者上传图像作为视觉参考。

谷歌解释说,World Sketching功能已直接与Nano Banana集成,因此用户可以在AI通过Project Genie将其整合为一个完整的3D世界之前,先构思一个视觉概念。

在世界形成后,用户可以进入世界探索阶段。在这里,AI将继续实时生成用户前面的环境,就像一个没有固定地图的开放世界游戏概念一样。

此外,还有一个World Remixing功能,允许用户从别人的世界中提取出来,并用新的提示重新开发。换句话说,一个世界可以从用户的额外想法演变成另一个世界。

虽然听起来很革命,但Project Genie的访问仍然非常有限。谷歌只向美国AI Ultra客户开放这项服务。AI Ultra套餐是谷歌最昂贵的AI订阅,每月收费250美元,这使得它几乎无法为普通用户负担得起。

对于AI Ultra的客户,Project Genie仍然有一些技术限制。每次探索会话最多限制为60秒。生成的场景也仅以720p分辨率显示,交互速度约为每秒20到24帧,这意味着它还没有完全流畅。

尽管如此,Project Genie仍然被认为是生成性AI开发的一大飞跃。与只创建图像或视频不同,该技术允许AI构建可持续探索,修改和开发的交互式世界。

如果这项技术继续开发,并最终广泛可用,Project Genie有可能改变游戏,模拟,虚拟世界以及基于AI的教育体验的制作方式。目前,人工智能世界的前景仍然是“高端”用户的专属权利。