谷歌用文本创建虚拟世界：Project Genie推出，但仅限于超人工智能客户

雅加达 - 谷歌正式推出了Project Genie，这是一个基于网络的原型，允许用户仅通过文本命令或图像创建和探索由人工智能生成的3D世界。这项技术开辟了与AI进行交互的新方法，从创建静态图像到探索一个充满活力和活力的虚拟世界。

Project Genie 是 Genie 3 的用户界面版本，是 Google 最新的人工智能模型，旨在生成三维环境。该项目还利用了 Gemini 模型和 Google 的 AI 图像生成器技术 Nano Banana。

根据谷歌的说法，Project Genie中的世界构建过程始于World Sketching功能。在这个阶段，用户可以使用自然语言描述他们想要的世界，或者上传图像作为视觉参考。

谷歌解释说，World Sketching功能已直接与Nano Banana集成，因此用户可以在AI通过Project Genie将其整合为一个完整的3D世界之前，先构思一个视觉概念。

在世界形成后，用户可以进入世界探索阶段。在这里，AI将继续实时生成用户前面的环境，就像一个没有固定地图的开放世界游戏概念一样。

此外，还有一个World Remixing功能，允许用户从别人的世界中提取出来，并用新的提示重新开发。换句话说，一个世界可以从用户的额外想法演变成另一个世界。

了解 Genie 项目：一个由 Genie 3（我们的世界模型）驱动的实验研究原型，它可以让你提示一个交互式世界存在 - 然后进入 🌎 pic.twitter.com/Zn84k0iJ48
— 谷歌 (@Google) 2026 年 1 月 29 日

虽然听起来很革命，但Project Genie的访问仍然非常有限。谷歌只向美国AI Ultra客户开放这项服务。AI Ultra套餐是谷歌最昂贵的AI订阅，每月收费250美元，这使得它几乎无法为普通用户负担得起。

对于AI Ultra的客户，Project Genie仍然有一些技术限制。每次探索会话最多限制为60秒。生成的场景也仅以720p分辨率显示，交互速度约为每秒20到24帧，这意味着它还没有完全流畅。

尽管如此，Project Genie仍然被认为是生成性AI开发的一大飞跃。与只创建图像或视频不同，该技术允许AI构建可持续探索，修改和开发的交互式世界。

如果这项技术继续开发，并最终广泛可用，Project Genie有可能改变游戏，模拟，虚拟世界以及基于AI的教育体验的制作方式。目前，人工智能世界的前景仍然是“高端”用户的专属权利。