雅加达 - 谷歌正式推出了Project Genie,这是一个基于网络的原型,允许用户仅通过文本命令或图像创建和探索由人工智能生成的3D世界。这项技术开辟了与AI进行交互的新方法,从创建静态图像到探索一个充满活力和活力的虚拟世界。
Project Genie 是 Genie 3 的用户界面版本,是 Google 最新的人工智能模型,旨在生成三维环境。该项目还利用了 Gemini 模型和 Google 的 AI 图像生成器技术 Nano Banana。
根据谷歌的说法,Project Genie中的世界构建过程始于World Sketching功能。在这个阶段,用户可以使用自然语言描述他们想要的世界,或者上传图像作为视觉参考。
谷歌解释说,World Sketching功能已直接与Nano Banana集成,因此用户可以在AI通过Project Genie将其整合为一个完整的3D世界之前,先构思一个视觉概念。
在世界形成后,用户可以进入世界探索阶段。在这里,AI将继续实时生成用户前面的环境,就像一个没有固定地图的开放世界游戏概念一样。
此外,还有一个World Remixing功能,允许用户从别人的世界中提取出来,并用新的提示重新开发。换句话说,一个世界可以从用户的额外想法演变成另一个世界。
了解 Genie 项目:一个由 Genie 3(我们的世界模型)驱动的实验研究原型,它可以让你提示一个交互式世界存在 - 然后进入 🌎 pic.twitter.com/Zn84k0iJ48
— 谷歌 (@Google) 2026 年 1 月 29 日
虽然听起来很革命,但Project Genie的访问仍然非常有限。谷歌只向美国AI Ultra客户开放这项服务。AI Ultra套餐是谷歌最昂贵的AI订阅,每月收费250美元,这使得它几乎无法为普通用户负担得起。
对于AI Ultra的客户,Project Genie仍然有一些技术限制。每次探索会话最多限制为60秒。生成的场景也仅以720p分辨率显示,交互速度约为每秒20到24帧,这意味着它还没有完全流畅。
尽管如此,Project Genie仍然被认为是生成性AI开发的一大飞跃。与只创建图像或视频不同,该技术允许AI构建可持续探索,修改和开发的交互式世界。
如果这项技术继续开发,并最终广泛可用,Project Genie有可能改变游戏,模拟,虚拟世界以及基于AI的教育体验的制作方式。目前,人工智能世界的前景仍然是“高端”用户的专属权利。
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)