[业界新闻]Google推出Project Genie：用文本或图片即可生成可交互虚拟世界的AI工具 [复制链接]

上一主题下一主题查看指定楼层

在线长安一片月

UID: 331538

管理员

发帖: 11010

今日发帖

最后登录: 2026-03-04

只看楼主倒序阅读使用道具楼主发表于: 2026-01-31 10:07:57

　　Google DeepMind正在向部分用户开放一款名为Project Genie的全新AI模型，用户只需通过文本提示或上传图片，就能即时生成任意风格的虚拟世界，并像玩电子游戏一样操控角色或载具在其中自由探索。这一功能目前通过一款网页应用提供，持有美国地区Google Ultra账户且年满18岁的用户已经可以尝试使用。

　　Project Genie基于Google此前在2025年8月向小范围测试者展示的Genie 3模型，同时结合了公司自家的Nano Banana Pro图像生成模型以及Gemini多模态模型，用于将自然语言提示转化为沉浸式互动场景。用户可以构建的世界类型极为多样，例如操控飞船掠过外星行星、驾驶飞艇飞越上世纪50年代风格的欧洲城市，或者让貘在亚马逊雨林深处奔跑等，均可通过简单描述或参考照片快速生成。

　　在具体体验上，Project Genie会根据玩家如何移动角色、转动视角，实时生成虚拟世界中的画面帧，并支持与场景内物体的交互以及对环境变化的响应。例如，在官方演示视频中，一个蓝色小球在白色草地中滚动时，会将它经过的一切都“涂”上蓝色，形成持续变化的轨迹效果；同时，应用还内置了可供用户二次创作和改造的世界模板库，以便快速上手。

　　用户不仅可以在这些环境中导航，还能上传自己绘制的角色、现实世界物体照片等作为素材，并设定不同元素之间的交互逻辑，从而构建更具个性化的虚拟体验。在某些场景中，甚至可以看到类似GPS导航界面那样的动态反馈：当玩家转向或移动时，界面上的地图也随之更新，增强沉浸感和可玩性。

　　YouTuber Bilawal Sidhu在采访Project Genie团队成员Jack Parker-Holder和Diego Rivas时指出，目前这一系统在实际演示中仍会出现偶发性Bug，而且每次体验被限制在60秒以内，这是当下最大的功能约束之一。不过，开发团队表示，未来会重点探索如何在用户输入中赋予更多对环境和角色行为的控制权，并研究延长虚拟世界持续时间、打破60秒上限的可行方案。

　　至于应用场景，DeepMind团队尚未给出单一明确方向，而是看好它在多个领域的潜力。报道指出，Project Genie有望用于快速原型化电子游戏构思、帮助电影创作者可视化场景与分镜，以及在课堂上帮助学生以更具互动感的方式理解复杂概念或职业场景，例如模拟参与灾后救援工作等，且无需用户具备专业开发技能。

　　作者也关注到，该技术的开放必然伴随内容安全和合规挑战，包括如何设置“护栏”防止生成有害或不当内容，以及如何在创作过程中规避潜在的版权侵权问题。Google方面尚未在细节层面全面披露治理机制，但预计会在未来的产品迭代中不断调整相关策略。

　　目前，居住在美国且订阅了Google AI Ultra的用户已经可以直接通过Google实验性项目页面体验Project Genie。随着后续进一步向更多地区和用户开放，这一“用一句话生成并亲自走进虚拟世界”的新型AI交互方式，或将成为游戏开发、创意设计和教育培训等领域的重要工具之一。

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[业界新闻]Google推出Project Genie：用文本或图片即可生成可交互虚拟世界的AI工具 [复制链接]