什么是 Genie？文字或图片就能缔造游戏？

Google DeepMind 克日推出了生成式互动情况 AI 模子 Genie，可以或许透过文字或图片提示产出互动式动画游戏，而无需事先在游戏机制及运作长举办练习。

Google DeepMind 推出生成式互动情况东西Genie

作为一间于 2014 年被 Google 收购的人工智能公司，Google DeepMind 于 23 日提交的论文指出，该公司推出了生成式互动情况 AI 模子「Genie」，可以或许仅透过文字、图片或草图描写，便生成可节制的互动虚拟情况。

内容写道，Genie 透过大量果真可用的网络影片举办练习，而非依赖于特定游戏或场景的数据，这对游戏开拓及创意娱乐等规模，具有越发遍及的应用性：

作为生成式 AI 的全新创举，我们推出了生成式互动情况「Genie」，可以透过单一图片提示发生互动式且可游玩的情况。

什么是 Genie？

多模子架构

首先，论文显示，Genie 作为一个基本世界模子，由时空影片分词器 (Spatiotemporal video tokenizer)、自回归动态模子 (Autoregressive dynamics model)、以及简朴且可扩展的潜在行动模子 (Scalable latent action model) 的 110 亿个参数配合设定。

因此，他可以或许在未给以指令的环境下，从网络上的 2D 平台游戏及呆板人技能影片中，以无监视方法举办自主练习；同时也能借由我们所提供的外界图像来提示，包罗现实世界的照片或草图，生成可以或许供人们节制并互动的虚拟情况。

进修重现行动并辨识可控部门

Genie 的出格之处在于，他可以或许从网络影片中进修并重现游戏脚色的节制内容，即便这些影片并没有关于正在执行之行动的标签，他也可以或许从生成的情况中，揣度出一致或多种的潜在行动。

同时，Genie 还可以或许进修并辨识行动中哪些部门是可以或许被节制的，并借以发生互动式情境。

合成或现实图片都能转游戏

别的，Genie 仅需一张图片就能缔造一个完整的新互动情况，，首先回收文字转影像的生成模子 Imagen 2 来发生要害影格 (Keyframe)，再透过 Genie 给影像赋予动态结果。

同时，Genie 也能吸收从未见过的图片提示，包罗现实世界照片或简朴草图，使人们可以或许与原先无法移动的现实事物举办互动。

部落格文章写道：

Genie 的成果让任何人，甚至是儿童，都可以或许建设并进入可控的模仿情况、或是具互动性的生成世界。

文末最后也提到 Genie 产物的远大方针：

Genie 的应用不只仅范围于娱乐或创意开拓，他还可以或许作为练习伶俐型署理人 (Intelligent Agent) 的优秀测试平台，从而敦促了 AI 规模的成长。

据悉，伶俐型署理人指的是，一个可以或许调查方圆情况，并作出动作以告竣方针的自主实体，这是今朝 AI 研究的一个焦点观念及重要方针。

Google、OpenAI 比力意味浓重

近几个月来，Google 已释出多个生成式 AI 模子的产物或资讯，包罗最强 AI 参谋「Gemini」、文字转影片生成东西「Lumiere」、以及要害字图片生成东西「ImageFX」，无不吸引公共眼光。

另一方面，OpenAI 的文字转影片东西 Sora 作为首个影片生成产物，也在几周前激发了 AI 怒潮。

然而，近期有关 Gemini 在生成图像时涉及种族争议，造成了母公司 Alphabet 单日 (26) 股价下跌逾 4%。

Google DeepMind 研究部分认真人 Demis Hassabis 在昨日的世界动作通讯大会 (MWC Barcelona 2024) 上则暗示：我们已将 Gemini 的该成果下架，将在将来几周内修复问题并规复。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

DePIN是什么意思？DePIN可以应用在那边？	什么是Fuel Network？Fuel Network 成长现况如何？
DePIN 观念深度阐明，DePIN是什么？	DePIN 是什么？2023 年 DePIN 成长现况
马斯克状告OpenAI，46页诉讼书争什么？恩仇一次看	DePIN是什么意思？值得存眷的5个DePIN项目

http://www.7klian.com