http://www.7klian.com

什么是 Genie?文字或图片就能缔造游戏?

Google DeepMind 克日推出了生成式互动情况 AI 模子 Genie,可以或许透过文字或图片提示产出互动式动画游戏,而无需事先在游戏机制及运作长举办练习。

Google DeepMind 推出生成式互动情况东西Genie

作为一间于 2014 年被 Google 收购的人工智能公司,Google DeepMind 于 23 日提交的论文指出,该公司推出了生成式互动情况 AI 模子 「Genie」,可以或许仅透过文字、图片或草图描写,便生成可节制的互动虚拟情况。

内容写道,Genie 透过大量果真可用的网络影片举办练习,而非依赖于特定游戏或场景的数据,这对游戏开拓及创意娱乐等规模,具有越发遍及的应用性:

作为生成式 AI 的全新创举,我们推出了生成式互动情况「Genie」,可以透过单一图片提示发生互动式且可游玩的情况。

什么是 Genie?

多模子架构

首先,论文显示,Genie 作为一个基本世界模子,由时空影片分词器 (Spatiotemporal video tokenizer)、自回归动态模子 (Autoregressive dynamics model)、以及简朴且可扩展的潜在行动模子 (Scalable latent action model) 的 110 亿个参数配合设定。


Genie 论文内容

因此,他可以或许在未给以指令的环境下,从网络上的 2D 平台游戏及呆板人技能影片中,以无监视方法举办自主练习;同时也能借由我们所提供的外界图像来提示,包罗现实世界的照片或草图,生成可以或许供人们节制并互动的虚拟情况。

进修重现行动并辨识可控部门

Genie 的出格之处在于,他可以或许从网络影片中进修并重现游戏脚色的节制内容,即便这些影片并没有关于正在执行之行动的标签,他也可以或许从生成的情况中,揣度出一致或多种的潜在行动。


Gemie 能借由重现行动来进修并辨识可控部门

同时,Genie 还可以或许进修并辨识行动中哪些部门是可以或许被节制的,并借以发生互动式情境。

合成或现实图片都能转游戏

别的,Genie 仅需一张图片就能缔造一个完整的新互动情况,,首先回收文字转影像的生成模子 Imagen 2 来发生要害影格 (Keyframe),再透过 Genie 给影像赋予动态结果。


Genie 能透过合成图片来生成互动式动画情况

同时,Genie 也能吸收从未见过的图片提示,包罗现实世界照片或简朴草图,使人们可以或许与原先无法移动的现实事物举办互动。


Genie 能透过现实照片及绘画草图来生成互动式动画情况

部落格文章写道:

Genie 的成果让任何人,甚至是儿童,都可以或许建设并进入可控的模仿情况、或是具互动性的生成世界。

文末最后也提到 Genie 产物的远大方针:

Genie 的应用不只仅范围于娱乐或创意开拓,他还可以或许作为练习伶俐型署理人 (Intelligent Agent) 的优秀测试平台,从而敦促了 AI 规模的成长。

据悉,伶俐型署理人指的是,一个可以或许调查方圆情况,并作出动作以告竣方针的自主实体,这是今朝 AI 研究的一个焦点观念及重要方针。

Google、OpenAI 比力意味浓重

近几个月来,Google 已释出多个生成式 AI 模子的产物或资讯,包罗最强 AI 参谋「Gemini」、文字转影片生成东西「Lumiere」、以及要害字图片生成东西「ImageFX」,无不吸引公共眼光。

另一方面,OpenAI 的文字转影片东西 Sora 作为首个影片生成产物,也在几周前激发了 AI 怒潮。

然而,近期有关 Gemini 在生成图像时涉及种族争议,造成了母公司 Alphabet 单日 (26) 股价下跌逾 4%。

Google DeepMind 研究部分认真人 Demis Hassabis 在昨日的世界动作通讯大会 (MWC Barcelona 2024) 上则暗示:我们已将 Gemini 的该成果下架,将在将来几周内修复问题并规复。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。