谷歌研究人员推出Genie—知道如何从示例图像创建迷你游戏场景AI

Google DeepMind 的研究人员推出了 Genie,这是世界上第一个生成式交互式环境 AI。AI 可以在查看示例游戏的图像后创建可玩的场景。这为游戏玩家打开了无需编程即可创建可玩游戏的大门。

Genie 通过观看 30,000 小时的视频(680 万个 16 秒剪辑)接受了 2D 平台游戏的训练。人工智能通过将视频图像和它看到的动作表示为一组数字来简化它所看到的内容,就像人类用文字来描述游戏场景一样。

训练后,Genie 只需要一个游戏场景的单个示例即可创建一个可玩的迷你场景。在幕后,人工智能可以使用复杂的方法来扩展起始图像,以生成图像的缺失部分,因此精灵可以随着玩家的前进绘制游戏世界的新部分。它通过参考它所看到的数百万个剪辑来做到这一点,同时为角色提供可玩的动作,例如奔跑或跳跃。

重要的是,精灵通过观看游戏玩法来学习动作,而不是通过让人类指出这一点。因此,当有一座有缺口的桥梁时,人工智能从它所看到的情况中知道角色可能需要跳过缺口,并且当人类玩家按下控制器上的向上按钮时就会这样做。

这一切都需要巨大的计算能力来训练(在拥有数百个芯片的计算机上数周内进行数千万亿次浮点运算)和游戏玩法,而这只能以每秒 1 帧的超慢速度完成。

对于有技术头脑的人来说,视频帧和推断的潜在动作是使用 van den Oord 的 VQ-VAE 进行标记化的。用户指定的潜在动作以及标记化的视频帧被输入到动态模型中,利用 Chang 的 MaskGIT 转换器生成迭代帧标记,这些标记用于利用 Gupta 的 MaskViT 生成输出视频。从Xu那里采用的ST转换器被用于除了空间之外,还包括时间注意力,以改善预测并减少内存需求。

因此,在计算机强大到可以完全自己创建 2D 平台游戏的那一天到来之前,请使用掌上游戏机(就像亚马逊的这种游戏机)一起享受经典的平台游戏。

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
谷歌研究人员推出Genie—知道如何从示例图像创建迷你游戏场景AI

精彩评论