Dall-E 或 Stable Diffusion 的魔力现在应该很熟悉了。从对场景的简要描述、内容和一两条评论中,或多或少地出现了一幅逼真的画面。幸运的是,这通常可以被认为是人工智能生成的作品,但它也达到了它的目的:我不必把狗放在冲浪板上,也不必把狐狸放在宇航员服里。只需点击几下即可获得所需的图像。
然而,在后台,这是一个计算密集型过程,由多次迭代、不断重复算法组成,最终到达所需的图像。然而,麻省理工学院的研究人员已经成功地省去了这些众多的中间步骤。相反,所描述的场景是在仅一步之后创建的。
这使得实现可比的结果成为可能,同时显着减少必要的计算能力或等待时间。同时,驱动称为“分配匹配蒸馏(DMD)”的系统所需的功率更少。
更形象地说:用于训练的图像被分解为更粗糙的区域。这决定了近似的图像构图,具体取决于拍摄对象。此外,还分析了各种图像元素的概率,以便最终获得连贯的场景。
最终,详细信息和复杂性降低,因此图像生成器变得更快。相同的硬件需要大约 100 毫秒,而不是每张图像 2 到 3 秒,即三十分之一。
如果仔细观察图像,可以清楚地看到细节的减少。背景略微模糊,图像元素可以重复。在某些情况下,这些图案看起来仍然要好得多,并且仍然更容易被识别为人工智能的整体作品,或者至少是人工的。另一个积极的影响。
除了狐狸宇航员之外,还可以在这里找到DMD模型的许多其他示例。
来源:IT时代网
IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。
小何
小何
小何
小何