虽然图像和视频生成 AI 模型已经占据了新闻的主导地位,但 NVIDIA 已经通过 LATTE3D 朝着下一个合乎逻辑的方向迈出了一步,这是一种新的生成式 AI 模型,可在不到一秒的时间内将文本提示转换为完整的 3D 模型。该技术在上周的 NVIDIA GTC 活动中宣布,被吹捧为类似于“虚拟 3D 打印机”,因为它可以立即以“用于标准渲染应用程序的流行格式”提供 3D 模型,随时可以部署在视频游戏开发、广告、设计项目或任何需要虚拟环境的应用程序中。 包括 VR 和 AR。
文本到3D生成式AI并不是一项新技术,NVIDIA的研究论文本身就LATTE3D与MVDream、3DTopia和LGM等几个现有系统进行了对比。LATTE3D具有压倒性优势的地方是速度。在比较测试中,其他 AI 模型需要 20 秒到 30 分钟以上的时间才能生成输出,而 LATTE3D 模型只需 400 毫秒即可生成可比(通常质量更高)的渲染。
应该注意的是,与3D打印一样,随着时间的增加,LATTE3D和其他AI模型的输出质量会提高。这样做的好处是,与3D打印不同,人们可以选择首先优先考虑速度而不是质量,然后决定等待更精细的输出,而不是从一开始就固定设置。
与任何其他生成式 AI 一样,LATTE3D有可能改变许多工作流程。以前,人们必须搜索 3D 资产库或花费宝贵的工时来创建一个简单的对象,而使用 NVIDIA 的技术,只需输入简要描述并将生成的输出导入到自己的软件应用程序或平台中即可。
到目前为止,研究团队只训练LATTE3D创建日常物体和动物的模型,但这可以通过正确的数据集扩展到其他类别。该模型使用 NVIDIA A100 Tensor Core GPU 进行训练,在该公司的演示中,在单个 NVIDIA RTX A6000 上运行。
作为一个研究项目,LATTE3D仍在开发中,到目前为止,还没有人谈论将其作为产品或服务发布。该项目的未来计划包括将功能扩展到“文本到4D”,或生成3D动画。
来源:IT时代网
IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。
小何
小何
小何
小何