0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA提出Magic3D:高分辨率文本到3D内容创建

CVer 来源:机器之心 作者:机器之心 2022-11-25 11:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英伟达进入 AI 生成模型领域的研究,直接比别人多一个次元:一句描述生成 3D 模型。

我们生活在三维的世界里,尽管目前大多数应用程序是 2D 的,但人们一直对 3D 数字内容有很高的需求,包括游戏、娱乐、建筑和机器人模拟等应用。

然而,创建专业的 3D 内容需要很高的艺术与审美素养和大量 3D 建模专业知识。人工完成这项工作需要花费大量时间和精力来培养这些技能。

需求大又是「劳动密集型行业」,那么有没有可能交给 AI 来做?上周五,英伟达提交到预印版论文平台 arXiv 的论文引起了人们的关注。

和现在流行的 NovelAI 差不多,人们只需要输入一段文字比如「一只坐在睡莲上的蓝色箭毒蛙」,AI 就能给你生成个纹理造型俱全的 3D 模型出来。

d643de04-6c11-11ed-8abf-dac502259ad0.gif

Magic3D 还可以执行基于提示的 3D 网格编辑:给定低分辨率 3D 模型和基本提示,可以更改文本从而修改生成的模型内容。此外,作者还展示了保持画风,以及将 2D 图像样式应用于 3D 模型的能力。

d6bb92e6-6c11-11ed-8abf-dac502259ad0.gif

Stable Diffusion 的论文在 2022 年 8 月才首次提交,几个月就已经进化到这样的程度,不禁让人感叹科技发展的速度。

英伟达表示,你只需要在这个基础上稍作修改,生成的模型就可以当做游戏或 CGI 艺术场景的素材了。

3D 生成模型的方向并不神秘,其实在 9 月 29 日,谷歌曾经发布过一款文本到 3D 的生成模型 DreamFusion,英伟达在 Magic3D 的研究中直接对标该方法。

d7690e3a-6c11-11ed-8abf-dac502259ad0.gif

类似于 DreamFusion 用文本生成 2D 图像,再将其优化为体积 NeRF(神经辐射场)数据的流程,Magic3D 使用两阶段生成法,用低分辨率生成的粗略模型再优化到更高的分辨率。

英伟达的方法首先使用低分辨率扩散先验获得粗糙模型,并使用稀疏 3D 哈希网格结构进行加速。用粗略表示作为初始,再进一步优化了带纹理的 3D 网格模型,该模型具有与高分辨率潜在扩散模型交互的高效可微分渲染器。

Magic3D 可以在 40 分钟内创建高质量的 3D 网格模型,比 DreamFusion 快 2 倍(后者平均需要 1.5 小时),同时还实现了更高的分辨率。统计表明相比 DreamFusion,61.7% 的人更喜欢英伟达的新方法。

连同图像调节生成功能,新技术为各种创意应用开辟了新途径。

d7cec5cc-6c11-11ed-8abf-dac502259ad0.png

论文链接:https://arxiv.org/abs/2211.10440

技术细节

Magic3D 可以在较短的计算时间内根据文本 prompt 合成高度详细的 3D 模型。Magic3D 通过改进 DreamFusion 中的几个主要设计选择来使用文本 prompt 合成高质量的 3D 内容。

具体来说,Magic3D 是一种从粗到精的优化方法,其中使用不同分辨率下的多个扩散先验来优化 3D 表征,从而生成视图一致的几何形状以及高分辨率细节。Magic3D 使用监督方法合成 8 倍高分辨率的 3D 内容,速度也比 DreamFusion 快 2 倍。

Magic3D 的整个工作流程分为两个阶段:在第一阶段,该研究优化了类似于 DreamFusion 的粗略神经场表征,以实现具有基于哈希网格(hash grid)的内存和计算的高效场景表征。

在第二阶段该方法切换到优化网格表征。这个步骤很关键,它允许该方法在高达 512 × 512 的分辨率下利用扩散先验。由于 3D 网格适用于快速图形渲染,可以实时渲染高分辨率图像,因此该研究利用基于光栅化的高效微分渲染器和相机特写来恢复几何纹理中的高频细节。

d803fd1e-6c11-11ed-8abf-dac502259ad0.png

基于上述两个阶段,该方法可以生成高保真的 3D 内容,并且很容易在标准图形软件中导入和可视化。

此外,该研究展示了用文本 prompt 对 3D 合成过程的创造性控制能力,如下图 1 所示。

d84e0954-6c11-11ed-8abf-dac502259ad0.png

为了对比实际应用效果,英伟达的研究人员把 Magic3D 和 DreamFusion 在 397 个文本提示生成的内容上进行了比较。平均的粗略模型生成阶段花费 15 分钟,精细阶段训练了 25 分钟,所有运行时间均在 8 块英伟达 A100 GPU 上测得。

d898c886-6c11-11ed-8abf-dac502259ad0.png

d8d9953c-6c11-11ed-8abf-dac502259ad0.png

虽然论文和 demo 只是第一步,但英伟达已经为 Magic3D 想好了未来的应用方向:给游戏和元宇宙世界提供制作海量 3D 模型的工具,而且让所有人都可以上手使用。

当然,最早上线这项功能的可能会是英伟达自己的 Omniverse。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2990

    浏览量

    113825
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109088
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296576

原文标题:一句话生成3D模型!NVIDIA提出Magic3D:高分辨率文本到3D内容创建

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    分辨率对于模拟数字转换器有什么重要性

    电路噪声等限制略低)。高分辨率ADC在相同输入信号下能提供更高的SNR,减少背景噪声对信号的干扰。3. 系统精度:影响整体测量或控制的准确性误差控制:分辨率直接决定了ADC的绝对误差范围。例如,12位
    发表于 09-18 09:31

    iTOF技术,多样化的3D视觉应用

    。 ◆ 应用2—机舱内的 3D 传感 应用3—自主移动机器人 (AMR) 在室外(~150,000 勒克斯)和黑暗环境中进行障碍物检测。 高分辨率能力,可准确检测细长物体,例如椅腿。 低抖动和低误差
    发表于 09-05 07:24

    聚徽厂家工业液晶屏的高分辨率成像技术揭秘

    在工业生产、智能控制、精密检测等领域,对信息的精准获取与清晰展示至关重要。聚徽厂家的工业液晶屏凭借卓越的高分辨率成像技术,在众多品牌中脱颖而出,为各行业提供了清晰、细腻的视觉呈现。接下来,将深入探究聚徽工业液晶屏高分辨率成像技术背后的奥秘。
    的头像 发表于 07-11 18:08 613次阅读

    LT8722如何实现高分辨率的脉冲?

    resolution should be 333/2^(24)=0.00002 ns. 如何实现如此高分辨率的脉冲? PWM 是否由模拟比较器产生?芯片中是否有真正的 DAC 来产生比较器电压? What
    发表于 04-28 06:08

    普源精电RIGOL推出MHO2000系列高分辨率示波器

    普源精电(RIGOL)作为中国领先的电子测量仪器厂商,近日正式推出MHO2000系列高分辨率示波器,这一举措不仅标志着公司在示波器领域的技术突破,更彰显了其深耕高端市场的战略决心。本文将深入解析
    的头像 发表于 03-31 13:24 866次阅读
    普源精电RIGOL推出MHO2000系列<b class='flag-5'>高分辨率</b>示波器

    机器视觉领域又一款2.5亿超高分辨率大面阵图像传感芯片

    3月26日,在Vision China·2025中国(上海)机器视觉展上,南京威派视半导体技术有限公司再推新品——2.5亿超高分辨率VPS820大面阵图像传感芯片,具备高信噪比、高满阱电荷量等优异
    的头像 发表于 03-26 15:10 802次阅读

    国产高分辨率AFE替换ADS1283/ADS1284应用于高精度仪器

    国产高分辨率AFE替换ADS1283/ADS1284应用于高精度仪器
    的头像 发表于 03-04 10:00 873次阅读
    国产<b class='flag-5'>高分辨率</b>AFE替换ADS1283/ADS1284应用于高精度仪器

    高分辨率示波器的功能与作用:以麦科信MHO6为例

    一、高分辨率示波器的定义与重要性 高分辨率示波器是一种能够以高精度捕捉和分析信号的电子测量仪器,它通过增加垂直分辨率(通常为12bit或更高)和采样,能够更清晰地显示信号的细节,从而
    发表于 02-28 17:39

    高速、高分辨率、大面积成像应用的理想选择——Falcon4-CLHS工业相机

    在机器视觉高性能成像应用领域,TeledyneDalsa的Falcon4-CLHS工业相机系列无疑是理想之选。它运用了TeledyneImaging的先进CMOS架构,为大面积、高分辨率、高速
    的头像 发表于 02-21 17:05 1244次阅读
    高速、<b class='flag-5'>高分辨率</b>、大面积成像应用的理想选择——Falcon4-CLHS工业相机

    歌尔光学发布自主研发DLP 3D打印光机模组

    行业的迅猛发展,市场对高精度打印的需求日益增长,对 3D 打印设备中的光学器件模组性能也提出了更高要求。歌尔光学此次推出的基于 DLP 技术方案的光机模组,无疑为行业带来了新的解决方案。 从技术参数来看,该光机模组亮点十足。它支持 4K 和 1080P
    的头像 发表于 02-07 16:21 996次阅读

    高像素分辨率2K(2048*2048)微型显示器--纯振幅液晶型空间光调制器FLCOS

    高像素分辨率2K(2048*2048)微型显示器,具备高分辨率(2048x2048),高填充(>94%),高响应速度(3.6KHz)的特点,适用于半导体外观检测、医学成像、3D光学计
    的头像 发表于 01-23 14:22 1371次阅读
    高像素<b class='flag-5'>分辨率</b>2K(2048*2048)微型显示器--纯振幅液晶型空间光调制器FLCOS

    GD32G5x3系列高分辨率定时器使用指南

    电子发烧友网站提供《GD32G5x3系列高分辨率定时器使用指南.pdf》资料免费下载
    发表于 01-22 17:32 1次下载
    GD32G5x<b class='flag-5'>3</b>系列<b class='flag-5'>高分辨率</b>定时器使用指南

    微型晶体管高分辨率X射线成像

    本文主要介绍微型晶体管高分辨率X射线成像   一种经过升级的X射线可对芯片内部进行3D成像,展现其设计和缺陷。这种方法的分辨率为4纳米,提供的图像非常清晰,可以绘制芯片的布线路径,在不破坏芯片
    的头像 发表于 01-16 11:10 776次阅读
    微型晶体管<b class='flag-5'>高分辨率</b>X射线成像

    光场新科技——12.1英寸2.5K分辨率裸眼3D平板电脑

    在科技日新月异的今天,我们总是期待着那些能够改变生活方式的新产品。而今天,我们非常荣幸地向大家介绍一款颠覆传统视觉体验的创新产品——12.1英寸裸眼3D平板电脑。这款平板电脑不仅拥有2.5K高清分辨率
    的头像 发表于 01-14 10:08 1172次阅读
    光场新科技——12.1英寸2.5K<b class='flag-5'>分辨率</b>裸眼<b class='flag-5'>3D</b>平板电脑

    24位或者说高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率达到很低的uV级别,我们如何考究其精度?而且AD的精度受到诸多因素的影响,其中参考源的稳定度和供电电源的稳定度对精度影响很大,参考源最低0.05%的精度,那么24位的分辨率所可以达到的精度却是要大打折扣的,请问在这样的情况下,24位或者说
    发表于 01-07 06:49