0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发明的由2D图像生成3D图像技术解析

我快闭嘴 来源:爱集微 作者:嘉德IPR 2020-12-24 12:55 次阅读

谷歌发明的由2D图像生成3D图像的技术,利用3D估计神经网络图像信息的补全以及预测,融合了拍摄角度、光照等信息,让生成的3D图像看起来更加逼真,这种技术对于三维建模以及工业应用都具有极大的指导意义。

谷歌研究人员制作的一个AI工具,可以把涂鸦变成奇怪的怪物。这款工具名为Chimera Painter,使用机器学习来根据用户的粗略草图生成图像。

Chimera Painter背后的团队在一篇博客文章中解释了他们的方法和动机,称他们的想法是创造一种 “画笔,它的行为不像工具,而更像助手”。Chimera Painter只是一个原型,但如果这样的软件变得普遍,它可以减少创造高质量艺术所需的时间。

这种图像生成技术,其实在三维渲染方面有着非常广泛的应用,其中最具有代表性的工作之一,就是由2D图像生成3D图像。我们知道,3D图像相比于2D图像多了深度信息这一个维度,但也就是这一个差别,导致了3D图像相比于2D图像所多出的信息不是一星半点。因此,倘若想要从2D图像生成3D图像,其难度之大可想而知。

为此,谷歌在18年10月18日申请了一项名为“通过渲染许多3D视图来学习重构3D形状”的发明专利(申请号:201880030823.5),申请人为谷歌有限责任公司

根据该专利目前公开的资料,让我们一起来看看这项从2D图像到3D图像的生成方法吧。

谷歌发明的由2D图像生成3D图像技术解析

该技术中,主要使用了3D估计器神经网络,如上图,为使用3D估计器神经网络来估计图像中描绘的面部的3D形状和纹理,并基于估计的3D形状和纹理生成替身的系统示意图。用户通过上传面部图像105,系统100可以对照片进行处理后生成替身115,这里所说的替身也就是用户的3D画像。

在具体的过程中,照片首先由面部识别引擎110进行处理,从而生成用户的面部图像特征112,该特征在3D估计神经网络中被处理,基于图像特征估计照片中描绘的用户面部的3D形状和纹理,从而生成形状纹理数据122。

最后,数据122被发送到3D渲染引擎130中,基于用户独特的面部形状、纹理特征来生成用户的3D画像,并且为了做到更加真实,渲染引擎可以给出特定的视图,视图中融合了相机角度、光照以及视场的估计信息,可以让生成的图像质量更加逼真。

谷歌发明的由2D图像生成3D图像技术解析

如上图,为用于用户3D渲染图像生成的3D估计器神经网络220的系统框图,整个系统的结构还是相当复杂的,从图中我们可以看到这种神经网络是如何工作的。根据目前的技术来看,训练3D估计器神经网络通常有两个困难:第一,由3D对象的图像和那些3D对象的3D形状和纹理组成的训练对通常是有限的并且难以获得;第二,训练3D估计器神经网络可能经常导致3D估计器神经网络的网络欺骗。

因此,该专利发明的整个网络分为了监督训练回路以及无监督训练回路,通过二者相结合的方式,在完全训练阶段期间,仅利用无监督训练回路,从而允许估计神经网络输出更快地收敛。

因为无监督训练回路可以在预训练阶段和完全训练阶段两者期间使用,所以从无监督训练回路开始,在预训练之后,完全训练可以对大量迭代和大量样本单独利用无监督训练回路,来改进3D估计神经网络估计图像中的对象的3D形状和纹理的能力。

谷歌发明的由2D图像生成3D图像技术解析

最后,是这种无监督训练回路训练的流程图,系统首先需要获取对象图像的第一图像特征,该特征就是上述所说用户面部信息的原始数据,其次,将这种第一图像特征提供给3D估计器神经网络并获取3D形状和纹理。

根据这些形状和纹理进行3D渲染,并从多个3D视图中导出第二图像特征,基于图像特征的损失函数计算损失,以知道神经网络进行反向传播以得到更加良好的效果以及减少图像生成的损失。

以上就是谷歌发明的利用2D图像生成3D图像的专利技术,从2D到3D图像的转换过程中,由于2D图像缺少了很多信息,因此该技术利用3D估计神经网络进行信息的补全以及预测,并融合了拍摄角度、光照等信息,让生成的3D图像看起来更加逼真,这种技术对于三维建模以及工业应用都具有极大的指导意义。

关于嘉德

深圳市嘉德知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2755

    浏览量

    106441
  • 谷歌
    +关注

    关注

    27

    文章

    5849

    浏览量

    103246
  • 神经网络
    +关注

    关注

    42

    文章

    4570

    浏览量

    98709
收藏 人收藏

    评论

    相关推荐

    ad19中3d模型不显示?

    封装库导入3d模型不显示,但导入3d模型后的封装库生成pcb文件时显示3d模型,这是什么原因导致的。
    发表于 04-24 13:41

    头盔3D扫描逆向工程3d建模抄数测绘服务-CASAIM中科广电

    3D扫描
    中科院广州电子
    发布于 :2024年04月12日 14:03:01

    包含具有多种类型信息的3D模型

    项目阶段集成在一起。同时,还提供易于使用的数据交换,可在2D3D工作方法之间快速切换,以提供具有程序精度的高质量信息。 其他常用于支持建筑信息建模的相关平台 Autodesk
    发表于 03-28 17:18

    3D动画原理:电阻

    电阻3D
    深圳崧皓电子
    发布于 :2024年03月19日 06:49:19

    将MLX75027 3D图像传感器与CX3 RDK MIPI开发板连接后报错如何解决?

    我们打算将MLX75027 3D图像传感器与CX3 RDK MIPI开发板连接,但EZ-USB-suite软件中配置MIPI块参数中针对的是2D图像
    发表于 02-28 07:41

    友思特C系列3D相机:实时3D点云图像

    3D相机
    虹科光电
    发布于 :2024年01月10日 17:39:25

    使用Python从2D图像进行3D重建过程详解

    有许多不同的方法和算法可用于从2D图像执行3D重建。选择的方法取决于诸如输入图像的质量、摄像机校准信息的可用性以及重建的期望准确性和速度等因素。
    的头像 发表于 12-05 14:07 641次阅读
    使用Python从<b class='flag-5'>2D</b><b class='flag-5'>图像</b>进行<b class='flag-5'>3D</b>重建过程详解

    光学3D表面轮廓仪可以测金属吗?

    测量金属制品的长度、宽度、高度等维度参数。 除了测量金属表面的形状和轮廓外,光学3D表面轮廓仪还可以生成三维点云数据和色彩图像,用于进一步分析和展示: 1、三维点云数据可以用于进行CAD模型比对、工艺
    发表于 08-21 13:41

    实时3D艺术最佳实践-纹理技术解读

    纹理贴图获取2D曲面图像并将其映射到3D多边形上。 本指南涵盖了几种纹理优化,可以帮助您的游戏运行得更流畅、看起来更好。 在本指南的最后,您可以检查您的知识。您将了解有关主题,包括纹理图谱
    发表于 08-02 06:12

    基于扩散模型的图像生成过程

    等很难用文本指定。   最近,谷歌发布了MediaPipe Diffusion插件,可以在移动设备上运行「可控文本到图像生成」的低成本解决方案,支持现有的预训练扩散模型及其低秩自适应(LoRA)变体 背景知识 基于扩散模型的
    的头像 发表于 07-17 11:00 2095次阅读
    基于扩散模型的<b class='flag-5'>图像</b><b class='flag-5'>生成</b>过程

    低成本3D扫描仪机械部分设计中。#3d打印 #3d扫描 #3d建模 #3d #fusion

    3D扫描仪
    学习电子知识
    发布于 :2023年07月03日 20:13:56

    虹软图像深度恢复技术生成式AI的创新 生成式AI助力

    当前,生成式人工智能(AI)技术的快速发展令人瞩目。它能够理解人类的描述,并在短时间内生成逼真的图像和视频。在生成式AI的应用中,
    发表于 06-21 09:06 299次阅读

    3D扫描进度更新,在等快递。还有准备3D打印。#3d建模 #3d扫描 #三维扫描 #3d设计 #创客

    3D打印机3D打印
    学习电子知识
    发布于 :2023年05月28日 20:54:11

    3d打印机已经满足不了我了 #车床 #铣床 #3d打印 #物联网 #3d

    3D打印机3D打印
    学习电子知识
    发布于 :2023年05月28日 20:53:32

    视觉处理,2d照片转3d模型

    首先,太阳高度是恒定的。 照片每像素的亮度可求。我们只需要求出太阳与眼睛到物体的夹角就能求出3d模型。 最多就是各种物质的反射率。 英伟达的oir芯片就是做汽车视觉的,大家去取取经。 有时,2-3张位置不同的照片,可以快速生成
    发表于 05-21 17:13