0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能系统VON,生成最逼真3D图像

DPVg_AI_era 来源:lq 2018-12-07 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能合成的3D物体模型不够逼真?谷歌团队最近开发了一个AI系统——视觉对象网络(VON),不仅生成的图像比当前最先进的方法还要逼真,而且还可以做一系列3D操作。

合成现实3D物体模型的人工智能,看上去并没有那么遥不可及。

在2018年蒙特利尔NeurIPS大会上,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和谷歌的研究人员发表了一篇论文,描述了一个能够生成具有逼真纹理的人工智能系统。

论文名称:

Visual Object Networks: Image Generation with Disentangled 3D Representation

论文地址:

https://papers.nips.cc/paper/7297-visual-object-networks-image-generation-with-disentangled-3d-representations.pdf

人工智能系统VON,生成最逼真3D图像

该人工智能系统——视觉对象网络(Visual Object Networks,VON),不仅生成的图像比当前最先进的方法还要逼真,还可以进行形状和纹理编辑、视角转换以及其它3D调整。

研究人员写到:“现代深层生成模型学会了合成较为逼真的图像。大多数计算模型只专注于生成2D图像,忽略了世界是3D的本质。这种2D视角不可避免地限制了它们在许多领域的实际应用,比如合成数据生成、机器人学习、视觉现实和游戏行业。”

VON通过联合合成三维形状和二维图像来解决这个问题,研究人员将其称为“disentangled object representation”。图像生成模型被分解为形状、视点和纹理三个要素,在计算“2.5D”草图和添加纹理之前,首先学习三维形状的合成。

重要的是,因为这三个要素是条件独立的,模型不需要在二维和三维形状之间配对数据。这使得该团队能够对二维图像和三维形状的大规模集合进行训练,比如Pix3D、谷歌图像搜索和ShapeNet,后者包含了55个对象类别的数千个CAD模型。

为了让VON学习如何生成自己的形状,该团队训练了一个生成对抗网络(GAN),试图在上述三维形状数据集上区分生成样本和真实样本。纹理生成被“降级”到另一个基于GAN的神经网络

经过大约两到三天的训练,人工智能系统产生了逼真的128×128×128模型,具有真实的反射率、环境照度和反照率。

为了评估图像生成模型,团队计算了用于生成三维模型的Fréchet初始距离 。此外,他们还向亚马逊的Mechanical Turk上展示了200对由VON和最先进的模型生成的图像,被试者的任务是在每对图像中选择更加真实的结果。

VON的性能表现非常突出。与其它AI模型相比,它的Fréchet初始距离最低。Mechanical Turk被试者更喜欢VON生成的图像,比例高达74%至85%。

研究人员将专注于更加精细化的建模,以更高的分辨率生成形状和图像,将纹理分解为光照和外观,并合成自然场景。

研究团队写道:“我们的关键思想是将图像生成过程分解为三个要素:形状、视角和纹理,这种分离的3D表示方式使我们能够在对抗学习框架下从3D和2D视觉数据收集中学习模型。与现有的2D生成模型相比,我们的模型合成的图像更加逼真;它还允许3D操作,这用以前的2D方法是无法实现的。”

突飞猛进的GAN

近年来,对GAN的研究突飞猛进,尤其是在机器视觉领域:

Google旗下的DeepMind去年10月推出了一个基于GAN的系统,可以创建非常逼真的食物、风景、动物等照片;

今年9月,英伟达的研究人员开发了一种AI模型,可以对脑癌进行合成扫描;

今年8月,卡内基梅隆大学(Carnegie Mellon)的一个研究小组展示了如何利用人工智能将一个人录制下来的动作和面部表情在转移到另一张照片或视频中的目标对象;

最近,爱丁堡大学感知研究所和天文学研究所的科学家设计了一种可以产生高分辨率的星系图像。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266957
  • 3D图像
    +关注

    关注

    0

    文章

    38

    浏览量

    11114

原文标题:谷歌NeurIPS 2018论文:GAN生成3D模型,图像自带逼真效果

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    倍加福基于双目视觉技术的SmartRunner 3D传感器介绍

    当我们迈入自动化的“三维时代”,SmartRunner Explorer 3D不仅能生成清晰的2D图像,还可输出高精度的3D点云数据。
    的头像 发表于 04-08 10:39 332次阅读
    倍加福基于双目视觉技术的SmartRunner <b class='flag-5'>3D</b>传感器介绍

    智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    CAD/Gerber/3D模型导入,提升编程效率与产线集成度;并通过数据闭环管理,实现扫码识别、SPC分析报告自动生成及MES/Q-DAS等系统对接,全面融入智能制造体系。 适合
    发表于 03-31 17:11

    3D系统可视化

    本身的深入描述和F-Theta透镜的应用示例。 光学系统3D-可视化 VirtualLab Fusion提供的工具可以实现光学系统3D可视化,因此可以用于检查元件的位置,以及快速了
    发表于 03-30 09:25

    融合多场耦合效应:生成人工智能技术演进及其在航空发动机复杂工程系统中的赋能机制研究

    人工智能技术正经历着从感知智能生成智能、再向代理智能与物理智能演进的深刻变革。在这一进程中,
    的头像 发表于 02-26 10:07 660次阅读
    融合多场耦合效应:<b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>技术演进及其在航空发动机复杂工程<b class='flag-5'>系统</b>中的赋能机制研究

    突破传统!AI、3D相机与边缘计算打造智能运动系统

    ,一个新的维度变得至关重要:智能。要实现真正智能的运动系统,必须融合三项关键技术:人工智能(AI)、3D相机和边缘计算。三者结合,使机器不仅
    的头像 发表于 10-31 17:02 759次阅读
    突破传统!AI、<b class='flag-5'>3D</b>相机与边缘计算打造<b class='flag-5'>智能</b>运动<b class='flag-5'>系统</b>

    思必驰一鸣智能客服大模型通过生成人工智能服务备案

    近日,江苏网信发布新一批生成人工智能服务备案信息,其中,由思必驰控股子公司驰必准自主研发的一鸣智能客服大模型通过《生成人工智能服务管理暂
    的头像 发表于 09-16 18:08 1351次阅读

    中车斫轮大模型通过国家生成人工智能服务备案

    提供生成人工智能服务的资质,成为我国轨道交通行业及央企高端装备制造业首个通过《生成人工智能服务管理暂行办法》备案的大模型系统,凸显中国中
    的头像 发表于 09-16 09:16 936次阅读

    iTOF技术,多样化的3D视觉应用

    。这些技术与人工智能 (AI) 相结合,正在改变各行各业和人类生活方式的运营范式。 With the proliferation of 3D perception technologies
    发表于 09-05 07:24

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23

    TechWiz LCD 3D应用:FFS仿真

    建模任务 堆栈结构 建模过程 2.1使用TechWiz Layout绘制各层掩模版平面图 2.2创建堆栈结构,并生成3D结构 2.3 使用TechWiz LCD 3D进行各项参数计算 3
    的头像 发表于 07-14 14:08 914次阅读
    TechWiz LCD <b class='flag-5'>3D</b>应用:FFS仿真

    英伦科技10.1英寸裸眼3D数码相框升级了,玩转AI文生图太cool了!

    此次升级将AI内容生成与裸眼3D显示深度结合,解决了传统3D内容制作成本高的痛点,使普通用户也能轻松创作个性化立体图像。配合无线传输、智能
    的头像 发表于 07-03 11:31 13.5w次阅读
    英伦科技10.1英寸裸眼<b class='flag-5'>3D</b>数码相框升级了,玩转AI文生图太cool了!

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个
    的头像 发表于 06-05 09:24 1010次阅读

    生成人工智能认证:重构AI时代的人才培养与职业跃迁路径

    ,恰似一座连接技术前沿与个体成长的桥梁,既承载着时代对人才的迫切需求,也指向着未来职场的核心竞争力。 一、技术革命的双重性:赋能与失衡并存 生成人工智能的突破性,在于其首次让机器具备了“无中生有”的创造力。从文本生成
    的头像 发表于 05-23 09:29 1002次阅读

    NVIDIA助力影眸科技3D生成工具Rodin升级

    。在 NVIDIA Omniverse 平台、OpenUSD 以及 Isaac Lab 解决方案的助力下,影眸科技实现了 Rodin 平台的升级,显著提升了 3D 资产生成的速度、质量与用户体验,推动具身智能进一步发展。
    的头像 发表于 04-27 15:09 1467次阅读