0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

能创造出有逼真纹理和形状的一个生成式AI系统

电子工程师 来源:lq 2018-12-06 10:17 次阅读

AI 生成逼真三维物体模型并不像人们以为的那么困难。

近日,在 NeurIPS 2018 会议上接收的论文“视觉对象网络:图像生成与分离式的3D表示”中,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和 Google 的研究人员介绍了能创造出有逼真纹理和形状的一个生成式 AI 系统。

该系统是视觉对象网络(VON)系统,不仅可以生成比某些最先进的方法更真实的图像,还可以进行形状和纹理编辑、视点转换以及其他三维调整。

“现代深层生成模型学会了合成逼真的图像,”研究人员写道,“但大多数计算模型只专注于生成 2D 图像,而忽略了 3D 世界的美好......这种视角不可避免地限制了它们在许多领域的实际应用,例如合成数据生成、机器人学习、虚拟现实和游戏行业。”

视觉对象网络系统则可以通过合成三维形状和二维图像来解决这个问题,类似于研究人员所称的“分离式的对象表示”。图像生成模型被分解为三种因素:形状、视点和纹理,另外,在计算“2.5 D”草图和添加纹理之前,它需要学习合成三维形状。

重要的是,由于这三个因素是条件独立的,所以模型不需要二维和三维形状之间的配对数据。这使得团队能够在大规模的二维图像和三维形状集上进行训练,如 Pix3D,Google 图像搜索和ShapeNet,后者包含 55 个对象类别的数千个 CAD 模型。

为了让 VON 系统学习如何生成自己的形状,该团队在上述三维形状数据集上训练了一个生成式对抗网络(GAN) 。而纹理生成被归类了到另一个基于 GAN 的神经网络

经过大约两到三天的训练,AI 系统始终如一地生成了令人信服的 128 x 128 x 128 模型,具有优异的反射率、环境照明和反照率(一种漫射光的度量)。

为了评估图像生成模型,团队计算了用于生成三维模型的 Fréchet Inception Distance(弗雷歇初始距离,FID)——一种与人类感知相关的度量。此外,他们还向亚马逊 Mechanical Turk 上的五名测试者展示了由 VON 和其他最先进模型生成的 200 对图像,这些受试者需要在这些图像中选择更真实的结果。

VON 的表现非常出色。它与所有 AI 模型相比具有最低的 FID 值,并且 Mechanical Turk 的受访者表示更喜欢 VON 生成的 74% 到 85%的图像。

研究人员未来将专注于从粗糙到精细化的建模,以产生更高分辨率的生成形状和图像,并将纹理分解为光照和外观(lighting and appearance),并合成自然场景。

“我们的主要想法是将图像生成过程分解为形状、视点和纹理三种因素,”Google 团队写道,“这种分离式 3D 表示使我们能够在对抗学习框架下从 3D 和 2D 视觉数据集合中学习模型。与现有的 2D 生成模型相比,我们的模型合成了更逼真的图像,它还可以做到以前的 2D 方法也无法实现的各种 3D 操作。”

近年来,GAN 的研究突飞猛进,特别是在机器视觉领域。

Google 的 DeepMind 子公司在 10 月推出了一个基于 GAN 的系统,以此创建出令人信服的食物、风景、肖像和动物照片。9 月,Nvidia 的研究人员开发了一种 AI 模型,可以生成脑癌的合成扫描图像,8 月,卡内基梅隆大学的一个团队演示了 AI 可以将人们已存的动作和面部表情转换成另一张照片或视频中的目标对象。最近,爱丁堡大学感知研究所和天文学研究所的科学家设计了一种至少可以产生高分辨率星系图像的 GAN。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1777

    文章

    43920

    浏览量

    230870
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1767

    浏览量

    68169
  • 计算机科学
    +关注

    关注

    1

    文章

    140

    浏览量

    11242
  • 生成式AI
    +关注

    关注

    0

    文章

    357

    浏览量

    232

原文标题:AI做不了“真”3D图像?试试Google的新生成模型

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA生成AI研究实现在1秒内生成3D形状

    NVIDIA 研究人员使 LATTE3D (一款最新文本转 3D 生成AI 模型)实现双倍加速。
    的头像 发表于 03-27 10:28 169次阅读
    NVIDIA<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>研究实现在1秒内<b class='flag-5'>生成</b>3D<b class='flag-5'>形状</b>

    字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces热榜

    生成AI 正凭借其根据文本提示(text prompts)创造出惊艳图像乃至视频的能力,赢得全球的瞩目。
    的头像 发表于 02-26 13:47 333次阅读
    字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces热榜

    第一拨靠Sora赚钱的人已经出现

    随着OpenAI最新发布的人工智能文生视频大模型Sora的问世,科技与创意产业再掀热潮。据悉,Sora不仅能根据文字说明创造出逼真且富有想象力的场景,更因其强大的生成能力引发了市场与消费者的极大兴趣。
    的头像 发表于 02-22 14:05 329次阅读

    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用生成AI 进行交互式纹理绘制

    复杂且不重复的纹理。 该原型展示了 AI 如何像艺术家手中的画笔一样“挥洒自如”,而不是只能依靠高级用户的指导才能生成完整的结果。它通过在交互中添加局部细节,实现无限的纹理变化和
    的头像 发表于 12-26 18:05 277次阅读
    NVIDIA Research 在 SIGGRAPH Asia 中展示如何使用<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 进行交互式<b class='flag-5'>纹理</b>绘制

    驾驭创造的力量: 生成AI 时代的 MLOps 演进

    以下文章来源于谷歌云服务,作者 Google Cloud 驾驭创造的力量: 生成式 AI 时代的 MLOps 演进  MLOps 是一种将机器学习模型从实验室推向生产的系统方法,它能够
    的头像 发表于 12-21 18:05 173次阅读

    生成AI技术的应用前景

    生成AI(人工智能)与我们熟知的 AI 有何不同?这篇文章将为我们一探究竟!
    的头像 发表于 11-29 12:20 707次阅读

    APUS李涛:构建AI生态,让大模型应用与价值创造接轨

    峰会中围绕“AI向新 智领未来”主题,解析了大模型如何引领产业变革,创造价值并推动社会进步,创造性地提出了AI大模型价值创造“六要素”观点。
    的头像 发表于 10-25 09:53 235次阅读
    APUS李涛:构建<b class='flag-5'>AI</b>生态,让大模型应用与价值<b class='flag-5'>创造</b>接轨

    生成AI如何帮助创建和编辑逼真的材质?

    这项研究的演示现身 SIGGRAPH 展会 Real-Time Live 活动,展示了艺术家如何利用文本或图像提示来更快地生成织物、木材和石材等自定义纹理材质,同时对创作进行更加
    的头像 发表于 09-01 15:36 527次阅读

    虚幻引擎的纹理最佳实践

    纹理是游戏不可或缺的部分。 这是艺术家可以直接控制的领域,以提高游戏的性能。 本最佳实践指南介绍了几种纹理优化,这些优化可以帮助您的游
    发表于 08-28 06:39

    SIGGRAPH 2023 | 贴图帮手:NVIDIA Research 展示生成AI 如何帮助创建和编辑逼真的材质

    研究人员展示能够快速创建和编辑材质的 AI 技术,助力加速 3D 工作流。 在 SIGGRAPH 上,NVIDIA 的研究人员展示了一种可以帮助艺术家快速创建和迭代 3D 场景材质的生成AI
    的头像 发表于 08-10 20:15 415次阅读

    通过 NVIDIA RTX 为建筑项目打造逼真渲染和 4D 序列

    Layton Construction 使用 RTX Ada 架构 GPU 改进可视化工作流,为建筑项目各个阶段创造出逼真的渲染和动画。 近日,Layton Construction 在一个码头
    的头像 发表于 07-05 18:15 304次阅读
    通过 NVIDIA RTX 为建筑项目打造<b class='flag-5'>逼真</b>渲染和 4D 序列

    英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图

    、游戏、建筑和设计在内的许多行业。 “ 生成AI技术旨在提高和增强人类创造力,并节省时间。然而,目前的大部分生成AI模型仅限于
    的头像 发表于 06-30 19:50 239次阅读

    虹软图像深度恢复技术与生成AI的创新 生成AI助力

    更加逼真,增加层次感。在这方面,虹软的图像深度恢复技术一直保持着领先,在整个行业被广泛认可。虹软技术出色的性能赋予了生成AI更高质量、更具深度感的图像生成能力,为
    发表于 06-21 09:06 311次阅读

    国产生成AI,不能仅仅看向前方#生成AI #信息无障碍

    AI
    脑极体
    发布于 :2023年06月15日 19:06:36

    什么是生成AI生成AI的四大优势

    生成AI是一种特定类型的AI,专注于生成新内容,如文本、图像和音乐。这些系统在大型数据集上进行训练,并使用机器学习算法
    发表于 05-29 14:12 2818次阅读