0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于3D场景的神经架构NeRFs

电子工程师 来源:AI科技大本营 作者:AI科技大本营 2022-08-05 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前有DALL.E文本生成图像,现有将文字变成 3D场景。近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D 场景的神经架构 NeRFs,可以根据文字生成 3D 室内场景。

2baa8ad2-146a-11ed-ba43-dac502259ad0.jpg

目前为止,NeRFs 主要用做 3D 模型和 3D 场景的一种神经存储介质,然后可以从不同的相机视角进行渲染。

最新 AI 系统 GAUDI 如果说 NeRFs 从不同角度逼真地渲染图像的能力可以用于生成 AI 呢? 此前,OpenAI 的 DALL-E 2 或 Google 的 Imagen 和 Parti 等 AI 系统展示了 AI 将文本生成图像的潜力,但内容也仅限于 2D 图像和图形。 2021 年末时,谷歌通过 Dream Fields 首次展示了 3D AI 生成系统,将 NeRF 生成 3D 视图的能力与 OpenAI 的 CLIP 评估图像内容的能力相结合。苹果 AI 团队发布的 GAUDI 是一种能够生成沉浸式 3D 场景的神经架构,可以根据文字提示创建 3D 场景。 例如,输入“穿过走廊”或“上楼梯”,就可以看到执行这一动作的 3D 场景视频。

Apple GAUDI 是3D 内饰专家

虽然谷歌致力于使用 Dream Fields 生成单个对象,但将生成 AI 扩展到完全不受约束的 3D 场景仍是一个尚未解决的问题。这背后极有可能的原因之一是摄像机位置的限制。 虽然对于单个对象,每个摄像机位置都可以映射到一个圆顶,但在 3D 场景中,这些摄像机位置会受到对象和墙壁等障碍物的限制。 对于这个问题,GAUDI 模型的解决方案是:相机姿态解码器对可能的相机位置进行预测,并确保输出是 3D 场景架构的有效位置。 场景的场景解码器预测三平面表示,这是一种 3D 画布,辐射场解码器在其上使用体积渲染方程绘制后续图像。 在对四个不同数据集(包括室内扫描数据集 ARKitScences)的实验中,研究人员表明 GAUDI 可以重建学习视图并匹配现有方法的质量。 虽然现在 GAUDI 生成的 3D 场景视频质量还不是很高,但这也说明了 AI 在图像和视频技术这生成的另一种可能。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3032

    浏览量

    115836
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42497
  • AI
    AI
    +关注

    关注

    91

    文章

    42067

    浏览量

    303105

原文标题:苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景

文章出处:【微信号:AI科技大本营,微信公众号:AI科技大本营】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深度解析:被动式偏光3D转换器的核心技术架构与工程应用逻辑

    保证透光效率的同时实现低至2%以下的鬼影率,确保3D画面的锐利度与舒适度 二、系统集成架构:信号同步与亮度管理 2.1 同步信号的获取与处理 偏光转换器必须与投影机的画面输出保持精确同步。标准
    发表于 05-25 10:54

    英伦科技:2D/3D可切换显示技术未来应用场景有哪些?

    首先,第一性原理要求我们回归技术的本质特性:2D/3D可切换显示技术的核心价值在于视觉体验的灵活性与场景适配性,既保留了传统2D显示的清晰、低功耗优势,又能按需切换至
    的头像 发表于 05-08 15:44 219次阅读
    英伦科技:2<b class='flag-5'>D</b>/<b class='flag-5'>3D</b>可切换显示技术未来应用<b class='flag-5'>场景</b>有哪些?

    深度解析3D眼镜电子电路设计难点与实践——YANTOK自主设计方案落地

    深耕3D眼镜电子电路自主研发,针对不同应用场景需求,设计出两款核心产品:YT-SG801RF(基于2.4G射频同步)与YT-SG802D(基于DLP-Link同步)。二者因同步方式不同,在电路
    发表于 04-08 11:21

    3D雷达料位计应用行业有哪些

    锐达3D雷达料位计凭借其抗干扰能力强、测量精度高、适应恶劣工况的核心优势,搭配三维成像与智能数据管理功能,已广泛应用于各类需要对固体物料(或部分特殊液体)料位、体积进行精准监测的行业。其应用场景覆盖
    的头像 发表于 12-29 16:37 514次阅读

    常见3D打印材料介绍及应用场景分析

    3D打印材料种类丰富,不同材料性能差异明显。本文介绍PLA、ABS、PETG等常见3D打印材料的特点与应用场景,帮助读者了解3D打印用什么材料更合适,为选材提供基础参考。
    的头像 发表于 12-29 14:52 1093次阅读
    常见<b class='flag-5'>3D</b>打印材料介绍及应用<b class='flag-5'>场景</b>分析

    简单认识3D SOI集成电路技术

    在半导体技术迈向“后摩尔时代”的进程中,3D集成电路(3D IC)凭借垂直堆叠架构突破平面缩放限制,成为提升性能与功能密度的核心路径。
    的头像 发表于 12-26 15:22 1092次阅读
    简单认识<b class='flag-5'>3D</b> SOI集成电路技术

    图扑软件 3D 场景预加载应用实现

    预加载是在进入正式场景之前提前加载所需模型、材质、图片等资源的技术手段,其核心价值在于消除资源加载等待,确保场景首次渲染即可完整呈现,从而提供无缝、流畅的用户体验。在复杂的 Web 3D 可视化
    的头像 发表于 12-01 16:04 1271次阅读
    图扑软件 <b class='flag-5'>3D</b> <b class='flag-5'>场景</b>预加载应用实现

    微纳尺度的神笔——双光子聚合3D打印 #微纳3D打印

    3D打印
    杨明远
    发布于 :2025年10月25日 13:09:29

    3D封装架构的分类和定义

    3D封装架构主要分为芯片对芯片集成、封装对封装集成和异构集成三大类,分别采用TSV、TCB和混合键合等先进工艺实现高密度互连。
    的头像 发表于 10-16 16:23 2316次阅读
    <b class='flag-5'>3D</b>封装<b class='flag-5'>架构</b>的分类和定义

    玩转 KiCad 3D模型的使用

    “  本文将带您学习如何将 3D 模型与封装关联、文件嵌入,讲解 3D 查看器中的光线追踪,以及如何使用 CLI 生成 PCBA 的 3D 模型。  ”   在日常的 PCB 设计中,我们大部分
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技术,多样化的3D视觉应用

    视觉传感器对于机器信息获取至关重要,正在从二维(2D)发展到三维(3D),在某些方面模仿并超越人类的视觉能力,从而推动创新应用。3D 视觉解决方案大致分为立体视觉、结构光和飞行时间 (TOF) 技术
    发表于 09-05 07:24

    索尼与VAST达成3D业务合作

    与Tripo AI的高精度3D生成能力,打造从内容创作到沉浸式展示的全链路解决方案。此次合作将推动3D技术在展览、零售、教育等场景的普惠化应用,同时也将为元宇宙、工业设计、数字孪生等领域注入新的动能,开启
    的头像 发表于 08-28 17:32 1846次阅读

    AD 3D封装库资料

     AD  PCB 3D封装
    发表于 08-27 16:24 8次下载

    3D打印能用哪些材质?

    3D打印的材质有哪些?不同材料决定了打印效果、强度、用途乃至安全性,本文将介绍目前主流的3D打印材质,帮助你找到最适合自己需求的材料。
    的头像 发表于 07-28 10:58 4573次阅读
    <b class='flag-5'>3D</b>打印能用哪些材质?

    3D AD库文件

    3D库文件
    发表于 05-28 13:57 6次下载