0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepFocus,基于AI实现更逼真的VR图像

LiveVideoStack 来源:刘林华 作者:电子发烧友 2018-12-29 15:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepFocus是一种基于AI的渲染系统,用于在VR中渲染自然逼真的人眼聚焦效果。本文来自Facebook工程博客,LiveVideoStack进行了翻译。感谢阿里巴巴高级算法专家盛骁杰提供的技术审校。

研究内容:

一种新的基于AI的框架,用于在VR中渲染自然逼真的人眼聚焦效果。DeepFocus可与高级原型头盔配合使用,在不同的焦距实时渲染模糊效果。例如,当有人戴着支持DeepFocus的设备观看附近的一个物体时,它会立即聚焦并变得清晰,而背景物体则会像在现实生活中一样,呈现出失焦模糊效果。这种失焦模糊(也称为视网膜模糊)对于实现VR中的真实感和深度感知非常重要。DeepFocus是第一个能够为VR应用程序实时产生这种效果的系统。我们现在开放我们的工作和数据集,以帮助VR研究界的其他人。

它是如何运作的:

一些传统方法,例如使用累积缓冲算法(accumulation buffer),可以实现物理上精确的失焦模糊。但它们无法实时生成复杂,丰富的内容,因为这种处理,即使是对于最先进的芯片,要求也太高了。与此不同的是,我们使用深度学习解决了这个问题。我们开发了一种新颖的端到端卷积神经网络,一旦眼睛看到场景的不同部分,就会产生具有精确视网膜模糊的图像。该网络包括新的保持体积的交织层,以减少输入的空间维度,同时充分保留图像细节。然后,网络的卷积层运行在相同的,降低了的空间分辨率上,从而运行时间能够明显减少。

为什么重要:

随着对新型VR头显技术的研究不断深入,DeepFocus将能够模拟精确的视网膜模糊,从而产生非常逼真的视觉效果。该平台还表明AI可以帮助解决VR渲染高度计算密集型视觉效果的挑战。DeepFocus为克服未来新型显示系统的实际渲染和优化限制提供了基础。

由于DeepFocus仅依赖于标准RGB-D颜色和深度输入,因此它几乎适用于所有现有的VR游戏和应用程序。它还兼容VR研究界目前正在探索的所有三种头显类型,分别是:变焦显示器(如Half Dome),多焦点显示器(例如,FRL先前的工作)和光场显示器。

详细了解Facebook Reality Labs如何创建DeepFocus。

(https://www.oculus.com/blog/introducing-deepfocus-the-ai-rendering-system-powering-half-dome/)

阅读完整的论文:

DeepFocus:用于计算显示的学习图像合成

(https://research.fb.com/publications/deepfocus-siggraph-asia-2018/)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296679
  • vr
    vr
    +关注

    关注

    34

    文章

    9692

    浏览量

    156596

原文标题:DeepFocus,基于AI实现更逼真的VR图像

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新唐科技基于端侧AI MCU M55M1的智慧门禁解决方案介绍

    针对上述痛点,新唐科技推出基于端侧AI MCU M55M1的智慧门禁解决方案,通过本地AI算力、无联网设计及图像识别技术,实现安全、高效的
    的头像 发表于 11-25 07:43 9513次阅读
    新唐科技基于端侧<b class='flag-5'>AI</b> MCU M55M1的智慧门禁解决方案介绍

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    21世纪是生命科学的世纪,生物技术的潜力将比电子技术更深远----- 里卡多-戈蒂尔 半导体实现AI应该没什么疑问了吧?化学、生物怎么实现AI呢? 生物大脑是一个由无数神经元通过突触连
    发表于 09-15 17:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    AI的应用多种多样。比如:DALL-E2、Midjourney、Stable Diffusion等,不仅包括对话功能,还包括生成图像、视频、语音和程序代码等功能。 竟然连代码都可以生成,会取代程序员
    发表于 09-12 16:07

    使用OpenUSD和SimReady资产构建AI工厂

    设计。工程团队现在可以在逼真的虚拟世界中设计和测试整个 AI 工厂,帮助他们及早发现问题,从而构建智能、更可靠的设施。
    的头像 发表于 09-06 15:23 1182次阅读
    使用OpenUSD和SimReady资产构建<b class='flag-5'>AI</b>工厂

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    ,其中第一章是概论,主要介绍大模型浪潮下AI芯片的需求与挑战。第二章和第三章分别介绍实现深度学习AI芯片的创新方法和架构。以及一些新型的算法和思路。第四章是全面介绍半导体芯产业的前沿技术,包括新型晶体管
    发表于 09-05 15:10

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    能够有效捕捉AI生成图像与真实手绘扫描图像在纹理、笔触、光影、全局一致性等方面的细微差异。 边缘端部署:将模型量化、编译,最终高效运行在算力有限的MaixCAM-Pro开发板上。 实时推理:
    发表于 08-21 13:59

    AI开启逼真的游戏时代

    ,电子游戏正在借助人工智能创造出越来越逼真的场景和交互体验。GPU不再仅仅局限于图形渲染,如今已广泛应用于多种AI任务,包括生成真实的非玩家角色(NPC)、动态世界、个
    的头像 发表于 08-20 11:22 993次阅读
    <b class='flag-5'>AI</b>开启<b class='flag-5'>更</b><b class='flag-5'>逼真的</b>游戏时代

    NVIDIA RTX PRO 4500 Blackwell产品特性

    AI 浪潮正席卷全球,驱动着各行各业的深刻变革。面对生成式 AI 的创意爆发、实时仿真的复杂需求以及逼真渲染的品质追求,企业亟需强大的工具来拥抱这股变革力量。
    的头像 发表于 08-05 16:39 1812次阅读
    NVIDIA RTX PRO 4500 Blackwell产品特性

    大朋VR AI眼镜预发布,从 VR 领航者到 AI 穿戴开拓者

    在6月30日举办的恺英网络「BeyondGaming」主题发布会上,智能穿戴领域的老牌厂商DPVR(大朋VR)线上预发布全新DPVRAIGlasses产品,正式宣告进军AI穿戴新赛道。此次与恺英网络
    的头像 发表于 07-01 16:13 689次阅读
    大朋<b class='flag-5'>VR</b> <b class='flag-5'>AI</b>眼镜预发布,从 <b class='flag-5'>VR</b> 领航者到 <b class='flag-5'>AI</b> 穿戴开拓者

    利用NVIDIA 3D引导生成式AI Blueprint控制图像生成

    AI 赋能的图像生成技术突飞猛进,从早期模型会生成手指过多的人类图像,到现在能创造出令人惊叹的逼真视觉效果。即使取得了如此飞跃,仍然存在一个挑战:
    的头像 发表于 06-05 09:24 737次阅读

    SC1200IOT 思特威推出1200万像素AI眼镜应用CMOS图像传感器

    近日,技术先进的CMOS图像传感器供应商思特威(SmartSens,股票代码688213),全新推出1200万像素 AI眼镜 应用CMOS图像传感器—— SC1200IOT 。产品基于思特威先进
    的头像 发表于 05-08 18:15 3874次阅读
    SC1200IOT 思特威推出1200万像素<b class='flag-5'>AI</b>眼镜应用CMOS<b class='flag-5'>图像</b>传感器

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    正式提出“智能体化用户体验”方向,并启动“天玑智能体化体验领航计划”。值得注意的是,其三大AI工具链的发布——天玑开发工具集、AI开发套件2.0,以及升级的天玑星速引擎与旗舰芯片天玑9400+,标志着联发
    发表于 04-13 19:52

    AI Agent应用与项目实战》阅读体验--跟着迪哥学Agent

    的知识是自由行,那么阅读《Agent》就是跟团游。它让我对AI落地应用有了系统和清晰的了解。 《Agent》第一章是全书的导引章节,本章让我对Agent的理解从模糊到清晰,然后逐一介绍Agent框架
    发表于 03-02 12:28

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    的 WiFi5 音视频 SoC 模组。RK3566 芯片框图 功能特点 这款 AI 眼镜,绝非仅仅是一款冰冷的科技设备,它拥有以下功能:· AI 大模型语音对话· 图像拍照(上传手机 /p2p
    发表于 02-20 18:44

    基于FPGA实现图像直方图设计

    直方图统计的原理 直方图统计从数学上来说,是对图像中的像素点进行统计。图像直方图统计常用于统计灰度图像,表示图像中各个灰度级出现的次数或者概率。统计直方图的
    的头像 发表于 12-24 10:24 1205次阅读
    基于FPGA<b class='flag-5'>实现</b><b class='flag-5'>图像</b>直方图设计