0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 赋能 Cyanpuppets 打造实时 2D 视频生成 3D 骨骼 AI 转换模型

NVIDIA英伟达 来源:未知 2023-04-07 02:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

青色木偶科技 Cyanpuppets致力于 AI 图像算法技术和实时渲染平台工具,是一家以卷积神经网络和深度神经网络算法为核心,打造自研 AI 模型架构、实现虚拟与现实世界驱动协作的 AIGC 技术公司。其自研 CYAN.AI 平台结合 NVIDIA GPU 算力,实现了 2D 视频生成 3D 动作数据,具备三维空间自由人体运动,能够为全球用户提供 AI 无穿戴动作捕捉技术、虚拟社交全身互动技术、3D 动画制作工具与三维空间预演技术。

数字化身的低成本实时驱动

成为一大挑战

游戏开发商 Epic Games 的首席执行官 Tim Sweeney曾提到,“元宇宙将是一种前所未有的大规模参与式媒介,所有用户都可以参与、创造、分享并从中获利,而用户的虚拟数字化身(Avatar)可以自由地在不同平台之间穿梭”。随着 AI 算力和计算机图形渲染技术的蓬勃发展,人类对于自由地在不同数字平台中穿梭,并随时进入虚拟世界的数字化身 Avatar 提出了更高的要求:如何轻便快捷地让数字化身真实地表达人类的动作意愿与情感,并将人类的动作实时迁移至虚拟化身上,成为关键性挑战之一,细分为以下几个具体的问题:

  • 复杂的技术流程

    从面部表情、手指动作到肢体动作,每个模块往往由不同的技术方案构成,数据的同步性与流程的一体化构建面临巨大的技术投入和人力成本挑战。

  • 高昂的捕捉成本

    体验与成本不可兼得,市面上效果较为一般的半身视觉动捕无法满足 Avatar 的技术要求,而较为精准的光学捕捉与惯性捕捉,动辄数十万的投入又使得 Avatar 成本居高不下。较高的成本让普通民众无法参与数字内容体系的建设,也无法享受技术时代带来的新体验。

  • 割裂的数字孤岛

    虚拟化身的骨骼标准难以统一,不同的制作软件、绑定系统和图形渲染引擎会形成割裂的多个数字孤岛,因此不仅每次虚拟化身穿梭到不同平台带来的资产迁移成本很高,而且难以形成一个整体性的虚拟化身世界。

  • 糟糕的捕捉体验

    身上穿戴着复杂且繁重的动作捕捉传感器,使得数字化身的使用体检较为糟糕,长时间穿戴带来的不适感与疲惫感也让元宇宙成为了难以进入的宇宙。

NVIDIA GPU 助力 Cyanpuppets

打造 AI 驱动模型赋能Avatar发展

基于以上问题,Cyanpuppets 选择了 NVIDIA 平台多个产品提供支持,在多张NVIDIA GeForce RTX3080Ti的算力支持下,参考主流 AI 框架 TensorFlow、PyTorch、Caffe 等,对 COCO、ORGBD 等数据集进行长期训练。硬件终端上采用  GeForce RTX 3060 /3070/3080等系列硬件给软件系统带来了稳定性保障和流畅体验感。同时,使用Deep Learning Super Sampling(DLSS)这项 AI 深度学习技术,为用户提供极致的画面渲染效果。

NVIDIA GPU赋能下,CYAN.AI 以 CNN 和 DNN 为底层核心训练了近万小时的数据集,在同步的 2D 视频流中提取人体动作的关键特征做人体姿态识别,追踪人体超过 208 个关键点,结合动力学、生物力学生成人体运动的建模算法,一体化完成面部、表情与肢体共 208 点无穿戴、无标记的高精度捕捉。

CYAN.AI 构建了一个全新的骨骼系统,通过合成数据算法对主流的 Unreal Skeleton Asset、Daz、CC、Unity avatar 和 metahuman 的模型骨骼系统进行匹配映射,让虚拟化身的全身驱动不再是一个个割裂的数字孤岛。

在硬件优化环节,通过对 NVIDIA GPU 算力进行分布式的算力调配,仅需成本数百元的 RGB 摄像头就能获取视频流,进行插值异构即可实现更低延迟的数据信息吞吐与数据画面合成。

结合 NVIDIA GPU 算力支持,算法模型以低至 0.1s 的延迟实现了超低延时的视觉动作捕捉,同时辅助动捕特征平滑算法、图像识别多目协同算法、空间检测、定位算法和重定向算法等多种算法,即使在复杂、狭小且充满干扰物的使用环境中,CYAN.AI 依然可以稳定、高效、高精度地动作捕捉迁移。

AIGC 行业是当前最受关注的人工智能领域之一,算力与算法带来的生产力提升,让每个个体都切实感受到新时代的来临。传统的行业纷纷拥抱 AI 生成科技进行产业升级,从文字生成图片,图片生成视频再到视频生成 3D,这是一个长久进化的趋势,Cyanpuppets 正处于 2D 生成 3D 的关键环节。NVIDIA 提供的 GPU 解决方案,解决了深度学习和机器学习的技术难题,使得我们可以持续不断地创新算法模型,拓宽应用场景,并通过 CYAN.AI 平台为全球不同行业、不同场景的用户搭建虚拟现实协作的桥梁、虚拟化身的实时驱动方案。” 青色木偶科技 Cyanpuppets CEO 李宗兴表示。

NVIDIA 初创加速计划

青色木偶科技 Cyanpuppets是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。

a925a344-d4a8-11ed-bfe3-dac502259ad0.png


原文标题:NVIDIA 赋能 Cyanpuppets 打造实时 2D 视频生成 3D 骨骼 AI 转换模型

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4126

    浏览量

    99775

原文标题:NVIDIA 赋能 Cyanpuppets 打造实时 2D 视频生成 3D 骨骼 AI 转换模型

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伦科技2D/3D可切换显示技术未来应用场景深度解析

    科技推出的2D/3D可切换显示技术,打破了传统显示“非此即彼”的局限——用户无需额外设备,即可在高清2D画质与沉浸式3D体验间一键切换。这不仅是显示技术的升级,更
    的头像 发表于 05-08 16:08 169次阅读
    英伦科技<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>可切换显示技术未来应用场景深度解析

    英伦科技:2D/3D可切换显示技术未来应用场景有哪些?

    首先,第一性原理要求我们回归技术的本质特性:2D/3D可切换显示技术的核心价值在于视觉体验的灵活性与场景适配性,既保留了传统2D显示的清晰、低功耗优势,又能按需切换至3D模式,提供沉浸
    的头像 发表于 05-08 15:44 216次阅读
    英伦科技:<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>可切换显示技术未来应用场景有哪些?

    倍加福基于双目视觉技术的SmartRunner 3D传感器介绍

    当我们迈入自动化的“三维时代”,SmartRunner Explorer 3D不仅能生成清晰的2D图像,还可输出高精度的3D点云数据。
    的头像 发表于 04-08 10:39 438次阅读
    倍加福基于双目视觉技术的SmartRunner <b class='flag-5'>3D</b>传感器介绍

    NVIDIA Jetson模型AI在边缘端落地

    开源生成AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行
    的头像 发表于 03-16 16:27 785次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b><b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>在边缘端落地

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2617次阅读
    <b class='flag-5'>NVIDIA</b>和ComfyUI携手简化本地<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>工作流

    安提国际于NVIDIA GTC 2026展示3D视觉与企业生成AI打造Physical AI落地基石

    【2026年3月12日,台北】全球边缘AI解决方案领先供应商安提国际(AetinaCorporation),将于NVIDIAGTC2026展示高精度3D视觉技术与企业级生成
    的头像 发表于 03-13 11:25 386次阅读
    安提国际于<b class='flag-5'>NVIDIA</b> GTC 2026展示<b class='flag-5'>3D</b>视觉与企业<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>,<b class='flag-5'>打造</b>Physical <b class='flag-5'>AI</b>落地基石

    2D、2.5D3D封装技术的区别与应用解析

    半导体封装技术的发展始终遵循着摩尔定律的延伸与超越。当制程工艺逼近物理极限,先进封装技术成为延续芯片性能提升的关键路径。本文将从技术原理、典型结构和应用场景三个维度,系统剖析2D、2.5D3D封装
    的头像 发表于 01-15 07:40 1470次阅读
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>与<b class='flag-5'>3D</b>封装技术的区别与应用解析

    浅谈2D封装,2.5D封装,3D封装各有什么区别?

    集成电路封装技术从2D3D的演进,是一场从平面铺开到垂直堆叠、从延迟到高效、从低密度到超高集成的革命。以下是这三者的详细分析:
    的头像 发表于 12-03 09:13 1572次阅读

    使用NVIDIA AI Blueprint打造3D世界

    在传统工作流中,建模师必须构建占位模型、低精度资产来填充 3D 场景,优化核心资产以完成场景。之后,可以优化、细化并最终完成视觉效果。
    的头像 发表于 09-23 14:35 1197次阅读

    玩转 KiCad 3D模型的使用

    “  本文将带您学习如何将 3D 模型与封装关联、文件嵌入,讲解 3D 查看器中的光线追踪,以及如何使用 CLI 生成 PCBA 的 3D
    的头像 发表于 09-16 19:21 1.2w次阅读
    玩转 KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    iTOF技术,多样化的3D视觉应用

    视觉传感器对于机器信息获取至关重要,正在从二维(2D)发展到三维(3D),在某些方面模仿并超越人类的视觉能力,从而推动创新应用。3D 视觉解决方案大致分为立体视觉、结构光和飞行时间 (TOF) 技术
    发表于 09-05 07:24

    索尼与VAST达成3D业务合作

    近日,索尼空间现实显示屏与VAST旗下的3D模型Tripo AI正式宣布达成业务合作:双方将围绕裸眼3D显示技术、AI驱动的
    的头像 发表于 08-28 17:32 1843次阅读

    TechWiz LCD 3D应用:局部液晶配向

    我们所说的局部摩擦是指给液晶盒中不同区域(可自定义区域)进行不同的液晶配向,所以也可以称之为局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以对液晶盒设置局部摩擦
    发表于 06-16 08:46

    4K、多模态、长视频AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可
    的头像 发表于 06-16 00:13 7636次阅读

    利用NVIDIA 3D引导生成AI Blueprint控制图像生成

    AI 的图像生成技术突飞猛进,从早期模型生成手指过多的人类图像,到现在
    的头像 发表于 06-05 09:24 1075次阅读