0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Omniverse Audio2Face加速AI虚拟数字人的语音与表情训练

丽台科技 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-15 10:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

元宇宙热潮迭起,推动了虚拟数字人产业发展。当前,随着虚拟人技术日益成熟,相关产业链逐渐成型,以及虚拟人的智能化、多元化应用不断完善,数智人发展逐渐成为行业趋势。

深圳幻影未来信息科技有限公司(以下简称“幻影未来”)专注于虚拟人互动的内容研发,是领先的虚拟人及互动方案、AI 数智人创新提供商。借助NVIDIA Omniverse Audio2Face和NVIDIA RTX GPU,幻影未来加速虚拟人 Kiko 的语音及表情训练,助力打造高品质 AI 数智人。

虚拟人语音互动与表情变化仍需优化

虚拟现实技术的演进和虚拟人行业的逐步发展,带动直播、电商、娱乐行业等逐渐开展虚拟人产业布局。幻影未来从虚拟人直播入手,蓄力将虚拟人 Kiko 打造成虚拟人 IP。由于目前虚拟人主播与观众之间的沟通场景仍需丰富,幻影未来立足技术背景,着力开展虚拟人的技术升级。

利用现有技术,虚拟人主播可实现语音输入输出及相应动画展示,但仍缺乏相应的互动力和表现力,因此,在语音互动和表达的基础上,驱动虚拟人产生丰富而逼真的表情以提升与用户之间的沟通水平、加强虚拟人与用户间的情感交流仍是行业发展的痛点。

Omniverse Audio2Face + RTX GPU

加速虚拟人训练与升级

幻影未来通过 NVIDIA 初创加速计划了解到,借助 NVIDIA Omniverse Audio2Face 可以直接将虚拟人语音转换为嘴型和表情动画,其在使用和测试后,对输出的表情 BS 进行改造并训练自定义模型,同时借助 NVIDIA RTX GPU,加速对虚拟人训练大量数据的交换与处理。

Omniverse Audio2Face 是一款由 AI 提供技术支持的应用,仅凭借一个音频来源便能生成面部表情动画。Audio2Face 可简化 3D 角色的动画制作,与任何配音音轨匹配,在交互式应用场景中可以使用该应用,也可将其用作传统的面部动画创作工具,实时运行结果或烘焙结果都可轻松获得。借助 Omniverse Audio2Face,幻影未来只需录制语音音轨,输入到该应用中,即可生成生动的虚拟人面部表情。

虚拟人模型训练包括数据采集和清洗、数据处理和数据训练,训练过程中数据量庞大,对数据处理能力要求较高,幻影未来借助 RTX GPU,相较于常规硬件训练方法而言,训练时间可缩短至 10 分钟左右,训练速度提高了 99% 以上。

数智人服务场景拓宽

元宇宙基础服务潜力无限

NVIDIA Omniverse Audio2Face 与 NVIDIA GPU 加速平台赋能幻影未来实现虚拟人语音和表情动画升级,使传统虚拟人向数智人的升级成为了可能。幻影未来的虚拟人表现力解决方案助力丰富数智人服务场景,推动了元宇宙基础服务的丰富和发展。

幻影未来创始人兼 CTO 姜龙表示,“未来元宇宙中的应用软件一定不是以 APP 形式展现,也一定不会是需要通过点击操控 UI 的形式出现,我相信未来元宇宙中的所有服务是以数智虚拟人形式出现,通过自然交互的方式来进行,这一天不会太远。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5685

    浏览量

    110111
  • 虚拟数字
    +关注

    关注

    0

    文章

    18

    浏览量

    7240
  • 元宇宙
    +关注

    关注

    13

    文章

    1411

    浏览量

    12765

原文标题:Omniverse Audio2Face 加速 AI 虚拟数字人的语音与表情训练

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技在虚拟数字领域再获国家级权威认可

    近日,国家标准由市场监管总局(国家标准委)批准发布实施《信息技术客服型虚拟数字通用技术要求》(GB/T 46483—2025)。作为虚拟数字
    的头像 发表于 04-13 14:39 380次阅读

    欢迎使用中国香河英茂科工豆包智能体

    分钟 → 生成你的数字 输入文字 → 数字自动口播(同步你的声音) 2. 抖音AI分身(社交
    发表于 02-14 07:22

    商汤科技推出实时语音驱动数字技术SekoTalk

    数字技术蓬勃发展的今天,生成效率仍是行业面临的核心挑战。商汤科技凭借在生成式 AI 与多模态交互领域的深厚积累,推出了实时语音驱动数字
    的头像 发表于 12-17 13:52 582次阅读
    商汤科技推出实时<b class='flag-5'>语音</b>驱动<b class='flag-5'>数字</b><b class='flag-5'>人</b>技术SekoTalk

    NVIDIA开源Audio2Face模型及SDK

    NVIDIA 现已开源 Audio2Face 模型与 SDK,让所有游戏和 3D 应用开发者都可以构建并部署带有先进动画的高精度角色。NVIDIA 开源 Audio2Face训练框架,任何人都可以针对特定用例对现有模型进行微
    的头像 发表于 10-21 11:11 1008次阅读
    NVIDIA开源<b class='flag-5'>Audio2Face</b>模型及SDK

    【启扬方案】基于启扬RK3588的移动AI数字,助力智能交互新体验

    的NPU/AI加速模块,高效执行深度学习模型(如自然语言处理、计算机视觉、语音识别等)的推理任务。2.丰富的接口与扩展性,便于数据采集以及其他功能的实现。3.高刷新,高
    的头像 发表于 10-16 17:29 1363次阅读
    【启扬方案】基于启扬RK3588的移动<b class='flag-5'>AI</b><b class='flag-5'>数字</b><b class='flag-5'>人</b>,助力智能交互新体验

    NVIDIA三台计算机解决方案如何协同助力机器技术

    NVIDIA DGX、基于 NVIDIA RTX PRO 服务器的 Omniverse 和 Cosmos,以及 Jetson AGX Thor,正全面加速从人形机器到机器人工厂等基于物理 A
    的头像 发表于 08-27 11:48 2597次阅读

    再掀语音交互革命,广和通AI解决方案加速机器听觉进化

    在机器人世界里,感知是智能化的第一步,是机器获取环境信息,学习适应并自主决策的前提。听觉作为五感之一,深度融合AI,可帮助机器实现高效感知、数据获取、语音交互和环境事件检测,使机器
    的头像 发表于 08-26 17:44 1034次阅读

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,为机器领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型及 AI 计算基础设施,为机器领域开启新篇章   · 全新 NVIDIA
    的头像 发表于 08-12 11:29 1987次阅读
    NVIDIA通过全新 <b class='flag-5'>Omniverse</b>库、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b>计算基础设施,为机器<b class='flag-5'>人</b>领域开启新篇章

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业级AI模型加速开发 Cognizant是数据与AI模型训练
    的头像 发表于 07-31 17:25 812次阅读

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    NVIDIA扩展适用于AI工厂数字孪生的Omniverse Blueprint

    NVIDIA 宣布大幅扩展适用于 AI 工厂数字孪生的 Omniverse Blueprint,为工程团队提供更多 AI 工厂构建工具,目前已作为预览版推出。
    的头像 发表于 05-22 09:48 1246次阅读

    OBOO鸥柏丨AI数字触摸屏查询触控人脸识别语音交互一体机上市

    OBOO鸥柏丨AI数字触摸屏查询触控人脸识别语音交互一体机上市分析OBOO鸥柏品牌推出的AI数字
    的头像 发表于 05-21 20:22 1663次阅读
    OBOO鸥柏丨<b class='flag-5'>AI</b><b class='flag-5'>数字</b><b class='flag-5'>人</b>触摸屏查询触控人脸识别<b class='flag-5'>语音</b>交互一体机上市

    洞悉Omniverse:如何实现工业设施数字孪生中的机器人机群仿真

    Omniverse Blueprint 帮助实现工业设施数字孪生中的机器人机群仿真。 工业 AI 和物理 AI 能够简化工作流,企业纷纷开始探寻这两项技术最有效的使用方式。 企业在工
    的头像 发表于 05-11 16:46 1609次阅读
    洞悉<b class='flag-5'>Omniverse</b>:如何实现工业设施<b class='flag-5'>数字</b>孪生中的机器人机群仿真

    海思SD3403边缘计算AI数据训练概述

    AI数据训练:基于用户特定应用场景,用户采集照片或视频,通过AI数据训练工程师**(用户公司****员工)** ,进行特征标定后,将标定好的训练
    发表于 04-28 11:11

    大象机器携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    集成于同一硬件平台。内置RISC-V AI核,接入ONNXRuntime加速框架,可快速部署Transformer、CNN等主流算法,实现视觉跟踪、语音交互与自主决策的一体化应用。 低门槛开发 提供
    发表于 04-25 17:59