0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

NVIDIA英伟达 来源:未知 2023-07-11 23:10 次阅读

中科深智成立于 2016 年,是一家专注于端到端生成式 AI 虚拟人技术的公司,从底层自研的大语言模型、动作和表情生成算法模型以及 3D 自动建模,到 Motionverse 虚拟人业务中台,再到 3D 生成式 AI 产品和应用层。中科深智除了为生态合作伙伴提供 AI 虚拟人 API 外,还开发了一系列 3D 生成式 AI 产品,包括超写实虚拟人生成系统 Anyhuman、元宇宙电商和虚拟人直播工具百宝箱自动播、AI 快速动画生成系统自动画、虚拟人实时交互和应答系统云小七等。

传统 NPC 人机交互

生硬且成本高昂

在动作和表情方面,传统 NPC 因为无法获取用户的画面信息和语音信息,也就无法做出实时的反馈,动作和语音的呈现皆靠预设,所谓的人机交互其实非常的刻板和生硬。

在文字和语音的对话能力方面,大语言模型的出现赋予了 NPC 实时对话的能力。但无论是何种大语言模型的诞生,都经历了数据清洗、预训练、指令微调、测试、合规、部署和应用接口开发等环节,这些环节此前是彼此分散的,而并非一体化的,这也意味着每两个环节之间都需要进行大量的人工处理和匹配部署,这本质上是对人力成本和时间成本的浪费,亟需一种更加省时和高效的解决方案。

NVIDIA 赋能游戏 NPC

实现智能化互动

中科深智的虚拟人实时交互和应答系统云小七可以支持智能 NPC 的批量化生产,提升游戏开发效率。云小七基于生成式 AI 的设计,可以通过将 NPC 赋予如形象、声音、性格特征、背景等特定的人设来与游戏内容进行有机融合。此外,云小七还能够在不需要编写复杂脚本的情况下,让 NPC 与游戏玩家进行顺畅的文字、语音、动作、表情等多模态的实时互动。这将为游戏开发商带来更有力的支持,同时也为玩家提供更加生动、真实的游戏体验。云小七的核心能力之一还包括中科深智自研实现的 CLAP 大模型算法,这种算法可以实现对于语音、语义以及外部环境输入的实时反馈,从而输出动作和表情等,使得 NPC 具有更加生动的表现能力。

NVIDIA Omniverse 中的 Audio2Face 可以辅助云小七实现音频输入的面部输出,通过预训练的深度神经网络、调整角色网格的 3D 顶点等方式,快速实现表情切换。通过利用 NVIDIA Maxine 对于音频和视频通信方面进行优化,即使用户使用普通的麦克风和摄像头,NPC 也能监测到他们的行为并且产生反馈,与玩家实现实时互动。

此外,云小七底层的文字对话能力来自于中科深智今年 5 月推出的自有大语言模型 GenSense 数智姜尚。数智姜尚是国内商用大模型在轻量化领域内的重要尝试,是针对垂直领域和虚拟人端到端应用而专门设计的大语言模型,可成为虚拟人的“大脑”,为其提供实时互动的能力支撑。数智姜尚采用了先进的优化技术,轻巧便利且占用资源极少,可为用户提供流畅的使用体验。配合 NVIDIA GPU,数智姜尚能够以高性能运行并展现出色的表现。其次,数智姜尚的部署和定制非常简便,可以轻松集成到现有的企业工作流中,为用户提供个性化和智能化的解决方案,同时实现快速的模型训练和应用部署。

NVIDIA NeMo 在数智姜尚的训练过程中提供了低门槛、经济、高效的帮助。

首先,NVIDIA NeMo 帮助解决了训练全流程的问题,包括数据清洗、预训练和指令微调,以及测试、合规、部署和应用接口开发等。在此之前,这需要多个架构才能完成,因此极大的提高了自有模型的开发效率。

同时,NVIDIA NeMo 还提供了大量的、可应用于多个不同场景的预训练模型。选择 NVIDIA 已经训练好的模型,能够大幅缩短微调和再训练的时间,也帮助扩充了中科深智自身大模型数智姜尚的适应性。NeMo 本身的 ASR/TTS 也直接带来了自然交互工具,无需借助第三方,从而加速了数智姜尚的开发和交付。

此外,通过使用 NVIDIA 提供的 NeMo Guardrails 工具,中科深智还高效解决了对话式 AI 合规性和安全性的风险。通过 NeMo Guardrails 为对话设置响应的范围和边界,使数智姜尚的回答范围仅限于适当的主题并仅提供必要的信息,能够限制 AI 只与已确认安全的第三方应用程序建立联系。

NVIDIA 助力中科深智

加速AI 对话数字人建设

中科深智联合创始人兼 CTO 宋健说:“中科深智是 NVIDIA 初创加速计划的高级会员,通过该计划,一方面中科深智与 NVIDIA 进行了深入的技术合作,另外一方面也链接到大量外部企业资源,可以快速有效的将产品和需求方进行对接。

大模型驱动的对话式 AI 和数字人的结合引发了新一轮的商业增量,也是我们的企业客户关注的重点。对话式数字人正在不同领域发挥着越来越大的作用,帮助企业用户解决客户服务等难题,提高客户的体验。然而开发和运行可落地的语音人工智能服务仍然是一项复杂而艰巨的任务,通常需要面临实时性、可理解性、自然性、低资源、鲁棒性等挑战。在 NVIDIA 初创加速计划的支持之下,我们深入了解并且成功应用了 NVIDIA 各项最新技术和工具,包括 NVIDIA Nemo,NVIDIA Omniverse 等等,切实帮助我们加速了 AI 对话数字人的建设。”

NVIDIA 初创加速计划

中科深智是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

想获得 NVIDIA 初创加速生态助力?扫描下方二维码,仅需一分钟填写意向申请表单,获得快速联系。

66502e82-1ffc-11ee-962d-dac502259ad0.png


原文标题:NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3330

    浏览量

    87782

原文标题:NVIDIA 赋能中科深智实现 NPC 与玩家的千人千面多模态互动

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    OpenHarmony实战开发-如何实现模态转场

    ,结合转场动画和共享元素动画可实现复杂转场动画效果,如缩略图片点击后查看大图。 bindSheet 弹出半模态组件。 用于半模态展示界面,如分享框。 bindMenu 弹出菜单,点击组件后弹出。 需要
    发表于 04-28 14:47

    鸿蒙帆起】《开心消消乐》完成鸿蒙原生应用开发,创新多端联动用户体验

    技术还为用户打造出创新的分布式游戏玩法。通过与 HarmonyOS 分布式有机结合,可实现设备协同的分布式 PK 场景。在此场景下,用户操作各自的 HarmonyOS 设备,使用智慧屏实时显示对战
    发表于 01-03 10:22

    【鸿蒙帆起】《钢岚》成为首款基于HarmonyOS NEXT开发的战棋新游

    通过元服务在负一屏或桌面呈现,为玩家带来更便捷的游戏体验;另一方在保证用户安全与隐私的前提下,AI 大模型可以识别用户意图,实现服务精准投放,实现游戏全方位用户触达,促进用户转化。
    发表于 12-28 10:24

    高动态人形机器“夸父”通过OpenHarmony 3.2 Release版本兼容性测评

    深圳开鸿数字产业发展有限公司(以下简称”开鸿“)OpenHarmony生态建设能力和在新兴行业领域的技术创新实力,也标志着OpenHarmony在新兴行业领域又向前迈进了一步。 夸父人形机器
    发表于 12-20 09:31

    华秋荣获亿邦动力2023产业互联网峰奖,引领电子产业数字化变革

    年会峰之夜颁奖晚宴上,在一百余位产业互联网企业决策、投资及业界人士的共同见证下,2023产业互联网峰奖正式揭晓。华秋凭借其卓越的数字化实力和创新能力,在众多优秀的候选者中脱颖而
    发表于 12-15 09:57

    华秋荣获亿邦动力2023产业互联网峰奖

    年会峰之夜颁奖晚宴上,在一百余位产业互联网企业决策、投资及业界人士的共同见证下,2023产业互联网峰奖正式揭晓。华秋凭借其卓越的数字化实力和创新能力,在众多优秀的候选者中脱颖而
    发表于 12-15 09:53

    大模型+多模态的3种实现方法

    我们知道,预训练LLM已经取得了诸多惊人的成就, 然而其明显的劣势是不支持其他模态(包括图像、语音、视频模态)的输入和输出,那么如何在预训练LLM的基础上引入跨模态的信息,让其变得更强大、更通用呢?本节将介绍“大模型+多
    的头像 发表于 12-13 13:55 727次阅读
    大模型+多<b class='flag-5'>模态</b>的3种<b class='flag-5'>实现</b>方法

    求助,关于ADuCM360与AD7903使用官网例程问题

    主控:千人360传感器:ad7903程序为官网例程 链模式波形图如下所示(其中,黄色为sccx( sckx),蓝色为cnvx , cnvx , cnvx , cnvx , cnvx , cnvx
    发表于 12-05 07:29

    OpenHarmony亮相MTSC 2023 | 质量&amp;效率共进,应用生态发展

    和平台。OpenAtom OpenHarmony(简称“OpenHarmony”)通过专场论坛议题分享和展区展品精彩展示,为与会者带来一场技术盛宴。 OpenHarmony 分论坛:优质高效测试
    发表于 11-28 15:41

    【鸿蒙生态帆起】HarmonyOS系统级地图与位置服务,广大开发者

    呈现,提供立体地形图层服务,更直观展示地形信息。 此外,还支持地图样式、标记、覆盖物、瓦片图层等个性化设置。结合HarmonyOS在车机、手机、智能穿戴设备等终端互联互通上的优势,地图服务亦可完成跨
    发表于 11-22 10:37

    “T”型NPC的效率怎么会比“I”型NPC的效率高呢?

    网上查找三电平相关的资料,特别是两种三电平结构的差异,经常能看到这样的一个结论。那就是,当开关频率小于16kHz的时候,“T”型NPC的效率比“I”型NPC的效率高;当开关频率高于16kHz的时候,“I”型NPC的效率会更高。
    的头像 发表于 11-09 14:29 1402次阅读
    “T”型<b class='flag-5'>NPC</b>的效率怎么会比“I”型<b class='flag-5'>NPC</b>的效率高呢?

    华秋联手伙伴共创硬件生态,助力OH创新使行百业

    OpenHarmony一站式服务,帮助伙伴实现技术创新,降本增效,抢占市场,共同推动OpenHarmony生态的繁荣与发展。 OpenHarmony是由开放原子开源基金会(OpenAtom
    发表于 11-06 17:21

    华秋联手伙伴共创硬件生态,助力OpenHarmony创新使行百业

    OpenHarmony一站式服务,帮助伙伴实现技术创新,降本增效,抢占市场,共同推动OpenHarmony生态的繁荣与发展。 OpenHarmony是由开放原子开源基金会(OpenAtom
    发表于 11-06 13:53

    英码科技精彩亮相火爆的IOTE 2023,多面AIoT产业发展!

    于智慧城市、智慧应急、智慧交通、智慧校园、智慧金融、智慧园区等领域。英码科技“元”AI引擎为客户提供算法到算力的一体化快速生产模式,实实在在企业快速具备AI能力,实现降本增效。
    发表于 09-25 10:03

    千人面的数据分析有没可能?奥威BI数据可视化工具告诉你

    数据分析要做到千人,就意味着不同角色的用户在分析报表时,都可以站在自身的立场、按照自己的分析思维变化去展开数据分析,更多维地获取数据信息。以前受制于平台技术发展无法实现,现在随着B
    发表于 08-29 14:45