AI数字人的底层逻辑主要基于两种操作机制。一种是智能驱动型数字人,这种类型的数字人通过智能系统自动读取和解析外界输入信息,然后根据解析结果决策数字人后续的输出文本,最后驱动人物模型生成相应的语音与动作,实现与用户的互动。这个人物模型是通过AI技术预先训练得到的,能够通过文本驱动生成语音和对应动画,业内将此模型称为 TTSA(Text To Speech & Animation)人物模型。
另一种是真人驱动型数字人,其核心原理是由真人根据视频监控系统传来的用户视频,与用户进行实时语音交流,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而实现与用户的交互。
从技术角度来看,AI数字人的本质是人工智能的一种进化。它整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术,提供了一种可以随时随地与真人进行准确交互性对话的方式。背后的技术原理涉及到符号主义、联结主义和行为主义等多种研究视角。
随着新技术浪潮的推动,虚拟数字人的制作过程得到有效简化,性能也得到飞跃式提升,开始从外观的数字化逐渐深入到行为的交互化、思想的智能化。现在,以虚拟主播、虚拟员工等为代表的数字人已经开始在影视、游戏、传媒、文旅、金融等众多领域大放异彩。
审核编辑 黄宇
-
AI
+关注
关注
89文章
38153浏览量
296818 -
人工智能
+关注
关注
1813文章
49746浏览量
261605 -
数字人
+关注
关注
0文章
158浏览量
2542
发布评论请先 登录
AI时代的底层引擎:芯片如何驱动智能浪潮?
【启扬方案】基于启扬RK3588的移动AI数字人,助力智能交互新体验
掌握数字设计基础:迈向芯片设计的第一步
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
深度智能 基座跃迁 鸿道Intewell,面向“AI+智造”的新型工业操作系统
从底层逻辑到架构设计:聚徽解析MES看板的技术实现路径
地平线余凯称辅助驾驶的底层逻辑正在改写
生成式人工智能认证:重塑AI职业生态的底层逻辑
逻辑推理AI智能体的实际应用
鸿道Intewell操作系统:人形机器人底层操作系统
大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品
SMA 接头与 PCB 原理图连接的底层逻辑
【「零基础开发AI Agent」阅读体验】+初品Agent
鸿道AI机器人操作系统亮相中关村论坛

AI数字人操作的底层逻辑
评论