0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于端到端基于语音的对话代理

倩倩 来源:互联网分析沙龙 2020-09-09 14:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

美国专利商标局(USPTO)授予Microsoft的一项新专利表明,该公司正在开发能够反映用户对话风格和/或面部表情的对话代理。专利- 语言风格匹配代理 -于2020年9月3日授予Microsoft,并以发明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen称号。

随着语音识别和生成对话模型的发展,诸如聊天机器人和虚拟代理之类的对话界面正变得越来越流行。尽管这种自然语言的交互导致了人机交互的发展,但这种交流大多是单调的且受约束的。因此,这些对话最终只是事务性的,并不是很自然。

这项新的专利技术旨在带来一种基于端到端基于语音的对话代理,该对话代理可以进行更自然,多轮回的对话,从而与用户的对话风格和面部表情保持一致。

被实现为仅语音的代理或用脸部体现的会话代理可以与用户的语音和面部表情匹配。可以通过识别用户语音的韵律特征并为具有相同或相似特征的虚拟代理合成语音来实现会话代理的语言样式匹配。用户的面部表情可以通过具体化的对话代理的脸部来识别和模仿。虚拟代理的发言可以基于预定的脚本响应和由机器学习技术生成的开放式响应的组合。与用户的会话风格和面部表情保持一致的会话代理可能会被认为更值得信赖,更容易理解,

对话代理可以是纯音频的,也可以是体现的,这意味着它具有看起来像在说话的“脸”。在这两种实现方式中,代理可以使用机器学习技术,并以自然且可理解的方式响应用户的话语,从而整体上改善人机交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1275

    浏览量

    57630
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115555
  • 聊天机器人
    +关注

    关注

    0

    文章

    348

    浏览量

    13035
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智驾模拟软件推荐——为什么选择Keymotek的aiSim?

    随着自动驾驶技术的快速发展,车企和科技公司对于模拟测试平台的需求越来越强。从L2/ADASL4/L5等级的自动驾驶,虚拟模拟已经成为其中的关键环。特别是对于「」智驾(
    的头像 发表于 11-18 11:35 542次阅读

    Nullmax轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能顶会 AAAI 2026 公布论文录用结果,Nullmax 研发团队的轨迹规划论文成功入选。该论文创新提出一种由粗
    的头像 发表于 11-12 10:53 534次阅读

    自动驾驶中“段式”和“二段式”有什么区别?

    [首发于智驾最前沿微信公众号]最近有小伙伴提问,段式和二段式
    的头像 发表于 10-24 09:03 623次阅读
    自动驾驶中“<b class='flag-5'>一</b>段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”和“二段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”有什么区别?

    自动驾驶中常提的段式(单段)是个啥?

    自动驾驶技术的发展,催生出技术的应用,段式
    的头像 发表于 10-18 10:16 1375次阅读

    语音交互数据 精准赋能语音大模型进阶

    模型在多轮对话、噪声环境及语义理解方面表现不佳。 相较于传统数据集仅关注语音-文本的单点转写,语音
    的头像 发表于 09-11 17:17 571次阅读

    自主工具链助力组合辅助驾驶算法验证

    彻底解决越来越多的长尾问题。图1辅助驾驶算法(图片来源网络)辅助驾驶算法是一种深度学习算法,该算法将传感器数据输入后,基于大模型直接输出车辆控制指令。
    的头像 发表于 08-26 17:41 3349次阅读
    自主工具链助力<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>组合辅助驾驶算法验证

    当经典IP撞上AI技术:利尔达助力跃然创新推出全球首款AI互动玩具

    //当孩子们手中的奥特曼玩具不仅能发光发声,还能真正智能对话、情感陪伴,传统的玩具行业正经历场前所未有的技术革命……今日,AI玩具领军企业跃然创新(Haivivi)推出全球首款搭载
    的头像 发表于 08-26 17:37 1699次阅读
    当经典IP撞上AI技术:利尔达助力跃然创新推出全球首款<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>AI互动玩具

    广和通发布自研语音识别大模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音交互、
    的头像 发表于 08-04 11:43 1368次阅读

    Nullmax自动驾驶最新研究成果入选ICCV 2025

    Nullmax 在段式核心技术上的深厚积累与创新实力,尤其在
    的头像 发表于 07-05 15:40 1553次阅读
    Nullmax<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶最新研究成果入选ICCV 2025

    文带你厘清自动驾驶架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了从传统模块化架构大模型转变。传统模块化架构将感知、预测、规划和控制等子任务拆分开,分别由不
    的头像 发表于 05-08 09:07 783次阅读
    <b class='flag-5'>一</b>文带你厘清自动驾驶<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架构差异

    小米汽车智驾技术介绍

    后起之秀,小米在宣布造车前被非常多的人质疑,但在“真香”定律下,小米创下了很多友商所不能及的成就。作为科技企业,小米也在智能驾驶领域也不断研发及突破,并推送了自动驾驶系统。 小米
    的头像 发表于 03-31 18:17 4776次阅读
    小米汽车<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智驾技术介绍

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入2024年,
    的头像 发表于 12-19 13:07 1511次阅读

    在自动泊车的应用

    要做到15Hz以上。这样就对存储和算力需求降低很多。 上海交通大学的五位学生发表了自动泊车的论文:《ParkingE2E: Camera-based End-to-end P
    的头像 发表于 12-18 11:38 1488次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>在自动泊车的应用

    阶跃星辰发布国内首个千亿参数语音大模型

    近日,阶跃星辰在官方公众号上宣布了项重大突破——推出Step-1o千亿参数语音大模型。该模型被誉为“国内首个千亿参数
    的头像 发表于 12-17 13:43 1056次阅读

    准确性超Moshi和GLM-4-Voice,语音双工模型Freeze-Omni

    GPT-4o 提供的全双工语音对话带来了股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现
    的头像 发表于 12-17 10:21 1320次阅读
    准确性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>语音</b>双工模型Freeze-Omni