0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于端到端基于语音的对话代理

倩倩 来源:互联网分析沙龙 2020-09-09 14:14 次阅读

美国专利商标局(USPTO)授予Microsoft的一项新专利表明,该公司正在开发能够反映用户对话风格和/或面部表情的对话代理。专利- 语言风格匹配代理 -于2020年9月3日授予Microsoft,并以发明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen称号。

随着语音识别和生成对话模型的发展,诸如聊天机器人和虚拟代理之类的对话界面正变得越来越流行。尽管这种自然语言的交互导致了人机交互的发展,但这种交流大多是单调的且受约束的。因此,这些对话最终只是事务性的,并不是很自然。

这项新的专利技术旨在带来一种基于端到端基于语音的对话代理,该对话代理可以进行更自然,多轮回的对话,从而与用户的对话风格和面部表情保持一致。

被实现为仅语音的代理或用脸部体现的会话代理可以与用户的语音和面部表情匹配。可以通过识别用户语音的韵律特征并为具有相同或相似特征的虚拟代理合成语音来实现会话代理的语言样式匹配。用户的面部表情可以通过具体化的对话代理的脸部来识别和模仿。虚拟代理的发言可以基于预定的脚本响应和由机器学习技术生成的开放式响应的组合。与用户的会话风格和面部表情保持一致的会话代理可能会被认为更值得信赖,更容易理解,

对话代理可以是纯音频的,也可以是体现的,这意味着它具有看起来像在说话的“脸”。在这两种实现方式中,代理可以使用机器学习技术,并以自然且可理解的方式响应用户的话语,从而整体上改善人机交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1128

    浏览量

    54758
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111830
  • 聊天机器人
    +关注

    关注

    0

    文章

    273

    浏览量

    12103
收藏 人收藏

    评论

    相关推荐

    PC打开串口助手,怎么会影响STM32的WKUP唤醒呢?

    现象描述: 我的程序,在 main() 函数 的 while(1) 死循环中,用个LED来显示系统的执行,同时每秒往串口发送个字节的数据,十秒钟之后进入待机模式。 1. 如果在PC 【启动
    发表于 04-24 08:26

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,并且还可以语音对话:6,FastAPI服务器搭建与TTS播放

    uvicorn 这是一种方法,unicorn作为非同步运行库用来运行fastapi。当然根据fastapi的官方文档,还有一种更简单的方式进行安装: pip install -U \"
    发表于 04-16 12:54

    一种端接触移动到另_行程距离传感器

    一种端接触移动到另_行程距离传感器,用于高压开关柜内(10kv~35kv),
    发表于 03-09 03:35

    HDMI信号的接收和发送与PD的DFP和UFP有对应关系吗?

    HDMI信号的接收和发送与PD的DFP和UFP有对应关系吗? 例如:一端作为HDMI的接收PD的输电,另
    发表于 02-29 07:46

    和四稳压器的原理分析

    上图是个双踪稳压器,先由上半部分分析正稳压过程。 1、假设未稳压输入电压是15-24V,电压进入该电路,在稳压二极管产生2.5V压降,运放正向输入也就是2.5V,此时运放进入正向饱和,假设是
    发表于 01-27 14:09

    PLC从HTTP服务获取JSON文件,解析数据寄存器

    文件提交给HTTP的服务; 服务有返回的JSON,或者GET命令获取到的JSON,网关进行解析后将数据写入PLC寄存器。 本文主要描述通过GET命令获取数据,解析西门子PLC的
    发表于 01-24 09:47

    请问轨轨放大器同相输入和光电探测器正可以接地吗?

    请问轨轨放大器同相输入和光电探测器正可以接地吗?还是要接个偏置。
    发表于 11-17 09:24

    自然对话语音数据:人机交互的新纪元与挑战

    自然对话语音数据是指以自然语言进行交流的语音数据,它代表着人机交互技术的巨大进步。随着人工智能和语音识别技术的飞速发展,我们正逐渐迈入一个可以通过声音与计算机进行自然对话的新时代。本文
    的头像 发表于 11-08 17:01 206次阅读

    如果差分对做单时钟输出,如P作为时钟输出,另一端应该如何使用?

    如果差分对做单时钟输出,如P作为时钟输出,另一端应该如何使用。
    发表于 08-11 07:26

    前面板安装PCB封装m12板弯角插座

    m12板弯角插座是一种常用的封装类型,本文将从行业实践、解决问题的方法和领域案例三个角度出发,详细描述PCB封装m12板弯角插座的特点和优势。、PCB封装m12板
    发表于 08-10 11:46

    语音识别技术的概念及应用前景

    一种最自然的交互方式,和IOT结合可以解决IOT控制中配网麻烦、需要中心的些痛点,又可以让设备互联后共同为用户提供服务,实现语音入口设备控制全部IOT设备,非常方便。特别是随着专
    发表于 05-27 09:41

    WiFi客户偶尔发送慢是怎么回事?

    没有在某处徘徊......切都很好,所以看看来自网络服务器/ PHP 的响应时间,.. ...再次切顺利,所以 Wiresharked 了“对话”,看来延迟是在 ESP12
    发表于 05-16 07:40

    如何在rtos mqtt示例中获取客户句柄?

    (TAG, \\\"sent publish successful, msg_id=%d\\\", msg_id); 有没有什么优雅的方法可以让客户在回调之外处理?或者另一种方法是创建自定义事件并将该消息发送到回调?
    发表于 05-15 08:13

    差分放大电路为什么要分单输入和双输入?

    差分放大电路为什么要分单输入和双输入?两者有什么本质上的区别?如何区分这两电路?
    发表于 05-06 10:43

    求分享SoftAP上的独立MQTT代理

    任何人都可以给我个例子或者只是个工作流+库来实现这个: 我想要个 ESP8266 上的独立 MQTT 代理。ESP8266 还必须有
    发表于 04-28 07:40