0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

931T_ctiforumne 来源:YXQ 2019-07-30 15:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2018年Next大会上推出的人工智能预包装服务客服中心AI(Contact Center AI),现在Google透过增加人工智能理解对话情境的方法,进一步强化虚拟代理人语音识别的能力,用户现在还可以更灵活地自订定义Speech Context类别,减少人工智能对于文字概念混淆的问题。

Google提到,即便客服中心虚拟代理人的语音识别精准度达90%,但是比起实验室,实际使用环境以及杂讯的影响,在部分情况下,仍然会使得自动语音识别的结果变得很糟,因此现在Google进一步更新客服中心AI所使用的技术,特别是在Dialogflow以及云端语音转文字两服务,以提升辨识品质。

Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台,建构对话服务,而这次更新,Google为Dialogflow加入了自动语音调适能力(Auto Speech Adaptation),以对话情境资讯,解决虚拟代理人混淆单字发音的问题。

由于许多单字的读音很相似,在电话中可能无法很清楚传递,像是cheese和these的发音,还有可能把mail误翻成male或nail,但是当虚拟代理人知道这些对话背景,发生在速食餐厅或是商品退货时,便不容易混淆这些字。用户只要在Dialogflow控制台中,将自动语音调适功能打开,就能让语音识别准确度上升40%以上。

Google也改进了互动式语音应答(IVR)以及电话虚拟代理人,所使用的云端语音转文字基线模型,而这将会使语音转录的结果更好,Google以电话用语的常用短句最佳化了该模型,使得新模型的表现,在美国英文上的辨识准确度提高15%,再加上自动语音调适功能,还能进一步提升辨识的品质。

开发人员在使用云端语音转文字服务时,能使用SpeechContext参数来控制情境资讯,让语音转录更加精确,以让虚拟代理人更精准地辨识企业产品等特定名词。

而现在Google在SpeechContext中新增类别,而预定义的类别则对应到流行或是通用的概念上,使用情境像是在数字沟通时,4个数字的组合可能代表年、时间或是金钱,而开发者可以在SpeechContext类别,调校整个自动语音识别的单字列表,改善输入语音的转录结果。

不过,Google也提到,使用SpeechContext这样的工具,会增加部分短句被撷取的机率,这可能降低了语音有提及却没出现在转录文字上的错误,但同时也会增加语音未提及却出现在转录文字的情形,自动语音调适的强度需要权衡结果进行调整,而SpeechContext的Boost功能解决了开发者这样的烦恼,可以自动为使用案例调整语音调适的最佳强度。

过去云端语音转语音服务,处理语音只能以1分钟为单位,而这对于需要较长时间转录文字的使用案例,像是会议、即时影片或是电话等是个大问题,现在Google将处理语音时间上限提高至5分钟,而且API也允许开发人员开启新的串流对话,来接续前一个串流对话,以做到无限时间的串流语音转录文字。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1816

    浏览量

    60655
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116256

原文标题:Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

文章出处:【微信号:ctiforumnews,微信公众号:CTI论坛】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别ic芯片分类工作原理,语音识别芯片分类

    语音识别IC芯片,通俗讲就是能让机器“听懂”人话的专用集成电路。与传统的语音播放芯片不同,语音识别芯片最大优势在于具备
    的头像 发表于 04-24 15:14 171次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>ic芯片分类工作原理,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分类

    485AI语音识别模块:多路语音控制,实现安防设备语音联动

    485AI语音识别模块凭借工业级的RS485总线通信与离线/在线AI语音识别
    的头像 发表于 04-22 15:17 152次阅读

    语音识别芯片介绍,语音识别芯片工作原理解析

    在智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广
    的头像 发表于 04-01 16:26 260次阅读

    一文了解语音AI的运作方式

    语音 AI对话AI 的一个子集,包括可将人类语音转换为文本的自动语音
    的头像 发表于 02-27 16:10 548次阅读
    一文了解<b class='flag-5'>语音</b><b class='flag-5'>AI</b>的运作方式

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。
    的头像 发表于 01-14 15:22 427次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    AI语音模组】自制小智管家?安信可Ai-WV01-32S测试体验

    项目。 这次带来一款新作品: 基于安信可 Ai-WV01-32S 模组打造的小智语音硬件。 测试总结 项目 表现 模组集成度 ⭐⭐⭐⭐⭐ 焊接难度 ⭐⭐⭐(Type-C需小心) 语音识别
    的头像 发表于 11-19 16:06 927次阅读
    【<b class='flag-5'>AI</b><b class='flag-5'>语音</b>模组】自制小智管家?安信可<b class='flag-5'>Ai</b>-WV01-32S测试体验

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1570次阅读

    RK3576助力智慧安防:8路高清采集与AI识别

    在智慧城市和数字化园区的建设过程中,安防监控系统正从“被动记录”走向“主动识别与分析”。随着AI算法的成熟和高清视频处理能力的提升,市场对多路视频采集、实时拼接、智能识别的需求日益增强
    发表于 08-22 17:41

    睿海光电高效交付与广泛兼容助力AI数据中心800G光模块升级

    基础。 睿海光电在深圳建有3120+平方米智能制造基地与独立研发中心,构建了从设计到交付的全链条能力,支撑其快速响应市场需求。 二、交付速度:比行业快2-3天,赋能客户抢占先机 在AI算力竞赛中,交付效率
    发表于 08-13 19:01

    AT6811-超低功耗离线智能语音识别 SoC

    AT6811芯片0.8mA超低功耗实现离线语音交互,在嘈杂环境中仍保持92%识别率,已赋能空调、电动工具、助听器等设备,让万物拥有自然对话能力
    的头像 发表于 08-07 17:44 1892次阅读

    广和通发布自研端侧语音识别大模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟
    的头像 发表于 08-04 11:43 1790次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    接口则让语音机器人可以连接到互联网,实时获取最新的信息,增强其智能性和交互能力。 在实际应用场景中,智能客服语音机器人为例。SSD2351
    发表于 05-28 11:36

    小智AI移植到ESP32P4-Fucntion-EV-Board实机演示

    最近参加论坛的五一活动,获得一套小智AI的套件。当时正好在尝试移植小智AI到ESP32P4-Fucntion-EV-Board上。最近完成了大部分功能的移植,以及可以对话了,话说屏幕大确实是有优势,看着舒服,
    发表于 05-10 12:40

    NRK3301 AI语音芯片:玩具语音交互革新方案

    具智能升级1.精准离线语音识别,打破网络束缚NRK3301采用先进的神经网络(TDNN)算法,具备5米远场可靠识别能力,在复杂环境下仍能精准识别
    的头像 发表于 05-09 13:49 1264次阅读
    NRK3301 <b class='flag-5'>AI</b><b class='flag-5'>语音</b>芯片:玩具<b class='flag-5'>语音</b>交互革新方案