Google以丰富的对话情境资讯改进客服中心AI的语音识别能力-电子发烧友网

2018年Next大会上推出的人工智能预包装服务客服中心 AI（Contact Center AI），现在Google透过增加人工智能理解对话情境的方法，进一步强化虚拟代理人语音识别的能力，用户现在还可以更灵活地自订定义Speech Context类别，减少人工智能对于文字概念混淆的问题。

Google提到，即便客服中心虚拟代理人的语音识别精准度达90％，但是比起实验室，实际使用环境以及杂讯的影响，在部分情况下，仍然会使得自动语音识别的结果变得很糟，因此现在Google进一步更新客服中心AI所使用的技术，特别是在Dialogflow以及云端语音转文字两服务，以提升辨识品质。

Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台，建构对话服务，而这次更新，Google为Dialogflow加入了自动语音调适能力（Auto Speech Adaptation），以对话情境资讯，解决虚拟代理人混淆单字发音的问题。

由于许多单字的读音很相似，在电话中可能无法很清楚传递，像是cheese和these的发音，还有可能把mail误翻成male或nail，但是当虚拟代理人知道这些对话背景，发生在速食餐厅或是商品退货时，便不容易混淆这些字。用户只要在Dialogflow控制台中，将自动语音调适功能打开，就能让语音识别准确度上升40％以上。

Google也改进了互动式语音应答（IVR）以及电话虚拟代理人，所使用的云端语音转文字基线模型，而这将会使语音转录的结果更好，Google以电话用语的常用短句最佳化了该模型，使得新模型的表现，在美国英文上的辨识准确度提高15％，再加上自动语音调适功能，还能进一步提升辨识的品质。

开发人员在使用云端语音转文字服务时，能使用SpeechContext参数来控制情境资讯，让语音转录更加精确，以让虚拟代理人更精准地辨识企业产品等特定名词。

而现在Google在SpeechContext中新增类别，而预定义的类别则对应到流行或是通用的概念上，使用情境像是在数字沟通时，4个数字的组合可能代表年、时间或是金钱，而开发者可以在SpeechContext类别，调校整个自动语音识别的单字列表，改善输入语音的转录结果。

不过，Google也提到，使用SpeechContext这样的工具，会增加部分短句被撷取的机率，这可能降低了语音有提及却没出现在转录文字上的错误，但同时也会增加语音未提及却出现在转录文字的情形，自动语音调适的强度需要权衡结果进行调整，而SpeechContext的Boost功能解决了开发者这样的烦恼，可以自动为使用案例调整语音调适的最佳强度。

过去云端语音转语音服务，处理语音只能以1分钟为单位，而这对于需要较长时间转录文字的使用案例，像是会议、即时影片或是电话等是个大问题，现在Google将处理语音时间上限提高至5分钟，而且API也允许开发人员开启新的串流对话，来接续前一个串流对话，以做到无限时间的串流语音转录文字。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1714

浏览量
56793
语音识别

语音识别

+关注

关注
37

文章
1635

浏览量
111837

原文标题：Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

文章出处：【微信号：ctiforumnews，微信公众号：CTI论坛】欢迎添加关注！文章转载请注明出处。

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

对话能力。目前计划使用的具体方案和流程如下：使用speech_recognition进行语音输入，完成后将语音数据导入Whisper或googl

发表于 04-12 12:41

从Google多模态大模型看后续大模型应该具备哪些能力

前段时间Google推出Gemini多模态大模型，展示了不凡的对话能力和多模态能力，其表现究竟如何呢？

发表于 12-28 11:19 •478次阅读

语音数据集在智能客服系统中的应用与挑战

的效率和质量。本文将详细介绍语音数据集在智能客服系统中的应用、面临的挑战以及未来的发展趋势。二、语音数据集在智能客服系统中的应用语音

发表于 12-25 09:46 •178次阅读

语音数据集：AI语音技术的灵魂

提升语音识别和生成能力：语音数据集为AI模型提供了丰富的语

发表于 12-14 14:33 •359次阅读

离线语音识别及控制是怎样的技术？

信号转化为文本或语义结果。　与传统的云端语音识别相比，离线语音识别的工作原理是将语音识别技术算

发表于 11-24 17:41

亚马逊云科技通过大语言模型及知识库接入，构建智能客服并丰富对话内容

可以快速搭建自己的全球客服联络中心。当前客服联络中心也面临诸多的挑战，如长时间的电话等待、沟通困难、有用信息的缺乏、对客户的回复缺乏标准难以统一，这些对客户都可能会带来不好的体验。当连

发表于 11-09 17:45 •458次阅读

基于深度学习的情感语音识别模型优化策略

情感语音识别技术是一种将人类语音转化为情感信息的技术，其应用范围涵盖了人机交互、智能客服、心理健康监测等多个领域。随着人工智能技术的不断发展，深度学习在情感

发表于 11-09 16:34 •260次阅读

离线语音识别和控制的工作原理及应用

引言　　离线语音识别是指在没有网络连接的情况下，通过在本地设备上进行语音信号处理和识别，实现语音命令的转化和执行。随着智能设备的普及，离

发表于 11-07 18:01

语音识别技术在智能客服领域的应用与优化

随着人工智能技术的不断发展，智能客服已成为企业提升服务质量和效率的重要手段。语音识别技术作为智能客服的核心技术之一，能够为客服工作带来诸多便

发表于 11-01 17:00 •288次阅读

语音识别技术在智能客服领域的应用与挑战

一、引言随着人工智能技术的不断发展，智能客服成为了许多行业的重要应用。语音识别技术作为智能客服的重要组成部分，对于提高客户满意度和提升企业效率具有重要意义。本文将探讨

发表于 10-25 10:37 •357次阅读

AI智能呼叫中心

可以自动识别和响应来电，通过分析用户的语音、文字和情绪等信息，并给出针对性的应答，与传统的人工处理相比，AI智能呼叫中心能够实现24/7不间断的服务，大幅提高了处理效率和用户满意度。二

发表于 09-20 17:53

语音识别如何改善电信业客服体验

近年来，电信业出现了大量 AI 驱动的技术，尤其是语音识别和翻译。多语种 AI 虚拟助手、数字人、聊天机器人、语音

发表于 06-27 21:15 •315次阅读

如何开发智能家居语音控制方案

的核心功能就是通过AI语音控制取代传统的遥控器控制，但是常用语音芯片存在语音识别准确率低，识别速

发表于 05-31 09:50

语音识别技术的概念及应用前景

应用。离线语音方案采用本地处理语音识别等功能，其无需网络，响应速度、隐私安全等特点可以完美解决居家环境信息隐私的问题。目前越来越多的智能设备通过搭载人工智能语音芯片，实现人机

发表于 05-27 09:41

思必驰：AI语音正逐步迈入“定制化”时代

随着AI语音技术的不断发展，如今，定制化语音的功能来到了最复杂的AI场景——对话式AI设备。趋势

发表于 05-24 16:32 •812次阅读

搜索历史

Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

评论

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

从Google多模态大模型看后续大模型应该具备哪些能力

语音数据集在智能客服系统中的应用与挑战

语音数据集：AI语音技术的灵魂

离线语音识别及控制是怎样的技术？

亚马逊云科技通过大语言模型及知识库接入，构建智能客服并丰富对话内容

基于深度学习的情感语音识别模型优化策略

离线语音识别和控制的工作原理及应用

语音识别技术在智能客服领域的应用与优化

语音识别技术在智能客服领域的应用与挑战

AI智能呼叫中心

语音识别如何改善电信业客服体验

如何开发智能家居语音控制方案

语音识别技术的概念及应用前景

思必驰：AI语音正逐步迈入“定制化”时代