0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI语音服务新增7种语言和31种声音

电子那些事儿 2019-03-01 10:37 次阅读

2月24日消息,为了扩展AI语音服务的市场,谷歌除了加强语音辨识模型、语言支持数量和声音种类之外,也调整了语音服务的价格。

谷歌更新文字转语音和语音转文字服务,除了优化语音辨识模型、新支持7种语言和31种声音之外,也调整了语音服务的价格,在特定的应用情境中,用户最多可以省下约50%的支出,而谷歌也提供每月前60分钟免费的语言转文字服务。

谷歌指出,语音辨识和生成技术在人机互动的应用中非常关键,要让人机互动更加自然、简单且普遍,并不容易,即便使用准确度高达90%的语音辨识模型,还是很难真正达到有效的对话,由于许多企业的语音辨识模型都是要在电话中运行,受到噪音的干扰,产生的文字资讯让模型难以处理,谷歌于去年4月针对这种应用场景推出电话和影片的语音转文字服务。

经过不断优化,现在电话的文字错误已降低了62%,而影片的语音转文字模型错误率也降低了64%,除此之外,影片的语音转文字模型在辨识多个说话者的情境中,像是会议或是广播,也有很好的表现。

在价格方面,为了吸引更多用户,谷歌将影片语音转文字模型收费调降了25%,而在标准和影片模型服务中,选择加入资料收集计画的用户,收费价格会减少33%,因此,若使用影片模型且选择加入收集资料计画的用户,将能够减少约50%的支出。

此外,支持的语言也是企业使用语音转文字辨识模型的一大考量,现在谷歌新增了7个语言和方言,包含丹麦语、葡萄牙语、俄语、波兰语、斯洛伐克语、乌克兰语和挪威语,加上上述新增的语言,目前总共支持持21种语言,这些新增的语言都还是测试版。在语音生成模型方面,谷歌的语音生成系统WaveNet也新增了31种声音,目前总共有包含21种语言的57种声音。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏

    评论

    相关推荐

    谷歌Pixel 8将采用Gemini Nano模型,新增两项AI功能

    谷歌披露,Pixel 8 在配备 Gemini Nano 后,首先将增加两大创新 AI 功能:其中之一是 Recorder 应用内新增 Summarize 功能,无网络情况下可记录并归纳更多关于对话、采访和演示的有用信息。
    的头像 发表于 03-29 15:46 137次阅读

    plc编程语言与c语言的联系 c语言和PLC有什么区别

    语言,主要用于开发各种应用程序。尽管PLC编程语言和C语言有一些相似之处,但它们之间也存在一些明显的区别。 首先,PLC编程语言和C语言都是
    的头像 发表于 02-05 14:21 1120次阅读

    vb语言和c++语言的区别

    VB语言和C++语言是两种不同的编程语言,虽然它们都属于高级编程语言,但在设计和用途上有很多区别。下面将详细比较VB语言和C++
    的头像 发表于 02-01 10:20 610次阅读

    C语言和C++中那些不同的地方

    标准。根据不同的标准,它们的功能也会有所不同,但是越新的版本支持的编译器越少,所以本文在讨论的时候使用的C语言标准是C89,C++标准是C++99.我们来介绍C语言和C++中那些不同的地方。
    的头像 发表于 12-07 14:29 545次阅读
    C<b class='flag-5'>语言和</b>C++中那些不同的地方

    如何选择创建c语言和c++

    选择创建 C 语言和 C++ 都需要综合考虑多个因素。在决定使用哪种语言之前,我们需要对这两种语言的特点、优缺点、适用场景、学习成本等进行全面的了解和对比。下面是关于选择创建 C 语言和
    的头像 发表于 11-27 15:58 244次阅读

    脚本语言和编程语言的区别

    脚本语言和编程语言是计算机语言的两个主要分类。尽管两者都是用于编写计算机程序的工具,但它们在设计和运行方式上存在一些显著的区别。下面将详细探讨脚本语言和编程
    的头像 发表于 11-22 14:33 1414次阅读

    请问C语言和汇编语言在开发单片机时各有哪些优缺点?

    C语言和汇编语言在开发单片机时各有哪些优缺点?
    发表于 10-30 06:32

    请问C语言和汇编语言在开发单片机时各有哪些优缺点?

    C语言和汇编语言在开发单片机时各有哪些优缺点?
    发表于 10-26 07:47

    汇编语言和C语言哪个好用一点?

    汇编语言和C语言哪个好用一点
    发表于 10-25 08:02

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二
    发表于 09-20 17:53

    智能语音开放平台选哪家,启英泰伦提供硬件、软件一体化开发服务

    语音AI平台(以下简称“平台”),目前已迭代至3.0版本。 该平台面向开发者和硬件厂商免费开放,只需登录平台注册即可自主针对各自产品进行个性化的功能开发,全流程低代码、平台化,操作便捷,赋能开
    发表于 08-17 14:00

    启英泰伦新成果发布交流会线上直播预约开启

    声音,是由物体或介质的振动引起的,振动源的多样性、振动的频率和波形的差异、传播介质的差异等因素共同作用,使我们能够感知到丰富而多样化的声音世界。听得到、听得清、听得懂、辨得明,是AI语音
    发表于 08-15 14:31

    聚焦语音 AI:在 AR 眼镜上可视化语音声音

    音频可以包含从人类语言到非语言声音等各种声音,例如狗吠和警笛声。在为听力困难的人设计无障碍应用程序时,该应用程序应能够识别声音并理解语义。 这种技术将有助于聋哑或听力有障碍的人可视化
    的头像 发表于 07-26 19:30 454次阅读

    语音识别技术的概念及应用前景

    相应的操控,反馈时可以通过播放预设的声音或通过语音合成来合成声音播放,输出结果。当前处理智能语音有多种方式,常见的有在线语音、离线
    发表于 05-27 09:41

    AI人工智能语音交互技术市场分析

    人工智能语音语言技术即实现人与机器以语言为纽带的信息处理技术,人机对话通过对声音信号的音频采集与信号处理将语音转化为文字供机器处理,在机器进
    发表于 05-06 11:20 1108次阅读
    <b class='flag-5'>AI</b>人工智能<b class='flag-5'>语音</b>交互技术市场分析