0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌AI语音服务新增7种语言和31种声音

电子那些事儿 2019-03-01 10:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2月24日消息,为了扩展AI语音服务的市场,谷歌除了加强语音辨识模型、语言支持数量和声音种类之外,也调整了语音服务的价格。

谷歌更新文字转语音和语音转文字服务,除了优化语音辨识模型、新支持7种语言和31种声音之外,也调整了语音服务的价格,在特定的应用情境中,用户最多可以省下约50%的支出,而谷歌也提供每月前60分钟免费的语言转文字服务。

谷歌指出,语音辨识和生成技术在人机互动的应用中非常关键,要让人机互动更加自然、简单且普遍,并不容易,即便使用准确度高达90%的语音辨识模型,还是很难真正达到有效的对话,由于许多企业的语音辨识模型都是要在电话中运行,受到噪音的干扰,产生的文字资讯让模型难以处理,谷歌于去年4月针对这种应用场景推出电话和影片的语音转文字服务。

经过不断优化,现在电话的文字错误已降低了62%,而影片的语音转文字模型错误率也降低了64%,除此之外,影片的语音转文字模型在辨识多个说话者的情境中,像是会议或是广播,也有很好的表现。

在价格方面,为了吸引更多用户,谷歌将影片语音转文字模型收费调降了25%,而在标准和影片模型服务中,选择加入资料收集计画的用户,收费价格会减少33%,因此,若使用影片模型且选择加入收集资料计画的用户,将能够减少约50%的支出。

此外,支持的语言也是企业使用语音转文字辨识模型的一大考量,现在谷歌新增了7个语言和方言,包含丹麦语、葡萄牙语、俄语、波兰语、斯洛伐克语、乌克兰语和挪威语,加上上述新增的语言,目前总共支持持21种语言,这些新增的语言都还是测试版。在语音生成模型方面,谷歌的语音生成系统WaveNet也新增了31种声音,目前总共有包含21种语言的57种声音。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI人工智能语音识别控制模块:自定义命令词,全维度落地应用场景

    AI人工智能语音识别控制模块是一集成了语音识别、自然语言处理和智能控制功能的电子设备或系统。用户通过
    的头像 发表于 12-03 16:34 400次阅读

    C语言和单片机C语言有什么差异

    的目标代码短、运行速度高、存储空间小、符合C语言的ANSI标准,生成的代码遵循Intel目标文件格式,而且可与A51汇编语言PL/M51语言目标代码混合使用。 4、C只是一高级
    发表于 11-14 07:55

    揭秘AI玩具“听得清”的秘密!这几款语音前端芯片撑起交互体验天花板

    电子发烧友网报道(文/黄山明)在AI大模型的加持下,AI玩具的最重要的功能便是语音交互,而要做到较好的语音交互,少不了语音前端处理芯片的加持
    的头像 发表于 10-17 08:42 9637次阅读

    轻松配置小智AI语音开发板,安信可IOT小程序功能更新

    版使用教程: 安信可AI语音开发板全面升级商用版!(附教程) 为了让开发体验更加流畅,安信可IOT小程序本次进行了多项功能升级,一起来看看吧   PART.01角色音色试听 选声音,不再“盲选”。 在
    的头像 发表于 08-19 17:46 916次阅读
    轻松配置小智<b class='flag-5'>AI</b><b class='flag-5'>语音</b>开发板,安信可IOT小程序功能更新

    思必驰声音复刻算法获得深度合成服务算法备案

    近日,国家互联网信息办公室正式发布第十二批深度合成服务算法备案信息,思必驰声音复刻算法通过此次备案。该算法能够高精度复刻人类声音,为个性化语音服务
    的头像 发表于 07-31 17:42 689次阅读

    AI语音控制模块能做些什么

    在智能化浪潮中,AI 语音控制模块成为众多设备实现便捷交互的关键组件。WT3000A 作为一款功能卓越的 AI 语音控制模块,在智能家居、工业物联网等领域展现出强大的应用能力。 丰富
    的头像 发表于 06-18 11:48 749次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>语音</b>控制模块能做些什么

    正点原子 AI BOX0 智能伴侣,1.54寸高清屏+长效续航,语音畅聊,情景对话,知识科普,多色可选,随身携带!

    品非它莫属! 为什么选择小智AI? 真人级交互体验 ① AI情感对话:不止问答,更能陪你聊心事、讲笑话,像朋友一样懂你! ② 10+音色百变:温柔御姐、萌趣童声、磁性男神… 每天换一声音
    发表于 04-24 16:11

    90元打造小智AI腕表,语音交互超有趣!

    最近小智AI非常火,这周给大家分享一个来自开源平台的小智AI腕表项目。 项目作者@dotnfc,复刻成本90元左右,开源协议:MIT License 项目简介 本项目分享了小智AI聊天机器人的一
    发表于 04-16 14:26

    谷歌“减法”新动作:砍掉耳机按键唤醒朗读功能

    唤醒谷歌AI助手的方式,为了听到通知,可以在激活谷歌助手时说“阅读我的通知”。   Google Assistant是谷歌AI战略的重要环节
    的头像 发表于 02-22 22:56 2885次阅读
    <b class='flag-5'>谷歌</b>“减法”新动作:砍掉耳机按键唤醒朗读功能

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    硬编码· 超低功耗,路由器连接保活况下功耗低于 150uA· 内置语音唤醒 / 命令词· 方案成熟度高,声音和图像上传手机和服务器已有多个成熟案例,并有配套 APP适用场景与产品特性AI
    发表于 02-20 18:44

    正点原子ESP32S3系列开发板全面支持小智AI

    飞速发展的大语言模型应用到实际的硬件设备中。 小智AI功能如下: WiFi / ML307 Cat.1 4G BOOT键唤醒和打断,支持点击和长按两触发方式 离线语音唤醒ESP-SR
    发表于 02-14 17:01

    程序中断的100写法

    。 中断响应时间:优化中断响应时间以满足实时性要求。 虽然上述方法和技术可以组合使用,但实现中断的方式并没有100独立的方法。不同的编程语言和硬件平台可能会有不同的中断实现方式,但大多数中断处理机制都可以归类到上述几类中。
    发表于 01-28 08:25

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌
    的头像 发表于 01-13 14:40 1137次阅读

    解锁个性化语音交互新时代:九芯智能语音云平台,让创意声音触手可及!

    九芯智能语音云平台提供全面高效安全的智能语音服务,支持自定义语音内容,简化烧录流程,依托AI技术,助力各行业智能化升级,引领
    的头像 发表于 01-02 16:51 1427次阅读
    解锁个性化<b class='flag-5'>语音</b>交互新时代:九芯智能<b class='flag-5'>语音</b>云平台,让创意<b class='flag-5'>声音</b>触手可及!

    标贝数据标注案例分享:车载语音系统数据标注

    车载语音识别系统是指利用机器学习算法实现的一自然语言处理技术,载语音识别系统通过辨别声音的语调、语速和音量,将所听到的
    的头像 发表于 12-24 14:24 827次阅读
    标贝数据标注案例分享:车载<b class='flag-5'>语音</b>系统数据标注