0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌宣布开源Android语音识别转录工具 —— Live Transcribe的语音引擎

SwM2_ChinaAET 来源:lq 2019-10-01 17:03 次阅读

谷歌在其开源博客中宣布开源 Android 语音识别转录工具 —— Live Transcribe 的语音引擎(Live Transcribe Speech Engine),它旨在将语音或对话实时转录为文字,还能够为听障人士提供帮助。

Live Transcribe 是谷歌于今年 2 月推出的一款 Android 应用程序,它的语音识别由谷歌最先进的 Cloud Speech API 提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟的鲁棒性等等都带来一些考验。因此,谷歌把它开源出来, 希望开发人员在已有的基础上进一步构建和开发。

Cloud Speech API 目前无法支持无限的音频流,团队目前采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。

无限流媒体音频带来了一大挑战。在许多国家,网络数据非常昂贵,并且在互联网较差的地方,带宽可能有限。Live Transcribe Speech Engine 的团队对音频编解码器进行了大量实验,并最终在不影响精度的情况下将数据使用量减少了 10 倍。

另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义 Opus 编码器

此外,值得一提的是,Live Transcribe 支持超过 70 种语言,并能够根据语音自动识别语种,其中也包括中文。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40193
  • 谷歌
    +关注

    关注

    27

    文章

    5886

    浏览量

    103345
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111861

原文标题:【业内热点】谷歌开源实时语音转录引擎 Live Transcribe Speech Engine

文章出处:【微信号:ChinaAET,微信公众号:电子技术应用ChinaAET】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    恩智浦发布新一代智能语音技术组合的语音识别引擎

    恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Inten
    的头像 发表于 01-26 09:15 255次阅读
    恩智浦发布新一代智能<b class='flag-5'>语音</b>技术组合的<b class='flag-5'>语音</b><b class='flag-5'>识别</b><b class='flag-5'>引擎</b>

    开源项目】基于ESP32的语音识别控制AI小夜灯

    一、项目简介 使用ESP32-S3N8R8模块作为主控芯片,S3内核增加了用于加速神经网络计算和信号处理等的指令,这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的功能。 二、原理解
    发表于 12-19 14:05

    离线语音识别与在线语音识别有什么不一样?

    离线语音识别与在线语音识别有什么不一样? 离线语音识别和在线
    的头像 发表于 12-12 14:36 688次阅读

    离线语音识别及控制是怎样的技术?

    识别离线语音识别是指在设备本地进行语音信号的识别和转换,而无需依赖互联网连接或云端服务。具体来说,离线
    的头像 发表于 11-24 17:44 481次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>及控制是怎样的技术?

    离线语音识别及控制是怎样的技术?

    、什么是离线语音识别  离线语音识别是指在设备本地进行语音信号的识别和转换,而无需依赖互联网连接
    发表于 11-24 17:41

    离线语音识别和控制的工作原理及应用

    引言   离线语音识别是指在没有网络连接的情况下,通过在本地设备上进行语音信号处理和识别,实现语音命令的转化和执行。随着智能设备的普及,离
    发表于 11-07 18:01

    在线和离线语音控制你会怎么选择呢?#语音模块 #语音控制 #语音识别 #离线语音

    芯片语音识别
    轻生活科技语音模块
    发布于 :2023年10月26日 14:29:47

    AT32上实现关键词语音识别(KWS)

    AT32上实现关键词语音识别(KWS)本文基于此开源模型和代码,在AT32 MCU 上对KWS 效果进行展示。
    发表于 10-26 07:45

    厨房秤也能语音控制?#语音控制 #语音模块 #语音识别 #离线语音识别

    芯片语音识别
    轻生活科技语音模块
    发布于 :2023年10月19日 16:36:15

    基于python进行语音识别的实现方案

    使用PocketSphinx包, PocketSphinx是一个用于语音转换文本的开源API。它是一个轻量级的语音识别引擎,尽管在桌面端也能
    发表于 10-11 09:31 246次阅读
    基于python进行<b class='flag-5'>语音</b><b class='flag-5'>识别</b>的实现方案

    语音识别如何改善电信业客服体验

    近年来,电信业出现了大量 AI 驱动的技术,尤其是语音识别和翻译。多语种 AI 虚拟助手、数字人、聊天机器人、语音客服、音频转录等技术正在大幅改变电信业。企业正在呼叫中心部署 AI 以
    的头像 发表于 06-27 21:15 318次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>如何改善电信业客服体验

    NRK3303语音识别芯片,自制幻彩灯语音效果展示

    语音识别语音芯片
    九芯电子语音芯片
    发布于 :2023年06月06日 16:59:55

    2023海外市场好做吗?#物联网 #电子技术 #语音模块 #语音控制 #语音识别

    语音识别
    轻生活科技语音模块
    发布于 :2023年05月30日 14:53:40