近日,谷歌邀请媒体在京举行视频电话会议,谷歌产品经理Sagar Savla介绍了Live Transcribe软件,这是一项免费的Android服务,通过将自动字幕技术融入日常会话,减少现实世界中的对话障碍。
据了解,通过自动语音识别技术 (ASR),计算机能够检测有声语言并将其现场转录为供阅读的文本,由Google云提供技术支持,Live Transcribe可以进行实时的对话字幕转录,支持超过70种语言,覆盖全球80%以上的人口。
Sagar Savla表示,虽然依靠云ASR能为我们提供更高的准确性,但Google希望可以减少Live Transcribe所需的网络流量消耗。为此,Google在先前AudioSet的工作基础上,实现了基于神经网络的设备语音检测器。该网络是一种图像式模型,类似于我们之前发布的VGGish模型,它可以检测语音并自动管理与云ASR引擎的网络连接,将长时间使用过程中的数据流量消耗降至最低。
在技术呈现方面,Google曾考虑了几种不同的模式:计算机、平板电脑、智能手机、小型投影仪,以迭代方式显示听觉信息和字幕。最后,Sagar Savla的团队决定专注于智能手机模式,因为这类设备无处不在且功能日益强大。
资料显示,世界卫生组织预计,到2055年全球将有九亿人听力受损。谷歌的这项软件可以为他们带去便利。目前该软件在亚洲已经非常流行。
-
Android
+关注
关注
12文章
3985浏览量
133046 -
谷歌
+关注
关注
27文章
6244浏览量
110250
原文标题:谷歌解读免费实时转录软件:面向听障人士 支持70种语言
文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
NVIDIA推出面向语言、机器人和生物学的全新开源AI技术
展会邀请:拓普联科将隆重亮相2025德国EUHA国际听力展
谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用
Android Studio中的Gemini全面支持Dart和Flutter开发
谷歌如何打造卓越自适应应用
谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级
机场智能指路机器人支持那些语言
Android 16的首个Beta版现已推出,升级功能有这些

谷歌推出免费Android服务,面向听力残障人士,支持超过70种语言
评论