0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Mozilla使用开源Common Voice语音识别数据集进行多语言操作

JsPm_robot_1hjq 来源:未知 作者:胡薇 2018-06-12 11:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Mozilla 宣布它正在使其众包项目 Common Voice 支持更多语言。Common Voice 是一个旨在创建开源语音识别数据集的项目,于去年6月发布,它邀请来自世界各地的志愿者通过网络和移动应用程序,用他们的声音记录文本片段。

业内普遍认为语音将成为下一个重要的技术平台,近年来随着人工智能理论与技术的迅猛发展,语音识别技术在不断突破,通过语音助手如 Alexa、Google Assistant、Siri 和 Cortana,各公司将收集到的用户语音数据归为公司自己所有,这些数据的价值或许目前很难被外界看出来,但是在信息化高度发达,特别是今天这样一个大数据和人工智能时代,为开发机器学习模型提供语音数据集怎么看都是一件有深远意义的事,这些语音数据的意义会慢慢体现。

而最终当它们的价值逐渐显现,人们会发现在这背后亚马逊、谷歌、苹果和微软等公司已经牢牢锁住了语音技术的命门,主导了这场语音市场之争。

Common Voice 项目就是为了避免这样的事情而诞生的,它的目的是将收集到的语音数据集开源给公众,使得任何人都可以自由使用这些数据集来将语音识别技术智能地构建到各种应用程序和服务中。Mozilla 已经在去年11月公布了 Common Voice 英语数据集的第一批成果,其中收录了20000个人录制的40万个录音、大约500小时的演讲。此次 Mozilla 又宣布它正式开始收集法语、德语和威尔士语三种语言的语音数据,同时也在为收集另外40种语言做准备,巴西葡萄牙语、印度尼西亚语、波兰语和荷兰语等已经准备好启动众包语音数据收集。

Mozilla 首席创新官 Katharina Borchert 在他的博客中写到:“我们希望用户使用自己的语言甚至方言的时候是可以被机器理解的,但是我们相信这些技术上的接口不应该由少数几家公司控制,他们不能像守门员一样来完全把控语音服务。”

Common Voice 项目的意义与用于打击私人平台的开放许可证项目类似,OpenStreetMap 就是一个很好的例子。OpenStreetMap 为开发者提供了开放且可自由使用的世界地图,使得开发商不再需要依赖于 Google Maps 这样的竞争对手,不仅降低了成本开销,技术上也不再受到限制。

“使用多种语言标志着 Common Voice 迈出了重要的一步,我们希望它对整体语音技术来说也是一大步”,Mozilla Common Voice 项目的数字策略师 Michael Henretty 补充到:“语音技术的民主化不仅会降低全球创新的障碍,也会让人们获取信息更加便捷。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Mozilla
    +关注

    关注

    0

    文章

    50

    浏览量

    11560
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115569

原文标题:打破语音垄断 Mozilla Common Voice 支持更多语言

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里巴巴国际站关键字搜索 API 实战:3 步搞定多语言适配 + 限流破局,询盘量提升 40%

    跨境电商API开发常陷合规、多语言、限流等坑。本文详解从国际合规(GDPR/CCPA)到参数优化、数据结构化及区域化搜索的全链路方案,附Python代码模板与缓存重试架构,助力提升调用成功率至99%+,精准询盘增长42%。
    的头像 发表于 10-20 14:44 920次阅读

    速卖通全球运营利器:商品详情接口多语言 + 合规 + 物流适配技术全解析

    速卖通全球化适配是跨境成功关键!本文详解2025最新接口方案,涵盖多语言智能翻译、合规自动校验、物流精准推荐与性能优化四大模块,助力商家提升转化率30%+,降低风险,提效80%。附实操代码与新手三步走策略,适合所有想出海的卖家。
    的头像 发表于 10-16 09:30 323次阅读
    速卖通全球运营利器:商品详情接口<b class='flag-5'>多语言</b> + 合规 + 物流适配技术全解析

    端到端语音交互数据 精准赋能语音大模型进阶

    语音大模型从“能识别”向“懂语境”跨越的关键阶段,高质量场景化语音数据已成为制约技术突破的核心瓶颈。传统语音
    的头像 发表于 09-11 17:17 576次阅读

    基于开源鸿蒙的语音识别语音合成应用开发样例

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用sherpa_onnx开源三方库进行ASR语音识别与TTS
    的头像 发表于 08-25 14:26 3596次阅读
    基于<b class='flag-5'>开源</b>鸿蒙的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>及<b class='flag-5'>语音</b>合成应用开发样例

    使用aicube进行目标检测识别数字项目的时候,在评估环节卡住了,怎么解决?

    使用aicube进行目标检测识别数字项目的时候,前面一切正常 但是在评估环节卡住了,一直显示正在测试,但是完全没有测试结果, 在部署完模型后在k230上运行也没有任何识别结果 期待结果和实际结果
    发表于 08-13 06:45

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    1Whisper简介Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别
    的头像 发表于 07-25 15:21 574次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whispe
    的头像 发表于 07-17 14:55 1453次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    离在线语音芯片WT2606A在智能锁行业的应用场景

    离在线语音芯片 WT2606A 在智能锁行业的应用场景主要围绕语音交互升级、功能扩展及用户体验优化展开,具体包括以下核心方向: 一、基础语音提示与操作引导 开锁流程交互 用户通过指纹、
    的头像 发表于 06-24 17:46 447次阅读
    离在线<b class='flag-5'>语音</b>芯片WT2606A在智能锁行业的应用场景

    芯资讯|WT2003HP8-32N(A20)语音芯片:赋能换电柜智能语音交互与远程升级新体验

    (约375KB)语音库难以支持多语言/长内容。二、WT2003HP8-32N(A20)语音芯片核心优势广州唯创电子功能代码A20的WT2003HP8-32N语音
    的头像 发表于 06-05 08:54 402次阅读
    芯资讯|WT2003HP8-32N(A20)<b class='flag-5'>语音</b>芯片:赋能换电柜智能<b class='flag-5'>语音</b>交互与远程升级新体验

    离线语音识别芯片方案商:茶吧机语音控制模块NRK3502

    离线语音技术NRK3502凭无网、高隐私、快响应成家电新趋势,适配茶吧机等设备,支持多语言识别,高性价比,助力家电智能化升级。
    的头像 发表于 03-06 13:44 887次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片方案商:茶吧机<b class='flag-5'>语音</b>控制模块NRK3502

    98%识别率!语音+触摸方案,让卫浴操控一步到位!

    体验,让舒适与便捷一步到位!方案亮点:技术赋能,精准高效高精度语音识别语音识别率高达98%,支持多语言指令;在嘈杂环境也能精准
    的头像 发表于 02-26 15:49 801次阅读
    98%<b class='flag-5'>识别</b>率!<b class='flag-5'>语音</b>+触摸方案,让卫浴操控一步到位!

    Meta与UNESCO合作推动多语言AI发展

    Meta最近宣布了一项与联合国教科文组织(UNESCO)合作的全新计划——语言技术伙伴计划。该计划旨在收集多种语言语音录音和文字记录,以推动未来开放可用的人工智能(AI)技术的发展,特别关注那些
    的头像 发表于 02-08 11:04 903次阅读

    微软Copilot Voice升级,积极拓展多语言支持

    近日,据报道,微软近期在人工智能领域取得了新的进展,正积极拓展其Copilot Voice多语言支持功能。这一举措标志着微软在语音识别和自然语言
    的头像 发表于 02-06 14:10 717次阅读

    燃气检测仪语音报警方案——NV128H语音芯片

    天然气泄漏报警器必备,NV128H语音芯片以其卓越性能为燃气检测仪提供语音报警,保障家庭安全,支持多语言、低功耗,可根据需求定制报警语音,未来将在更多领域发挥作用。
    的头像 发表于 02-05 11:57 672次阅读
    燃气检测仪<b class='flag-5'>语音</b>报警方案——NV128H<b class='flag-5'>语音</b>芯片

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    (Text-To-Speech,文本转语音)技术将文本转换为语音进行播报。 当然除了基本的文本输入和播报功能外,我们还增加了语音识别的功能,
    发表于 01-06 15:33