0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里达摩院公布自研语音识别模型DFSMN,识别准确率达96.04%

肖青梅 来源:未知 作者:xiaoqingmei 2018-06-07 14:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【导读】:日前,阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN,据悉语音识别准确率达96.04%,未来将用于智能家居设备。

达摩院机器智能实验室的语音识别团队主导了这个模型的研发,并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。

在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。

著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”有业内人士称,DFSMN有望成为继传统的LSTM模型后,成为全球语音识别领域最主要的声学识别模型之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1645

    浏览量

    48915
  • 语言识别
    +关注

    关注

    0

    文章

    15

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    指令的识别与响应。无论是在家庭还是嘈杂的工业场合,这一类芯片都可以实现高准确率的智能语音交互,这种离线控制方式为用户提供了极大的便利。
    的头像 发表于 10-31 15:27 257次阅读

    构建CNN网络模型并优化的一般化建议

    ,从而得到对我们有价值的识别信息。但这种迭代性并不是十分必要的,因为从实践来看,即使只有单层网络的模型,只要拥有充分数量的神经元,也可以获得较高的准确率。不过该种方式的一个重要缺点就是参数重多,导致
    发表于 10-28 08:02

    除了准确率,电能质量在线监测装置在谐波源识别方面还有哪些重要指标?

    除了识别准确率,电能质量在线监测装置在谐波源识别方面的核心价值还依赖于 识别效率、定位精度、抗干扰能力、场景适配性 等关键指标,这些指标直接决定装置能否在复杂现场环境中 “快速找对、精
    的头像 发表于 10-22 16:22 782次阅读

    电能质量在线监测装置识别谐波源的准确率有多高?

    电能质量在线监测装置识别谐波源的准确率受电网结构、监测方案、设备性能等多重因素影响,呈现显著的 场景化差异 。根据行业研究与工程实践,其准确率通常在 **65%~95%** 之间波动,具体可分为以下
    的头像 发表于 10-22 16:18 679次阅读

    广和通发布端侧语音识别模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟
    的头像 发表于 08-04 11:43 1367次阅读

    【Sipeed MaixCAM Pro开发板试用体验】+ 02 + 基础功能测试

    、基础功能测试 1.人脸表情情绪检测 通过开发板自带的应用程序实测发现识别准确率非常的高(但需在离人脸较近的地方进行识别,如果识别距离过远会导致
    发表于 07-19 22:50

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-17 14:55 1427次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    WTK6900HC-24SS语音识别芯片:重塑眼部/颈部按摩仪的智能语音交互体验

    音频控制于一体,以90%以上的识别准确率和3.3-5米的有效交互距离,让用户彻底解放双手,享受“动口不动手”的智慧按摩体验。一、语音控制:解放双手的智能按摩革命传
    的头像 发表于 07-14 09:07 396次阅读
    WTK6900HC-24SS<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片:重塑眼部/颈部按摩仪的智能<b class='flag-5'>语音</b>交互体验

    语音识别芯片选型有哪些技术参数要注意

    性能参数 1. 识别准确率 定义:芯片对语音指令的正确识别比例,通常以百分比表示(如 95% 以上)。 影响因素:环境噪声、发音清晰度、方言适配性等。 应用场景:智能家居、车载系统需≥
    的头像 发表于 06-23 17:31 669次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片选型有哪些技术参数要注意

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    ,提高语音识别准确率;同时也可连接高质量的扬声器,确保语音合成后的声音清晰、自然。TF卡接口能够存储大量的语音数据、对话
    发表于 05-28 11:36

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入式AI模型模型升级AI摄像机,进行AI识别应用。 AI训练模型是不断迭
    发表于 04-28 11:11

    普强信息入选2024语音识别技术公司TOP30榜单

    企业数字化升级,这一荣誉不仅体现了普强在语音交互、语义理解、多语种识别等核心技术上的领先优势,更是对普强自主研发的端到端语音识别系统在高噪声环境、复杂口音等极端场景下仍能保持95%以上
    的头像 发表于 04-18 17:25 1005次阅读

    普华基础软件莅临阿里巴巴达摩调研交流

    近日, 普华基础软件股份有限公司(以下简称普华基础软件)董事、总经理刘宏倩一行前往阿里巴巴达摩(杭州)科技有限公司(以下简称达摩)调研交
    的头像 发表于 04-08 10:10 947次阅读

    浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率

    结合,深度开发模型潜力,快速实现本地化部署DeepSeek,构建准确率高、安全稳定的专属智能应用。实测数据显示,DeepSeek在元脑企智EPAI上开发的企业应用回答准确率达到95%。   企业落地
    的头像 发表于 02-23 07:32 881次阅读
    浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用<b class='flag-5'>准确率</b>

    如何提升人脸门禁一体机的识别准确率

    准确率,可以从以下几个方面进行改进。一、优化算法与模型人脸识别的核心在于算法的优化和模型的调整,目前深度学习技术在图像识别中的应用取得了显著
    的头像 发表于 12-10 15:05 1450次阅读
    如何提升人脸门禁一体机的<b class='flag-5'>识别</b><b class='flag-5'>准确率</b>?