【导读】:日前,阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN,据悉语音识别准确率达96.04%,未来将用于智能家居设备。
达摩院机器智能实验室的语音识别团队主导了这个模型的研发,并宣布向全世界企业与个人开源。对比目前业界使用最为广泛的LSTM模型,DFSMN模型训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了3倍,语音识别速度提高了2倍。
在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。
著名语音识别专家,西北工业大学教授谢磊表示:“阿里此次开源的DFSMN模型,在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。”有业内人士称,DFSMN有望成为继传统的LSTM模型后,成为全球语音识别领域最主要的声学识别模型之一。
-
阿里巴巴
+关注
关注
7文章
1645浏览量
48915 -
语言识别
+关注
关注
0文章
15浏览量
4974
发布评论请先 登录
什么是离线语音识别芯片(离线语音识别芯片有哪些优点)
构建CNN网络模型并优化的一般化建议
除了准确率,电能质量在线监测装置在谐波源识别方面还有哪些重要指标?
电能质量在线监测装置识别谐波源的准确率有多高?
广和通发布自研端侧语音识别大模型FiboASR
【Sipeed MaixCAM Pro开发板试用体验】+ 02 + 基础功能测试
EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程
WTK6900HC-24SS语音识别芯片:重塑眼部/颈部按摩仪的智能语音交互体验
语音识别芯片选型有哪些技术参数要注意
明远智睿SSD2351开发板:语音机器人领域的变革力量
普强信息入选2024语音识别技术公司TOP30榜单
普华基础软件莅临阿里巴巴达摩院调研交流
浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率

阿里达摩院公布自研语音识别模型DFSMN,识别准确率达96.04%
评论