0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软院士:Speech DDK技能太强了,语音识别超专业翻译人士水平

渔翁先生 来源:电子发烧友网 作者:尹志坚 2018-12-19 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【导读】2016年152层残差网络图像识别精准率96%,2017年语音识别基准测试误差率5.1%,2018年1月文本理解测试精准率88.5%,3月机器翻译研究系统精准率达到69.9%,12月语音合成测试版在Azure正式上线,并首次达到超过专业翻译人士的水平,微软人工智能AI)再次刷新世界纪录。

12月18日,在IoT In Action峰会上,微软全球资深院士首席语音科学家黄学东博士介绍智能语音和语言上的最新进展。首款媲美专业发音人的实时在线语音合成系统预览版在Azure上正式运营服务。

黄学东博士表示,微软在云服务上提供了世界级的语音合成服务,所有的互联网内容提供商都可以享受这个世界级的技术。它不仅解决了过去20年机器语音识别错误率居高不下的难题,更是人工智能语音和语言上的一次历史性突破——采用先进深度网络学习,简化了传统语音合成的架构。

从以上图片可以看出,左边紫色系统架构下,微软通过端到端的深度学习优化,为大家提供前所未有的、最自然的语音合成系统。

“基于神经网络的语音合成系统”是业界第一个实时的在语音上上线的人工智能服务。黄学东博士指出,大家可以享受更好的语音合成质量、更快的引擎性能、更广的全球服务部署。所有的内容提供商,不管是有没有音频、你的内容都可以转换成自然的声音表达,不管是在开车还是在睡觉,都可以享受高质量的交互。

同时,微软联合全球合作伙伴一起推出强大的语音麦克风阵列开发系统(Speech Devices SDK简称Speech DDK),它可以在25m之外都可以转写你的声音,DDK不仅可供用户免费使用,还可以整合到任何硬件设备中去,通过微软云服务为用户提供最先进的、世界一流的语音交互服务。

DDK让智能音箱“说话”。这是一款眼观六路的智能音箱系统,为企业级的会议转写提供前所未有的智能服务。

可以看到,它不仅仅是业界第一台多人原场会议转录系统,而且是业界第一台“睁开双眼”的智能音箱。

随着语音识别技术不断取得进步。放眼未来,各国间的语言沟通障碍不再有任何问题,人类离人工智能真正的目标又将推进一小步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6753

    浏览量

    108085
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108184
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116240
  • 人工智能
    +关注

    关注

    1820

    文章

    50335

    浏览量

    266976
  • 语音合成
    +关注

    关注

    2

    文章

    94

    浏览量

    16830
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别ic芯片分类工作原理,语音识别芯片分类

    语音识别IC芯片,通俗讲就是能让机器“听懂”人话的专用集成电路。与传统的语音播放芯片不同,语音识别芯片最大优势在于具备
    的头像 发表于 04-24 15:14 97次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>ic芯片分类工作原理,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分类

    485AI语音识别模块:多路语音控制,实现安防设备语音联动

    485AI语音识别模块凭借工业级的RS485总线通信与离线/在线AI语音识别能力,应用场景非常广泛,粗略划分可覆盖10大领域、数十种细分场
    的头像 发表于 04-22 15:17 100次阅读

    语音识别芯片介绍,语音识别芯片工作原理解析

    在智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广义上涵盖语音播放、录音及
    的头像 发表于 04-01 16:26 217次阅读

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。
    的头像 发表于 01-14 15:22 412次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1546次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及
    的头像 发表于 10-31 15:27 677次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主动识别
    的头像 发表于 10-30 16:32 748次阅读

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文本或指令。随着人工智能的发展,
    的头像 发表于 09-05 14:04 1002次阅读

    声智科技出席2025年北京市多语种AI语音翻译大赛

    8月20日,由北京市科委、中关村管委会主办,北京语言大学、北京第二外国语学院、北京市翻译协会、中国人工智能百人会共同承办的“2025年北京市多语种AI语音翻译大赛”在中关村展示中心顺利启幕。声智作为
    的头像 发表于 08-25 17:18 1375次阅读

    深圳大学:构建“喉部地图”法,柔性灵敏碳阵列传感器,用于语音识别

    with deep learning”的论文,研究提出一种“喉部地图”,利用柔性碳阵列传感器和基于深度学习的信号处理方法,以确定高精度语音识别所需的传感器最佳放置
    的头像 发表于 08-23 17:16 853次阅读
    深圳大学:构建“喉部地图”法,柔性<b class='flag-5'>超</b>灵敏碳阵列传感器,用于<b class='flag-5'>语音</b><b class='flag-5'>识别</b>

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别(AutomaticSpeechRecogni
    的头像 发表于 08-15 15:13 2440次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音
    发表于 08-09 10:54

    广和通发布自研端侧语音识别大模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音交互、实时语音
    的头像 发表于 08-04 11:43 1773次阅读

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    英语语音识别上达到接近人类水平的鲁棒性和准确性。Whisper还可以进行多语言语音识别语音
    的头像 发表于 07-25 15:21 996次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-17 14:55 1996次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程