0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科大讯飞研究副院长魏思博士的讯飞超脑计划及研究成果

汽车玩家 来源:电子发烧友网 2018-04-20 16:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科大讯飞魏思博士

魏思,肥东一中99届高中毕业生,现为中国科学技术大学工学博士、科大讯飞研究院副院长、讯飞易听说首席科学家。2017年获选《麻省理工科技评论》全球青年科技创新人才,入选为“远见者”,代表了深度学习语音识别的创新精神。魏思知识渊博,才思敏捷,为人谦逊,表达力强且不失幽默,善于深入浅出地把深奥的理学知识讲解得浅显易懂。

讯飞超脑计划及研究成果

科大讯飞研究院副院长,带领团队研发语音识别新框架,和传统深度学习模型相比,增加了“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,可以使响应时间可以大大缩短。

近几年,中国讨论度最高的人工智能公司少不了科大讯飞。但大部分人是对讯飞的了解仅限于其语音技术,其实,科大讯飞还有一个更大的目标——打造“讯飞超脑”。

以“从能听会说到能理解会思考”为目标的讯飞超脑计划,要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。

魏思正是“讯飞超脑”计划的主要负责人之一。1999年,他进入中国科学技术大学电子工程与信息科学系学习,并于 2008年获得中国科学技术大学工学博士学位,同年起在科大讯飞研究院工作至今。如今,身为科大讯飞研究院副院长的魏思,同样是讯飞语音技术的核心人物。

基于讯飞超脑计划,科大讯飞正在开启一场以语音和语言为入口的“认知革命”。在过去6年中,讯飞的语音识别技术准确率从60.2%提升到95%以上。

准确率提升的背后,是魏思带领团队研发的一个语音识别“新武器”——一种名为“前馈型序列记忆网络 ”( FSMN )的新框架。据魏思介绍,和传统深度学习模型相比,前馈型序列记忆网络增加了一个“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,从而实现语音识别中的“端到端”建模。和其他多个技术点结合后,讯飞基于FSMN的语音识别框架获得了大幅度的性能提升。这个新模型可以使响应时间可以大大缩短,例如原来的一个星期可以缩短到一天,还可以提升训练效果。

FSMN保证了语音识别的准确性,但这还不够。一个大趋势是,几乎所有在做语音技术的人工智能公司都会追求更高的语音合成自然程度。在这一点上,魏思领导团队则实现了基于深度学习的全新的语音合成系统,进一步提升合成语音的自然度和表现力。在有麻省理工学院、卡内基梅隆大学等国际知名科研机构参加的国际最高水平的语音合成比赛 Blizzard Challenge(暴风雪竞赛)中,魏思团队开发的系统连续 11 年夺冠,7 项指标全部全球第一,并且是所有参赛队伍中唯一超过自然人发音水平的系统。

当然,对于正在采取“平台+赛道”扩张方式的讯飞而言,无论是哪一个赛道,都离不开技术的积累,魏思在多年科研工作中的成果也正迎来新的机会。

比如,他曾创造性地提出多种中英文语音评测评测算法,并带领团队获得国际领先成果。现在,他们已经可以将相关的评测技术应用到普通话测试及教学中,其中英文口语测试系统在国内外首次达到人工评测员水平。这项技术最主要的特点是实现了测试管理的信息化和测试手段的现代化。

而在说话人语种识别研究上,魏思则提出了基于深度神经网络的语种识别算法,大幅提升了语种识别的效果,成为目前业界所有语种识别系统的标准配置。

类似的案例还有很多,魏思的技术征途也不再仅限于语音:他带领团队提出基于CNN的离线手写识别策略,在世界上首次实现试卷扫描自动评分系统;在人工智能-认知智能方面,魏思带领团队获得国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名成绩,该任务是国际常识推理领域的新型评测任务,被学术界普遍认为是替代图灵测试衡量机器智能水平的重要学术挑战……

如果说有什么在驱动魏思不断地创新,那肯定少不了他对现有技术的“不满足”。“虽然近几年深度神经网络的兴起使得语音识别性能获得了极大的提升,但是我们并不能迷信于现有的技术,总有一天新技术的提出会替代现有的技术”,魏思曾在一篇博文中这样写道。

回顾语音识别的发展历史和讯飞语音识别系统的最新进展,他也发现,技术的突破总是艰难而缓慢的,重要的是坚持和不断思考。他也坚信,“现在是一个伟大的时代”。

“那么,在这个伟大的时代,我们的征途是什么呢?我觉得有一句话非常能够表现我自己或者是讯飞研究院这么多年的思考,那就是:在中国,可以改变世界”。魏思认为,在这10年中,中国原创能力的蓬勃发展已经显现出来,与全世界同台竞技,“我们毫不怯场”。

展望下一个10年,魏思和他的团队同样有几个小目标:将讯飞研究院打造成一个世界知名的研究机构,培养出一批世界顶级的科学家,最后,能够解决几个基本的科学问题。

“在下一个10年或者20年,我们终将可以触及智能的本质,解开智慧之谜”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1825

    浏览量

    116252
  • 科大讯飞
    +关注

    关注

    19

    文章

    866

    浏览量

    63947
  • 讯飞超脑
    +关注

    关注

    0

    文章

    3

    浏览量

    4060
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科大桌面智能助理Loomy正式发布

    Loomy是推出的基于 AstroncClaw 打造的桌面级助理,主打本地办公场景Skills,同时支持用户自定义的SkillHub,面向全球生态开放共享。
    的头像 发表于 03-18 11:03 1256次阅读

    科大明确2026年战略方向与关键行动

    2026年2月13日,以“勇毅前行·海阔天空”为主题的科大2025-2026年会召开。董事长刘庆峰、总裁吴晓如分别发表演讲,回顾2025年经营成果,明确2026年战略方向与关键行动
    的头像 发表于 02-25 16:35 2329次阅读

    智文产品完成重磅升级

    2026年伊始,当智能体成为人人可用的数字生产力,智文完成重磅升级。全新打造的「智能演练」与「AI演示官」,首次实现“写、练、演”一体化的表达链路,重塑AI PPT全流程,让每个观点都能被从容讲述、生动传递。
    的头像 发表于 01-08 16:41 1038次阅读

    科大设立子公司:加码AI与集成电路业务布局

    电子发烧友网综合报道,人工智能领军企业科大近日再添新动作,正式成立山东沂信息科技有限公司。该公司成立于2025年12月19日,注册地位于临沂市,法定代表人为柳升华,注册资本500
    发表于 12-29 08:53 1923次阅读

    科大莅临一汽奔腾座谈交流

    11月8日,科大股份有限公司总裁吴晓如一行来访一汽奔腾。一汽奔腾企业负责人等相关人员接待来宾,并进行座谈交流。
    的头像 发表于 11-11 17:21 1428次阅读

    2025科大全球1024开发者节精彩回顾

    当全球产业格局和竞争形态重塑之时,AI将如何发展?11月6日,在第八届世界声博会暨2025科大全球1024开发者节发布会上,科大
    的头像 发表于 11-10 11:51 1187次阅读
    2025<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>全球1024开发者节精彩回顾

    科大发布星火X1.5及系列AI产品

    11月6日,第八届世界声博会暨2025科大全球1024开发者节发布会上,科大以《更懂你的
    的头像 发表于 11-10 11:49 1165次阅读

    2025科大全球1024开发者节科博展开幕

    第八届世界声博会暨2025科大全球1024开发者节,自10月24日以主题直播拉开序幕,直播发布“智能体平台,以及AI+轻办公、文旅、智能硬件、教育、法律等8大生态主题”。今天,线下科博展正式登场。
    的头像 发表于 11-04 11:42 1129次阅读

    香港立法会与科大联合打造智慧誊录系统“智识听”

    香港立法会主席梁君彦在社交平台发文点赞的“智识听”系统,是香港立法会与科大联合打造的智慧誊录系统。
    的头像 发表于 08-11 14:45 1742次阅读

    星火X1升级版正式上线

    今天,基于全国产算力训练的深度推理大模型——星火X1升级版正式上线。
    的头像 发表于 07-30 14:12 2225次阅读
    <b class='flag-5'>讯</b><b class='flag-5'>飞</b>星火X1升级版正式上线

    打破交互困局:科大这样出手

    十年深耕,科大智能交互如何引领未来
    的头像 发表于 06-17 11:50 1342次阅读
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>这样出手

    回顾科大26周年庆精彩瞬间

    近日,科大26周年司庆上,董事长刘庆峰对这个作文题感触很深:“从1999年创业时在“中国被人扼住了咽喉”背景下以语音合成系统破局,到这些年智能语音、机器翻译、机器阅读理解、多语种等多项技术的世界第一,再到如今通用人工智能时代
    的头像 发表于 06-13 14:08 1164次阅读

    科大斩获恰佩克年度卓越品牌奖

    精英等700余人参加。作为人工智能行业的龙头企业,科大受邀参会并凭借“机器人平台”获得“年度卓越品牌奖”,其技术创新与产业落地能力获
    的头像 发表于 05-30 16:47 1088次阅读

    科大联手“挑战杯”加速国产算力应用

    作为国家A级赛事,第十九届“挑战杯”全国大学生系列科技学术竞赛首次发起“人工智能+”专项赛道。凭借最早投入全国产算力平台的战略定力,科大打造自主可控的大模型基座,在一众大模型厂商中通过层层筛选,成为本届大赛首选的完全自主可控
    的头像 发表于 05-21 16:53 1207次阅读

    科大加速东南亚企业的人工智能应用

    日前,科大飞在新加坡成功举办合作伙伴峰会暨创新产品发布会。这场汇聚关键合作伙伴、行业先驱和技术领袖的盛会,不仅集中展示了科大最新AI创
    的头像 发表于 05-06 09:39 1056次阅读