0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科大讯飞研究副院长魏思博士的讯飞超脑计划及研究成果

汽车玩家 来源:电子发烧友网 2018-04-20 16:44 次阅读

科大讯飞魏思博士

魏思,肥东一中99届高中毕业生,现为中国科学技术大学工学博士、科大讯飞研究院副院长、讯飞易听说首席科学家。2017年获选《麻省理工科技评论》全球青年科技创新人才,入选为“远见者”,代表了深度学习语音识别的创新精神。魏思知识渊博,才思敏捷,为人谦逊,表达力强且不失幽默,善于深入浅出地把深奥的理学知识讲解得浅显易懂。

讯飞超脑计划及研究成果

科大讯飞研究院副院长,带领团队研发语音识别新框架,和传统深度学习模型相比,增加了“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,可以使响应时间可以大大缩短。

近几年,中国讨论度最高的人工智能公司少不了科大讯飞。但大部分人是对讯飞的了解仅限于其语音技术,其实,科大讯飞还有一个更大的目标——打造“讯飞超脑”。

以“从能听会说到能理解会思考”为目标的讯飞超脑计划,要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。

魏思正是“讯飞超脑”计划的主要负责人之一。1999年,他进入中国科学技术大学电子工程与信息科学系学习,并于 2008年获得中国科学技术大学工学博士学位,同年起在科大讯飞研究院工作至今。如今,身为科大讯飞研究院副院长的魏思,同样是讯飞语音技术的核心人物。

基于讯飞超脑计划,科大讯飞正在开启一场以语音和语言为入口的“认知革命”。在过去6年中,讯飞的语音识别技术准确率从60.2%提升到95%以上。

准确率提升的背后,是魏思带领团队研发的一个语音识别“新武器”——一种名为“前馈型序列记忆网络 ”( FSMN )的新框架。据魏思介绍,和传统深度学习模型相比,前馈型序列记忆网络增加了一个“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,从而实现语音识别中的“端到端”建模。和其他多个技术点结合后,讯飞基于FSMN的语音识别框架获得了大幅度的性能提升。这个新模型可以使响应时间可以大大缩短,例如原来的一个星期可以缩短到一天,还可以提升训练效果。

FSMN保证了语音识别的准确性,但这还不够。一个大趋势是,几乎所有在做语音技术的人工智能公司都会追求更高的语音合成自然程度。在这一点上,魏思领导团队则实现了基于深度学习的全新的语音合成系统,进一步提升合成语音的自然度和表现力。在有麻省理工学院、卡内基梅隆大学等国际知名科研机构参加的国际最高水平的语音合成比赛 Blizzard Challenge(暴风雪竞赛)中,魏思团队开发的系统连续 11 年夺冠,7 项指标全部全球第一,并且是所有参赛队伍中唯一超过自然人发音水平的系统。

当然,对于正在采取“平台+赛道”扩张方式的讯飞而言,无论是哪一个赛道,都离不开技术的积累,魏思在多年科研工作中的成果也正迎来新的机会。

比如,他曾创造性地提出多种中英文语音评测评测算法,并带领团队获得国际领先成果。现在,他们已经可以将相关的评测技术应用到普通话测试及教学中,其中英文口语测试系统在国内外首次达到人工评测员水平。这项技术最主要的特点是实现了测试管理的信息化和测试手段的现代化。

而在说话人语种识别研究上,魏思则提出了基于深度神经网络的语种识别算法,大幅提升了语种识别的效果,成为目前业界所有语种识别系统的标准配置。

类似的案例还有很多,魏思的技术征途也不再仅限于语音:他带领团队提出基于CNN的离线手写识别策略,在世界上首次实现试卷扫描自动评分系统;在人工智能-认知智能方面,魏思带领团队获得国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名成绩,该任务是国际常识推理领域的新型评测任务,被学术界普遍认为是替代图灵测试衡量机器智能水平的重要学术挑战……

如果说有什么在驱动魏思不断地创新,那肯定少不了他对现有技术的“不满足”。“虽然近几年深度神经网络的兴起使得语音识别性能获得了极大的提升,但是我们并不能迷信于现有的技术,总有一天新技术的提出会替代现有的技术”,魏思曾在一篇博文中这样写道。

回顾语音识别的发展历史和讯飞语音识别系统的最新进展,他也发现,技术的突破总是艰难而缓慢的,重要的是坚持和不断思考。他也坚信,“现在是一个伟大的时代”。

“那么,在这个伟大的时代,我们的征途是什么呢?我觉得有一句话非常能够表现我自己或者是讯飞研究院这么多年的思考,那就是:在中国,可以改变世界”。魏思认为,在这10年中,中国原创能力的蓬勃发展已经显现出来,与全世界同台竞技,“我们毫不怯场”。

展望下一个10年,魏思和他的团队同样有几个小目标:将讯飞研究院打造成一个世界知名的研究机构,培养出一批世界顶级的科学家,最后,能够解决几个基本的科学问题。

“在下一个10年或者20年,我们终将可以触及智能的本质,解开智慧之谜”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    37

    文章

    1635

    浏览量

    111831
  • 科大讯飞
    +关注

    关注

    19

    文章

    743

    浏览量

    60386
  • 讯飞超脑
    +关注

    关注

    0

    文章

    3

    浏览量

    3971
收藏 人收藏

    评论

    相关推荐

    科大发布星火语音大模型

    科大行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年01月31日 09:17:28

    研究动态】万物纵横杨帆博士在Applied Soft Computing发表石化生产异常工况预警的人工智能算法研究成果

    近日,计算机科学领域著名期刊《Applied Soft Computing》(SCI一区, Top期刊)刊载了四川万物纵横 杨帆博士 与四川大学合作的最新工业智能研究成果《基于注意力机制的催化裂化装置异常工况预警》
    的头像 发表于 01-23 13:32 139次阅读
    【<b class='flag-5'>研究</b>动态】万物纵横杨帆<b class='flag-5'>博士</b>在Applied Soft Computing发表石化生产异常工况预警的人工智能算法<b class='flag-5'>研究成果</b>

    韩国研究团队发表最新Micro LED相关研究成果

    据悉,研究人员使用金属有机气相外延技术在覆盖有微图案SiO2掩模的石墨烯层上生长GaN微盘。然后将微盘加工成Micro LED,并成功转移到可弯曲基板上。这项研究表明,可通过石墨烯上生长出高质量LED,并将其集成到灵活的Micro LED设备中。
    的头像 发表于 12-13 16:55 534次阅读
    韩国<b class='flag-5'>研究</b>团队发表最新Micro LED相关<b class='flag-5'>研究成果</b>

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    市举办。 在NeurIPS 2023上,英特尔研究院将展示其最新AI研究成果,并和产业界、学术界分享英特尔“让AI无处不在”的愿景。大会期间,英特尔研究院将发表31篇论文,包括12篇主会场论文和19篇研讨会论文,并在405号展台
    的头像 发表于 12-08 19:15 350次阅读

    中国联通研究副院长、首席科学家唐雄燕一行莅临中科驭数交流合作

    营商场景的应用展开了深入交流,探讨了双方在多个关键领域的合作机会,共同推动运营商业务场景的升级和创新。 ▲  唐雄燕 院长一行与中科驭数座谈交流 座谈会上,中科驭数创始人、CEO鄢贵海介绍了中科驭数在DPU领域的最新研究成果和技术创新,强
    的头像 发表于 12-08 18:40 305次阅读
    中国联通<b class='flag-5'>研究</b>院<b class='flag-5'>副院长</b>、首席科学家唐雄燕一行莅临中科驭数交流合作

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。        英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开
    的头像 发表于 12-08 09:17 401次阅读

    百度蛋白大语言模型研究成果登上Nature子刊封面

    百度最新研究成果登上Nature子刊封面,文心生物计算大模型获国际顶刊认可!
    的头像 发表于 11-25 11:25 662次阅读
    百度蛋白大语言模型<b class='flag-5'>研究成果</b>登上Nature子刊封面

    卡尔SC系列的读写需要什么设备?

    请问下卡尔SC120529VLL6 读写能用什么设备读写?求助芯片的针脚定义图?
    发表于 11-07 07:00

    “数字经济企业TOP500”研究成果发布 软通动力荣登评选

    10月26日,2023数字经济企业研究成果发布暨研讨会在京举办,中国企业评价协会与中国信息通信研究院公布“数字经济企业TOP500”。软通动力以优秀的数字技术服务实力及助力数字经济发展所做出的贡献
    的头像 发表于 10-29 15:55 198次阅读
    “数字经济企业TOP500”<b class='flag-5'>研究成果</b>发布 软通动力荣登评选

    卡尔K60芯片通讯口正常,开通IO口就复位的原因?

    卡尔K60芯片通讯口正常,开通IO口就复位,有哪位大神能指点迷津啊
    发表于 10-08 08:07

    解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

    生成式AI正为医疗大模型迭代按下加速键。 近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果 《通过分布式合成学习挖掘多中心异构医疗数据
    的头像 发表于 09-12 18:50 603次阅读
    解决医疗大模型训练数据难题,商汤最新<b class='flag-5'>研究成果</b>登「Nature」子刊

    捷易科技物联网平台荣获工信部科学技术研究成果登记,技术国内先进

    2023年7月5日,捷易科技自研的“基于开放性智能设备识别与配置的物联网终端管理云平台的开发应用”科学技术研究成果经评审、公示获准登记,荣获国家工业和信息化部颁发的科学技术成果登记证书。本次评定
    的头像 发表于 08-01 08:29 828次阅读
    捷易科技物联网平台荣获工信部科学技术<b class='flag-5'>研究成果</b>登记,技术国内先进

    中科创达与北京智源人工智能研究院成立人工智能大模型联合实验室

    中科创达董事长兼CEO赵鸿飞、高级副总裁蔡蓉、副总裁朱红芹与北京智源人工智能研究院理事长张宏江、院长黄铁军、常务副院长曹岗、副院长兼总工程师林咏华等共同出席了联合实验室成立仪式。
    的头像 发表于 07-13 14:39 435次阅读

    中国工程院副院长、院士钟志华一行调研四维图新旗下杰发科技

    · · · · · · · · · · 近日,中国工程院副院长、院士钟志华,中国工程院院士杨善林、合肥工业大学校长、教授郑磊等中国工程院、中国汽车技术研究中心、清华大学车辆学院领导和专家一行调研四维
    的头像 发表于 06-28 17:20 451次阅读
    中国工程院<b class='flag-5'>副院长</b>、院士钟志华一行调研四维图新旗下杰发科技

    汉希科特中国微系统应用研究院开业仪式暨MEMS传感器专业论坛举行

    论坛期间还举行了汉希科特中国微系统应用研究院专家聘书颁发仪式。专家委员会由交通大学教授王庆康,复旦大学微电子学院副院长曾晓洋,中国科学院上海微系统与信息技术研究研究员、
    的头像 发表于 06-02 16:42 864次阅读