0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科大讯飞研究副院长魏思博士的讯飞超脑计划及研究成果

汽车玩家 来源:电子发烧友网 2018-04-20 16:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科大讯飞魏思博士

魏思,肥东一中99届高中毕业生,现为中国科学技术大学工学博士、科大讯飞研究院副院长、讯飞易听说首席科学家。2017年获选《麻省理工科技评论》全球青年科技创新人才,入选为“远见者”,代表了深度学习语音识别的创新精神。魏思知识渊博,才思敏捷,为人谦逊,表达力强且不失幽默,善于深入浅出地把深奥的理学知识讲解得浅显易懂。

讯飞超脑计划及研究成果

科大讯飞研究院副院长,带领团队研发语音识别新框架,和传统深度学习模型相比,增加了“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,可以使响应时间可以大大缩短。

近几年,中国讨论度最高的人工智能公司少不了科大讯飞。但大部分人是对讯飞的了解仅限于其语音技术,其实,科大讯飞还有一个更大的目标——打造“讯飞超脑”。

以“从能听会说到能理解会思考”为目标的讯飞超脑计划,要实现基于类人神经网络的认知智能引擎,预期成果是实现世界上第一个中文认知智能计算引擎。

魏思正是“讯飞超脑”计划的主要负责人之一。1999年,他进入中国科学技术大学电子工程与信息科学系学习,并于 2008年获得中国科学技术大学工学博士学位,同年起在科大讯飞研究院工作至今。如今,身为科大讯飞研究院副院长的魏思,同样是讯飞语音技术的核心人物。

基于讯飞超脑计划,科大讯飞正在开启一场以语音和语言为入口的“认知革命”。在过去6年中,讯飞的语音识别技术准确率从60.2%提升到95%以上。

准确率提升的背后,是魏思带领团队研发的一个语音识别“新武器”——一种名为“前馈型序列记忆网络 ”( FSMN )的新框架。据魏思介绍,和传统深度学习模型相比,前馈型序列记忆网络增加了一个“记忆块”的模块,用以存储对判断当前语音帧有用的历史信息和未来信息,从而实现语音识别中的“端到端”建模。和其他多个技术点结合后,讯飞基于FSMN的语音识别框架获得了大幅度的性能提升。这个新模型可以使响应时间可以大大缩短,例如原来的一个星期可以缩短到一天,还可以提升训练效果。

FSMN保证了语音识别的准确性,但这还不够。一个大趋势是,几乎所有在做语音技术的人工智能公司都会追求更高的语音合成自然程度。在这一点上,魏思领导团队则实现了基于深度学习的全新的语音合成系统,进一步提升合成语音的自然度和表现力。在有麻省理工学院、卡内基梅隆大学等国际知名科研机构参加的国际最高水平的语音合成比赛 Blizzard Challenge(暴风雪竞赛)中,魏思团队开发的系统连续 11 年夺冠,7 项指标全部全球第一,并且是所有参赛队伍中唯一超过自然人发音水平的系统。

当然,对于正在采取“平台+赛道”扩张方式的讯飞而言,无论是哪一个赛道,都离不开技术的积累,魏思在多年科研工作中的成果也正迎来新的机会。

比如,他曾创造性地提出多种中英文语音评测评测算法,并带领团队获得国际领先成果。现在,他们已经可以将相关的评测技术应用到普通话测试及教学中,其中英文口语测试系统在国内外首次达到人工评测员水平。这项技术最主要的特点是实现了测试管理的信息化和测试手段的现代化。

而在说话人语种识别研究上,魏思则提出了基于深度神经网络的语种识别算法,大幅提升了语种识别的效果,成为目前业界所有语种识别系统的标准配置。

类似的案例还有很多,魏思的技术征途也不再仅限于语音:他带领团队提出基于CNN的离线手写识别策略,在世界上首次实现试卷扫描自动评分系统;在人工智能-认知智能方面,魏思带领团队获得国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名成绩,该任务是国际常识推理领域的新型评测任务,被学术界普遍认为是替代图灵测试衡量机器智能水平的重要学术挑战……

如果说有什么在驱动魏思不断地创新,那肯定少不了他对现有技术的“不满足”。“虽然近几年深度神经网络的兴起使得语音识别性能获得了极大的提升,但是我们并不能迷信于现有的技术,总有一天新技术的提出会替代现有的技术”,魏思曾在一篇博文中这样写道。

回顾语音识别的发展历史和讯飞语音识别系统的最新进展,他也发现,技术的突破总是艰难而缓慢的,重要的是坚持和不断思考。他也坚信,“现在是一个伟大的时代”。

“那么,在这个伟大的时代,我们的征途是什么呢?我觉得有一句话非常能够表现我自己或者是讯飞研究院这么多年的思考,那就是:在中国,可以改变世界”。魏思认为,在这10年中,中国原创能力的蓬勃发展已经显现出来,与全世界同台竞技,“我们毫不怯场”。

展望下一个10年,魏思和他的团队同样有几个小目标:将讯飞研究院打造成一个世界知名的研究机构,培养出一批世界顶级的科学家,最后,能够解决几个基本的科学问题。

“在下一个10年或者20年,我们终将可以触及智能的本质,解开智慧之谜”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115560
  • 科大讯飞
    +关注

    关注

    19

    文章

    852

    浏览量

    63191
  • 讯飞超脑
    +关注

    关注

    0

    文章

    3

    浏览量

    4051
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025科大全球1024开发者节精彩回顾

    当全球产业格局和竞争形态重塑之时,AI将如何发展?11月6日,在第八届世界声博会暨2025科大全球1024开发者节发布会上,科大
    的头像 发表于 11-10 11:51 513次阅读
    2025<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>全球1024开发者节精彩回顾

    科大发布星火X1.5及系列AI产品

    11月6日,第八届世界声博会暨2025科大全球1024开发者节发布会上,科大以《更懂你的
    的头像 发表于 11-10 11:49 614次阅读

    打破交互困局:科大这样出手

    十年深耕,科大智能交互如何引领未来
    的头像 发表于 06-17 11:50 870次阅读
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>这样出手

    科大加速东南亚企业的人工智能应用

    日前,科大飞在新加坡成功举办合作伙伴峰会暨创新产品发布会。这场汇聚关键合作伙伴、行业先驱和技术领袖的盛会,不仅集中展示了科大最新AI创
    的头像 发表于 05-06 09:39 694次阅读

    科大亮相第137届广交会

    今天,第137届中国进出口商品交易会(广交会)在广州开幕。科大又一年参展,集中展示了星火大模型的最新技术
    的头像 发表于 04-17 09:30 953次阅读

    科大深度解析DeepSeek-V3/R1推理系统成本

    本篇分析来自科大技术团队,深度解析了DeepSeek-V3 / R1 推理系统成本,旨在助力开发者实现高性价比的MoE集群部署方案。感谢
    的头像 发表于 04-15 13:46 3322次阅读
    <b class='flag-5'>科大</b><b class='flag-5'>讯</b><b class='flag-5'>飞</b>深度解析DeepSeek-V3/R1推理系统成本

    科大携手西安铁路局打造人工智能平台

    近日,科大携手中国铁路西安局集团有限公司(以下简称“西安铁路局”)打造的人工智能平台正式上线启用。该人工智能平台集成星火大模型技术,
    的头像 发表于 03-17 16:14 803次阅读

    科大Air 2电纸书和掌阅Ocean4 Plus区别

    首先说说科大Air 2,这款设备的核心亮点在于它的AI功能和办公属性。8.2英寸的墨水屏,分辨率高达1920*1440,显示效果非常细腻,阅读时眼睛不会感到疲劳。它的屏占比达到了88.5%,视觉
    发表于 03-03 14:01

    开放平台上线DeepSeek大模型

    作为首批“人工智能国家队”,开放平台致力于为全球开发者提供领先的人工智能技术与解决方案,依托研究院源头技术创新和能力星云
    的头像 发表于 02-10 14:20 1654次阅读

    科大申请注册“烟火大模型”等商标

    近日,根据天眼查知识产权信息显示,科大股份有限公司在商标注册方面有了新的动作。该公司近期申请注册了多枚商标,其中包括“烟火大模型”“火炬大模型”和“星光大模型”等,这些商标的国际分类涵盖
    的头像 发表于 01-20 10:48 921次阅读

    科大将发布医疗大模型升级版

    近日,科大宣布了一项令人瞩目的计划:在2025年上半年,公司将正式发布基于星火X1的医疗
    的头像 发表于 01-17 09:57 936次阅读

    星火4.0 Turbo七大能力全面提升

    近日,科大发布了当前全国产算力平台上唯一的深度推理大模型——星火X1,并率先应用于教育、医疗等刚需场景。
    的头像 发表于 01-16 11:02 1194次阅读

    科大发布星火X1深度推理大模型

    近日,科大宣布了一项重大突破,成功推出了当前全国产算力平台上唯一的深度推理大模型——星火X1。这款大模型在中文数学能力方面位居国内首
    的头像 发表于 01-16 10:46 1059次阅读

    科大发布星火深度推理模型X1

    今天,科大正式发布星火深度推理模型X1,星火4.0 Turbo底座全面升级,首发星火语音同传大模型。
    的头像 发表于 01-15 15:54 1033次阅读

    科大即将发布星火深度推理模型X1

    近日,科大飞在1月7日成功举办的办公智能体产品升级发布会上,宣布了一项令人振奋的新进展。据科大官方透露,公司将于1月15日正式对外发布
    的头像 发表于 01-08 10:30 1025次阅读