0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中文口语语言处理会议已经发展成为相关领域最重要的国际研讨会

思必驰 来源:djl 作者:思必驰 2019-08-06 11:44 次阅读

ISCSLP中文口语语言处理会议由国际著名学术协会ISCA的中文学术小组SIG-CSLP主办,为全球针对中文语言处理技术所举办的大型国际研讨会,1997年创办首届,每两年举行一次,并由新加坡、中国大陆、***及香港等四个国家和地区轮流举办,该会议已经发展成为中文语言处理技术相关领域最重要的国际研讨会。

第十届中文口语语言处理国际会议ISCSLP2016 在天津召开,会议聚集了来自全球各地学界和产业界的人士,并向全球征集业界前沿学术论文稿件,结合当前产业发展态势,共同探讨语言处理的未来发展趋势。

图1 思必驰首席科学家俞凯现场

10月18日下午,思必驰首席科学家/联合创始人、上海交通大学俞凯教授,在大会新技术产业论坛上,进行了题为《基础技术创新推动产业进步》的主题分享。俞凯教授表示,智能语音在经历着从感知智能到认知智能的飞跃,解决如何使智能语音进行理解、决策及表述的问题非常重要。俞凯教授强调技术型公司原始创新的重要性,着重介绍了思必驰基于深度学习语音识别技术,如,VDCNN算法在降噪处理上表现出不可取代的优势;帧同步解码转换为音素同步解码搜索空间减少80%以上等技术成果。依托稳健的研究实力,思必驰用实际行动践行着作为技术型公司应有的创新、原创精神。

思必驰专注为智能硬件提供自然语言交互方案,为智能车载、智能家居、智能机器人三个垂直领域定制基于交互场景的语音方案,应用场景各有不同,思必驰依托强大的研发实力满足用户在不同场景下的个性化需求。虽然目前国内智能语音领域,通用的开源工具应用较多,难度较低,但通用的开源工具在效率和权限上有极大局限性,既无法满足特定的前沿算法需求,也常常无法满足用户基于场景的个性化需求,不同专业领域的算法、数据、架构等都要依托实际应用进行搭建及优化。因此,思必驰专注技术研发,用技术实力说话,通过定制方案满足用户个性化需求。

如何确保技术的专业性与前沿性呢?思必驰成立之初即与上海交大成立联合实验室“Speech Lab”,由思必驰联合创始人,上海交通大学教授俞凯全权负责,专注智能语音技术的研发与应用,思必驰拥有独立知识产权,并积极促进前端科研成果的商业化转化与应用。正如俞凯教授在演讲中所提,近期,思必驰上海交大联合实验室的科研工作又取得了极大突破。

风暴抗噪:VDCNN算法

抗噪处理:VDCNN算法模型结构

噪声环境下的语音识别一直以来是一个难题。目前基于深度学习的主流语音识别技术及引擎,已经可以在很多信噪比相对比较好的环境下取得良好的准确率,但是在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),性能变会急剧下降,远远不能满足实际应用的需求。

思必驰和上海交大联合实验室,对基于噪声条件下的语音识别问题进行了深入的研究,历时一年多以来,提出了VDCNN算法模型结构。相比于传统语音模型仅使用1至2层卷积层,思必驰通过堆叠较小的卷积层和池化层,将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述,能够更好地在语音模型的内部实现了声学自动降噪的能力。

思必驰上海交大联合实验室目前所提出的模型和架构,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率。相比于世界其他机构目前10%左右的最好结果,有一个大幅度的明显优势,在抗噪语音识别上是一个新的里程碑。此外,除了多类别的加性噪声,此模型也被验证在远场识别环境下也具有明显的优势。近5年,在Aurora4噪声数据库上,公开可查的世界上著名研究机构最好语音识别系统对比如下图所示:

思必驰上海交大联合实验室VDCNN算法模型结构,不但在噪声环境下具有非常好的准确率,还具有训练收敛速度快,模型参数规模小等优势,这些特点都为VDCNN的真实使用提供了便利。

新型解码框架

新型解码框架:Phone Synchronous Decoding

大词汇连续语音识别由于词汇量庞大且没有固定语法,会造成搜索空间非常庞大。目前,通过很多传统做法可以加快语音识别速度,如,离线基于WFST的搜索空间预优化,在线逐帧同步维特比解码,结合可变帧率分析等方法。但是,离线优化效果有限,逐帧搜索计算量大,而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

近来,连接时序模型(CTC)取代传统隐马尔科夫模型(HMM),被应用到语音识别中,其特点显著,能够针对识别序列进行整体建模,带来更好的前后文建模能力,使语音识别的建模单元显著减少,并使庞大搜索空间相应减小。另一方面,模型本身建模了多帧对一个音素的映射关系,使得模型输出的声学信息集中。根据模型输出特点,适宜采用更长的搜索步长,由逐帧同步解码,转变为音素同步解码,从而减少了搜索计算量。

思必驰结合以上两点改进,使语音识别系统的速度累积提高20-30倍,内存下降50%以上,从而使得大词汇连续语音识别可以应用于离线手持设备;而基于该系统提出的置信度算法,得益于集中的声学信息和相应设计的优化算法,取得近一倍的提升。显著改善了语音识别系统的用户体验。

近年来,思必驰凭借稳健的研发实力,在智能车载、智能家居、智能机器人等领域的语音市场展开了布局,与阿里、小米、联想、海尔、美的、庆科、浙江大华等企业建立了战略合作关系,为广大用户带来流畅的语音交互体验。思必驰将始终秉承创新精神,保持技术专注性与独立性,打造更人性化的语音交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能机器人
    +关注

    关注

    17

    文章

    823

    浏览量

    81320
  • 智能语音
    +关注

    关注

    10

    文章

    759

    浏览量

    48359
  • 思必驰
    +关注

    关注

    4

    文章

    241

    浏览量

    14150
收藏 人收藏

    评论

    相关推荐

    如何成为一名嵌入式C语言高手?

    各类技术讲座、研讨会和培训班,通过与业内专家和同行的交流互动,提升自己的技术水平。 五、持续学习与自我提升嵌入式系统领域的技术更新迅速,我们应该保持持续学习的态度,不断更新自己的知识储备。阅读最新的技术
    发表于 04-07 16:03

    2024 ETAP 电气系统数字孪生平台技术研讨会(深圳站)

    胜”的新思想新战略。我们致力服务大湾区建设发展,在深圳结成了众多合作伙伴,今次亦邀请他们共同分享成功经验。我们与施耐德电气共同举办本次研讨会,与各行业专家共同探讨电力系统数字孪生技术在相关行业
    发表于 03-30 13:06

    如何成为一名嵌入式C语言高手?

    各类技术讲座、研讨会和培训班,通过与业内专家和同行的交流互动,提升自己的技术水平。 五、持续学习与自我提升嵌入式系统领域的技术更新迅速,我们应该保持持续学习的态度,不断更新自己的知识储备。阅读最新的技术
    发表于 03-25 14:12

    高效管理会议空间:了解会议室屏蔽器的作用与应用?|深圳特信电子有限公司.

    更好地利用这一设备保障会议的安全和效率。在未来的工作和会议中,选择合适的会议室屏蔽器将成为保障信息安全的重要措施之一。以上就是深圳市特信电子
    发表于 03-11 09:08

    有方科技出席物联网产业发展研讨会

    近日,2023年第五届物联网产业发展与技术合作研讨会(以下简称“研讨会”)在西安举行。此次研讨会由陕西省工业和信息化厅主办,西安邮电大学、中国移动通信集团陕西有限公司、西安有方数智科技
    的头像 发表于 11-28 15:47 701次阅读

    硬件开发少走弯路,来华秋这场研讨会

    制造的高可靠性? 11月23日,华秋将联合凡亿电路、耀创电子及行业资深PCB设计专家,举办一场面向电子工程师的技术交流会议\" 2023电子设计与制造技术研讨会 “。会议将从EDA
    发表于 11-10 14:17

    硬件开发少走弯路,来华秋这场研讨会提升技能

    制造的高可靠性? 11月23日,华秋将联合凡亿电路、耀创电子及行业资深PCB设计专家,举办一场面向电子工程师的技术交流会议\" 2023电子设计与制造技术研讨会 “。会议将从EDA
    发表于 11-10 14:14

    安全畅连,智慧未来 – ST上海NFC研讨会开始报名

    数字时代, NFC技术 已经成为连接人与物,物与物的重要桥梁,应用也越来越广泛。如何在物联网、智能家居、汽车电子领域实现安全畅联?您可以在本次研讨会上得到答案。该
    的头像 发表于 11-02 08:10 251次阅读
    安全畅连,智慧未来 – ST上海NFC<b class='flag-5'>研讨会</b>开始报名

    【深圳线下】就在明天!数字设计与签核研讨会专场 — 2023 Cadence 中国技术巡回研讨会

    电子设计自动化领域领先的供应商 Cadence,诚邀您参加“2023 Cadence 中国技术巡回研讨会”。会议将集聚 Cadence 的开发者与资深技术专家,与您分享数字设计与签核解决方案,并与
    的头像 发表于 10-30 11:35 222次阅读
    【深圳线下】就在明天!数字设计与签核<b class='flag-5'>研讨会</b>专场 — 2023 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>

    这场研讨会硬件工程师不要错过

    加工等环节深入讲解,全程干货分享,通过实际案例方便大家理解。华秋也希望通过研讨会活动,拉近与客户之间的距离,倾听客户的心声,不断学习进步,“让华秋更好地服务客户”。 如果您也想参与本次研讨会,欢迎点击
    发表于 10-27 11:48

    【华秋研讨会】这场研讨会硬件工程师不要错过

    加工等环节深入讲解,全程干货分享,通过实际案例方便大家理解。华秋也希望通过研讨会活动,拉近与客户之间的距离,倾听客户的心声,不断学习进步,“让华秋更好地服务客户”。 如果您也想参与本次研讨会,欢迎点击
    发表于 10-27 11:44

    【成都线下】就在明天!数字设计与签核研讨会专场 — 2023 Cadence 中国技术巡回研讨会

    电子设计自动化领域领先的供应商 Cadence,诚邀您参加“2023 Cadence 中国技术巡回研讨会”。会议将集聚 Cadence 的开发者与资深技术专家,与您分享数字设计与签核解决方案,并与
    的头像 发表于 10-23 11:55 272次阅读
    【成都线下】就在明天!数字设计与签核<b class='flag-5'>研讨会</b>专场 — 2023 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>

    【成都线下】就在明天!系统验证及 IC 验证研讨会专场 — 2023 Cadence 中国技术巡回研讨会

    电子设计自动化领域领先的供应商 Cadence,诚邀您参加“2023 Cadence 中国技术巡回研讨会”。会议将集聚 Cadence 的开发者与资深技术专家,与您分享系统验证及 IC 验证解决方案
    的头像 发表于 10-23 11:55 310次阅读
    【成都线下】就在明天!系统验证及 IC 验证<b class='flag-5'>研讨会</b>专场 — 2023 Cadence 中国技术巡回<b class='flag-5'>研讨会</b>

    一座难求!国产嵌入式处理器工业研讨会-广州站,圆满落幕!

    异常火爆,一座难求!2023年9月26日,创龙科技主办的“国产嵌入式处理器工业研讨会”广州站圆满收官。本次研讨会现场聚集了众多资深嵌入式开发者以及行业专家,共同探讨了国产处理器、国产操
    发表于 09-30 23:44

    2023北京国际电视技术研讨会(ITTC),千视与业界“大咖”共议媒体创作新趋势

    5月24-25日,2023年北京国际电视技术研讨会在北京梅地亚中心举行。北京国际电视技术研讨会(ITTC)自1993年创办,至今已届30年,是我国媒体科技
    的头像 发表于 05-31 16:35 498次阅读
    2023北京<b class='flag-5'>国际</b>电视技术<b class='flag-5'>研讨会</b>(ITTC),千视与业界“大咖”共议媒体创作新趋势