0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中文口语语言处理会议已经发展成为相关领域最重要的国际研讨会

思必驰 来源:djl 作者:思必驰 2019-08-06 11:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ISCSLP中文口语语言处理会议由国际著名学术协会ISCA的中文学术小组SIG-CSLP主办,为全球针对中文语言处理技术所举办的大型国际研讨会,1997年创办首届,每两年举行一次,并由新加坡、中国大陆、***及香港等四个国家和地区轮流举办,该会议已经发展成为中文语言处理技术相关领域最重要的国际研讨会。

第十届中文口语语言处理国际会议ISCSLP2016 在天津召开,会议聚集了来自全球各地学界和产业界的人士,并向全球征集业界前沿学术论文稿件,结合当前产业发展态势,共同探讨语言处理的未来发展趋势。

图1 思必驰首席科学家俞凯现场

10月18日下午,思必驰首席科学家/联合创始人、上海交通大学俞凯教授,在大会新技术产业论坛上,进行了题为《基础技术创新推动产业进步》的主题分享。俞凯教授表示,智能语音在经历着从感知智能到认知智能的飞跃,解决如何使智能语音进行理解、决策及表述的问题非常重要。俞凯教授强调技术型公司原始创新的重要性,着重介绍了思必驰基于深度学习语音识别技术,如,VDCNN算法在降噪处理上表现出不可取代的优势;帧同步解码转换为音素同步解码搜索空间减少80%以上等技术成果。依托稳健的研究实力,思必驰用实际行动践行着作为技术型公司应有的创新、原创精神。

思必驰专注为智能硬件提供自然语言交互方案,为智能车载、智能家居、智能机器人三个垂直领域定制基于交互场景的语音方案,应用场景各有不同,思必驰依托强大的研发实力满足用户在不同场景下的个性化需求。虽然目前国内智能语音领域,通用的开源工具应用较多,难度较低,但通用的开源工具在效率和权限上有极大局限性,既无法满足特定的前沿算法需求,也常常无法满足用户基于场景的个性化需求,不同专业领域的算法、数据、架构等都要依托实际应用进行搭建及优化。因此,思必驰专注技术研发,用技术实力说话,通过定制方案满足用户个性化需求。

如何确保技术的专业性与前沿性呢?思必驰成立之初即与上海交大成立联合实验室“Speech Lab”,由思必驰联合创始人,上海交通大学教授俞凯全权负责,专注智能语音技术的研发与应用,思必驰拥有独立知识产权,并积极促进前端科研成果的商业化转化与应用。正如俞凯教授在演讲中所提,近期,思必驰上海交大联合实验室的科研工作又取得了极大突破。

风暴抗噪:VDCNN算法

抗噪处理:VDCNN算法模型结构

噪声环境下的语音识别一直以来是一个难题。目前基于深度学习的主流语音识别技术及引擎,已经可以在很多信噪比相对比较好的环境下取得良好的准确率,但是在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),性能变会急剧下降,远远不能满足实际应用的需求。

思必驰和上海交大联合实验室,对基于噪声条件下的语音识别问题进行了深入的研究,历时一年多以来,提出了VDCNN算法模型结构。相比于传统语音模型仅使用1至2层卷积层,思必驰通过堆叠较小的卷积层和池化层,将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述,能够更好地在语音模型的内部实现了声学自动降噪的能力。

思必驰上海交大联合实验室目前所提出的模型和架构,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率。相比于世界其他机构目前10%左右的最好结果,有一个大幅度的明显优势,在抗噪语音识别上是一个新的里程碑。此外,除了多类别的加性噪声,此模型也被验证在远场识别环境下也具有明显的优势。近5年,在Aurora4噪声数据库上,公开可查的世界上著名研究机构最好语音识别系统对比如下图所示:

思必驰上海交大联合实验室VDCNN算法模型结构,不但在噪声环境下具有非常好的准确率,还具有训练收敛速度快,模型参数规模小等优势,这些特点都为VDCNN的真实使用提供了便利。

新型解码框架

新型解码框架:Phone Synchronous Decoding

大词汇连续语音识别由于词汇量庞大且没有固定语法,会造成搜索空间非常庞大。目前,通过很多传统做法可以加快语音识别速度,如,离线基于WFST的搜索空间预优化,在线逐帧同步维特比解码,结合可变帧率分析等方法。但是,离线优化效果有限,逐帧搜索计算量大,而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

近来,连接时序模型(CTC)取代传统隐马尔科夫模型(HMM),被应用到语音识别中,其特点显著,能够针对识别序列进行整体建模,带来更好的前后文建模能力,使语音识别的建模单元显著减少,并使庞大搜索空间相应减小。另一方面,模型本身建模了多帧对一个音素的映射关系,使得模型输出的声学信息集中。根据模型输出特点,适宜采用更长的搜索步长,由逐帧同步解码,转变为音素同步解码,从而减少了搜索计算量。

思必驰结合以上两点改进,使语音识别系统的速度累积提高20-30倍,内存下降50%以上,从而使得大词汇连续语音识别可以应用于离线手持设备;而基于该系统提出的置信度算法,得益于集中的声学信息和相应设计的优化算法,取得近一倍的提升。显著改善了语音识别系统的用户体验。

近年来,思必驰凭借稳健的研发实力,在智能车载、智能家居、智能机器人等领域的语音市场展开了布局,与阿里、小米、联想、海尔、美的、庆科、浙江大华等企业建立了战略合作关系,为广大用户带来流畅的语音交互体验。思必驰将始终秉承创新精神,保持技术专注性与独立性,打造更人性化的语音交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能机器人
    +关注

    关注

    18

    文章

    922

    浏览量

    85993
  • 智能语音
    +关注

    关注

    11

    文章

    829

    浏览量

    50346
  • 思必驰
    +关注

    关注

    4

    文章

    416

    浏览量

    16048
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    行芯科技亮相IIC 2026国际集成电路展览研讨会

    近日,全球集成电路领域的年度标杆盛会——2026国际集成电路展览研讨会(IIC 2026)在上海圆满落幕。
    的头像 发表于 04-02 17:28 597次阅读

    江苏省语言计算及应用实验室多项成果入选ICASSP 2026

    近日,国际声学、语音与信号处理会议 ICASSP 2026 公布录用结果。江苏省语言计算及应用实验室多篇论文被会议接收。ICASSP 长期被视为声学、语音与信号
    的头像 发表于 03-11 11:47 641次阅读
    江苏省<b class='flag-5'>语言</b>计算及应用实验室多项成果入选ICASSP 2026

    华盛昌亮相广东省高端仪器产业创新发展学术研讨会

    2025年12月13日,“广东省高端仪器产业创新发展学术研讨会及广东省高端仪器产业创新联盟第一届理事第二次会议暨专家委员工作
    的头像 发表于 12-25 17:31 1901次阅读

    中海达亮相2025智慧城市与减灾国际学术研讨会

    12月5日至7日,由中国矿业大学、联合国减少灾害风险办公室(UNDRR)及科希策帕沃尔·约瑟夫·沙法里克大学联合举办的2025年“智慧城市与减灾”国际学术研讨会顺利召开。作为深耕时空信息领域多年
    的头像 发表于 12-23 09:21 746次阅读

    CET中电技术亮相深圳-澳门2025国际微电网研讨会

    2025年11月9-13日,由中国科学院深圳先进技术研究院和澳门大学联合举办第19届国际微电网研讨会先后在深圳和澳门两地顺利举行。本届研讨会汇聚来自全球20多个国家和地区的知名专家学者与行业领袖
    的头像 发表于 11-13 18:16 932次阅读
    CET中电技术亮相深圳-澳门2025<b class='flag-5'>国际</b>微电网<b class='flag-5'>研讨会</b>

    泰矽微亮相2025 DVN上海国际汽车照明研讨会

    第37届DVN(上海)国际汽车照明研讨会在上海宝山区宝武钢铁博中心金色炉台成功举办,以“中国颠覆性市场-技术、成本、效率,如何影响整个汽车照明行业”为主题,汇聚全球汽车照明领域客户深
    的头像 发表于 11-04 17:30 1827次阅读

    瑞丰光电亮相2025 DVN上海国际汽车内饰与座舱研讨会

    10月30日,瑞丰光电受邀亮相第六届2025DVN(上海)国际汽车内饰&座舱研讨会并发表演讲,围绕《Mini LED技术方案在汽车座舱应用与创新》,全面展示了瑞丰在车载显示领域的创新路径与技术布局。
    的头像 发表于 11-04 15:06 951次阅读

    瑞丰光电亮相ISAL 2025国际汽车照明研讨会

    此前,9月22-24日,瑞丰光电携全新汽车照明与显示产品及解决方案精彩亮相第十六届国际汽车照明研讨会(ISAL 2025)。
    的头像 发表于 10-11 16:24 1056次阅读

    东软集团亮相新质生产力国际研讨会

    近日,“现代化进程中的新质生产力”国际研讨会在北京召开。中国国家创新与发展战略研究会学术委员常务副主席黄奇帆、香港中文大学(深圳)公共政策
    的头像 发表于 09-20 16:38 1598次阅读

    集创北方亮相2025全国LED产业发展与技术研讨会

    9月14日至16日,由中国光学光电子行业协会指导,中国光学光电子行业协会光电器件分会与发光二极管显示应用分会联合主办的“第十九届全国LED产业发展与技术研讨会(2025’LED)暨2025全国LED显示应用技术交流及产业发展
    的头像 发表于 09-17 14:26 1218次阅读

    2025IEEE亚洲宽禁带功率器件及应用研讨会落幕

    2025 年 8 月 15 日至 17 日,2025 IEEE 亚洲宽禁带功率器件及应用研讨会(WiPDA Asia 2025)在北京国际会议中心成功举办。 本次功率器件研讨会由 IEEE 电力
    的头像 发表于 08-28 16:00 872次阅读
    2025IEEE亚洲宽禁带功率器件及应用<b class='flag-5'>研讨会</b>落幕

    中科创达亮相2025印尼智能汽车闭门研讨会

    近日,由中科创达(ThunderSoft)与PT Alphatech Dinamik Asia携手主办的印尼智能汽车闭门研讨会,在印度尼西亚雅加达BSD City顺利落幕。此次研讨会与印尼国际汽车展
    的头像 发表于 08-01 11:37 1612次阅读

    概伦电子亮相台积电2025中国技术研讨会

    近日,备受瞩目的台积电2025中国技术研讨会(TSMC Technology Symposium 2025)在上海国际会议中心举行。本次研讨会汇集国内顶尖芯片设计公司及生态合作伙伴,作为国内首家
    的头像 发表于 06-30 17:42 2396次阅读

    瑞丰光电亮相DVN东京国际汽车照明研讨会

    近日,瑞丰光电受邀亮相DVN(东京)国际汽车照明研讨会。本次研讨会,瑞丰光电在现场展示了多项前沿技术并发表主题演讲,详细介绍了在车载光学领域的技术应用实践,以及在车内外显示交互的最新进
    的头像 发表于 06-16 17:17 1225次阅读

    Rambus邀您相约Keysight设备安全研讨会

    ,特别是在加密技术、AI安全、后量子密码学等前沿领域研讨会涵盖了从嵌入式系统到大规模数据中心的安全挑战与解决方案以及汽车领域相关安全认证。与会者将有机会了解最新的市场动态、技术突破
    的头像 发表于 06-03 15:25 1316次阅读