0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

思必驰语音技术情况全面展示

思必驰 来源:思必驰 作者:思必驰 2021-06-04 16:15 次阅读

第二十八届中国国际广播电视信息网络展览会(以下简称CCBN2021)于2021年5月28日至30日在北京中国国际展览中心(静安庄馆)举行。思必驰IoT家电线产品总监于鹏伟受邀参加并带来了精彩主题分享,全面展示思必驰语音技术情况以及多模态技术在带屏终端的应用与经验。

CCBN2021展会展览面积60,000平米,设置专业展区20余个,举办会议论坛和专项活动30余场,同步进行线上展览和会议交流。在5月28日同期举办的CCBN BDF2021智慧广电+系列论坛——智能终端篇上,思必驰IoT家电线产品总监于鹏伟进行了题为《带屏终端场景下的多模态交互》的主题分享,全面展示了思必驰语音技术情况以及多模态技术在带屏终端的应用与经验。

在2021世界超高清视频(4K/8K)产业发展大会上,工业和信息化部部长肖亚庆表示,过去一年中,国内4K超高清电视的市场占比超过了70%,同时8K电视也开始加速渗透。

自去年以来,受疫情影响,民众居家娱乐需求提升,使得4K电视加速普及。据资料显示,2020年国内4K电视总销量约为3338万台,销售额超过千亿元。中国电子信息产业发展研究院院长张立介绍称,未来8K电视将成为电视厂商旗舰产品的主流配置。

据Strategy Analytics统计,2020年全球8K电视的销量低于预期,仅为35万台。但到了2021年,这个数字有望突破百万。到2025年,8K电视将进入全球范围内超过7200万个家庭之中,其中以北美和亚太地区占比最高。

于鹏伟在分享中提到,智能电视作为「客厅经济」中的核心代表产品,占据客厅场景最大的流量入口,一直是各大家电厂商争夺的核心领域。思必驰依托智能语音行业深耕多年的经验及关键技术优势,为智能电视打造流畅自然的语音入口+输出,同时背靠DUI平台,打通了超过300家第三方资源接口,为用户提供全屋家居控制、交通出行、新闻资讯、生活娱乐等各领域内容服务。除此之外,于鹏伟还分别介绍了思必驰的AMAEC技术、TH1520芯片和多模态交互技术的应用。

AMAEC,杜比全景声效的最佳搭档

AMAEC(AISpeech Multichannel Acoustic Echo Cancellation)是思必驰推出的多通道回声消除技术,采用传统信号处理方法结合深度学习网络,对每一独立的发声通道建立专有滤波系统,使得多扬声器系统的回声消除达到极佳效果。

思必驰AMAEC,适配4/6/8麦+N回路场景,保障中高端电视杜比全景声效下的语音交互无障碍进行。流畅自然智能语音交互与杜比全景声绝妙体验双管齐下,实为中高端智能电视更优之选。

目前思必驰与电视领域头部企业海信达成深度合作,海信及其子品牌东芝高端电视型号已全面搭载思必驰AMAEC技术,包括海信85U9E、海信75U9G Pro、海信85U7G max、东芝940、东芝840、东芝740等。

TH1520,系统CPU高占用的救星

TH1520是一款AI专用的双核增强型低功耗DSP芯片。大容量片内静态存储,多通道音频解码支持广域采样率,可以为上层SOC端的工作减轻压力。另外,芯片支持低功耗模式和全速模式,实现毫瓦级待机功耗和百毫瓦级的全速工作功耗。

TH1520集成思必驰语音算法,家居噪音环境下可以实现5米远场唤醒率>95%,识别准确率>92%,误唤醒仅1次/48h(国际认可1次/24h为优秀水平);支持唤醒词自定义,可内置本地指令数百条,响应时间<500ms;背靠DUI平台,可自选对接天气、音乐、故事、百科、新闻等海量技能,云端服务无限制。

目前海信S7F社交电视、近日发布的乐视GS系列电视,也同样搭载了TH1520语音专用芯片,在未来几个月还会有大批搭载TH1520芯片的智能电视发布出货。

多模态交互技术的应用

于鹏伟表示,思必驰全链路语音交互技术在一般家居场景底下能够为用户提供流畅的交互体验。

在一些特殊的场景底下,比如多位用户在激烈的玩电子游戏、亲朋好友聚会等,很容易出现多人同时交互的情况出现,此时纯语音交互则很难对声源进行精准判断,交互成功率会直线下降。

针对周边嘈杂干扰大、多人密集同时交互的情况,思必驰结合全链路语音交互技术及自研计算机视觉技术,推出多模态交互技术方案,根据视觉和音频特征,通过多模态融合VAD分离出说话人的目标语音,拒识其他说话人的声音,从而实现辅助降噪、提高声源定位的精准度,即使说话人在移动状态下也不受影响。

思必驰多模态交互技术方案还可以应用在会议大屏、商场显示大屏、地铁购票机等商用带屏显示设备中,目前此技术已在全国多个地区地铁的购票设备中落地。思必驰始终坚持技术源头创新,结合行业最新动态,为企业提供更优质的自然语言交互解决方案,为用户带来更自然的人机交互体验。

原文标题:CCBN | 思必驰:带屏终端场景下的多模态交互

文章出处:【微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IOT
    IOT
    +关注

    关注

    185

    文章

    3980

    浏览量

    193140
  • 思必驰
    +关注

    关注

    4

    文章

    241

    浏览量

    14150

原文标题:CCBN | 思必驰:带屏终端场景下的多模态交互

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语音数据集:开启智能语音技术的新篇章

    随着人工智能技术的飞速发展,语音数据集在推动智能语音技术的进步中发挥着越来越重要的作用。语音数据集是训练和优化
    的头像 发表于 12-29 11:06 196次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音技术
    的头像 发表于 12-28 11:28 308次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连
    发表于 11-24 17:41

    全面探讨智能语音关键技术解决方案

    和结束时间。这一技术常常应用于通话系统和语音识别系统,可以减少系统传输数据量和运算负担,尤其当作为语音识别任务的前置模块时, VAD给出的准确时间信息可以有效提升语音识别准确率。
    发表于 11-24 12:29 235次阅读
    <b class='flag-5'>全面</b>探讨智能<b class='flag-5'>语音</b>关键<b class='flag-5'>技术</b>解决方案

    语音识别技术:原理、应用与未来

    语音识别的原理、当前的应用情况以及对未来的展望。 二、语音识别原理 语音识别技术主要涉及两个主要步骤:特征提取和模式匹配。在特征提取阶段,算
    的头像 发表于 09-19 18:30 1167次阅读

    让文字会说话,启英泰伦离线语音合成(TTS)技术全面升级!

    “•A01,请用餐•请001号到03号窗口办理业务•本次列车即将到达火车南站,请提前准备下车”语音合成(TTS)技术作为人工智能领域的一项重要技术,已经深入大众生活,无孔不入。通过将文字转化
    的头像 发表于 09-04 16:27 521次阅读
    让文字会说话,启英泰伦离线<b class='flag-5'>语音</b>合成(TTS)<b class='flag-5'>技术</b><b class='flag-5'>全面</b>升级!

    【米尔-芯D9开发板- 国产平台试用】-- 01 -- 开箱上电

    ,我们的一个朋友也是做芯的代理的,前段时间也是刚刚从他那里得知芯这个芯片,从芯的退队来讲,芯的整体技术团队都是出自于NXP的,芯
    发表于 08-16 17:45

    如何使用Alexa语音服务集成在受约束的物联网设备上设置语音命令

    Cortex-M系列处理器的声控智能扬声器提供了技术演示和参考设计。本指南中的示例提供了将语音设备设置为智能扬声器的起点,不适用于生产用途。在本指南中,我们将使用点击通话在受约束的物联网设备上设置语音命令。 本
    发表于 08-02 12:53

    智能语音香薰灯:离线语音控制技术的优势与应用

    离线语音控制技术是指在不需要连接互联网的情况下,通过语音指令直接控制设备的技术。这种技术主要运用
    的头像 发表于 07-11 15:09 735次阅读
    智能<b class='flag-5'>语音</b>香薰灯:离线<b class='flag-5'>语音</b>控制<b class='flag-5'>技术</b>的优势与应用

    离线语音技术为智能家居注入新活力

    离线语音技术是指在无需联网的情况下,通过本地的处理器进行语音识别和指令执行。这种技术可以实现语音
    的头像 发表于 06-25 14:53 302次阅读
    离线<b class='flag-5'>语音</b><b class='flag-5'>技术</b>为智能家居注入新活力

    语音识别唤醒词的技术与应用

    词是语音识别技术中的重要组成部分,它的作用是检测语音输入并判断是否包含唤醒词,如果包含则执行相应的指令或响应。 语音识别唤醒词的技术是基于机
    的头像 发表于 06-24 04:02 868次阅读

    NRK3303语音识别芯片,自制幻彩灯语音效果展示

    语音识别语音芯片
    九芯电子语音芯片
    发布于 :2023年06月06日 16:59:55

    语音识别技术的概念及应用前景

    智能语音技术是人工智能应用最成熟的技术之一,并拥有交互的自然性,就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的
    发表于 05-27 09:41

    单火线智慧屏(全面屏中控屏)触屏语音智能开关单火供电技术

    单火线供电全面屏无需零线:突破“屏”颈,解决痛点,单火线智慧屏供电技术 ,采用单火线模块XD301F,可驱动搭载安卓,Linux等系统的86全面屏触屏语音智能开关、中控屏面板。
    的头像 发表于 05-07 16:10 769次阅读
    单火线智慧屏(<b class='flag-5'>全面</b>屏中控屏)触屏<b class='flag-5'>语音</b>智能开关单火供电<b class='flag-5'>技术</b>

    需要一个TJA1102SHN/0Z的宜模型用于模拟目的,求分享

    我需要一个 TJA1102SHN/0Z 的宜模型用于模拟目的。你能提供吗?
    发表于 04-23 06:12