0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米声学语音技术已经实现全面自研,4项技术实现了业内突破

我快闭嘴 来源:与非网 作者:与非网 2020-06-24 14:52 次阅读

小米的声学语音技术目前已经实现全面自研,并在自研部分领域持续领先,声学语音技术已迎来全新时代。

据了解,小米声学语音的 4 项技术实现了业内突破,分别是语音交互实现“情感化”、AIoT 放音技术升级、就近唤醒全新升级、两麦阵列唤醒新策略。

语音交互实现“情感化”:小米 AI 实验室在“情感数据量有限”的前提下,通过不同声学模型、不同声码器组合最终上线自然、拟人效果的情感 TTS(Text to speech,人工语音合成),成为业内首家情感化 TTS 大规模落地的企业。

此次小米小爱同学 Art 全面支持情感化语音交互,基于有限但类型不同的情感音频数据(如开心、关心、害羞、惊讶等),通过不同技术训练并迭代声学模型,最终支持情感 TTS 合成并实现“小爱同学”音色情感化、拟人化。未来,小米语音将升级此技术——支持情感 TTS 实时合成。

AIoT 放音技术升级:首次实现一句话全屋同步播放相同音频功能。据悉,小米小爱音箱 Art 是首款可以实现语音支持全屋播放的设备。用户直接对小爱同学说“全屋播放 XXX”,无需提前在 App 端进行手动设置,即可实现一句话语音交互。

就近唤醒全新升级:业内首次上线跨设备关闭闹钟功能。此次小米小爱音箱 Art 就近唤醒全新升级,可支持跨设备关闭闹钟。远处的音箱闹钟响了,唤醒近处的音箱可以直接关闭远处的闹钟。此功能在业内首次上线,小米小爱音箱 Art 也是首款支持该功能的产品

两麦阵列唤醒新策略:兼顾低功耗与高性能,高效降噪,获得干净人声。小米小爱音箱 Art 同步支持两麦阵列唤醒技术。在麦克风阵列方面,小米采用两麦盲源分离降噪前端,通过盲源分离、降噪、回声消除等技术,在多声源的嘈杂环境、音箱自身播放音乐时,都能结合语音增强技术,消除噪音的强干扰,获得干净、准确的人声音频。

目前,小米 IoT 平台连接的智能硬件数已达到 2.5 亿台,音箱出货量已经达到 2200 万台。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音箱
    +关注

    关注

    36

    文章

    624

    浏览量

    67077
  • AI
    AI
    +关注

    关注

    87

    文章

    26338

    浏览量

    263943
  • 小米
    +关注

    关注

    68

    文章

    14121

    浏览量

    141685
收藏 人收藏

    评论

    相关推荐

    2024年小米汽车产业链分析及新品上市全景洞察报告

    2024年小米汽车产业链分析及新品上市全景洞察报告 *附件:小米汽车全面洞察报告.pdf 本文主要介绍小米汽车在市场中的布局和优势,以及其
    发表于 03-29 13:46

    知语云全景监测技术:现代安全防护的全面解决方案

    随着信息技术的飞速发展,网络安全问题日益突出,企业和个人对安全防护的需求也越来越迫切。在这个背景下,知语云全景监测技术应运而生,为现代安全防护提供一个全面而高效的解决方案。 知语云全
    发表于 02-23 16:40

    那些杠鸿蒙的现在怎么样

    Android的道路的,好比现在的小米澎湃系统亦是如此。 而作为国家主推的鸿蒙系统,现在展现出未来大好的局面。先后推出4.0、星河版。其中最新星河版已经全面对开发者开发申请。 1、鸿蒙系统采用全栈
    发表于 02-16 22:03

    uPOL封装技术如何实现高电流密度供电突破

    uPOL封装技术如何实现高电流密度供电突破
    的头像 发表于 12-01 16:12 284次阅读
    uPOL封装<b class='flag-5'>技术</b>如何<b class='flag-5'>实现</b>高电流密度供电<b class='flag-5'>突破</b>

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一备受瞩目的创新。离线语音识别技术能够将人的
    发表于 11-24 17:41

    基于SOPC技术实现语音处理系统的设计方法

    电子发烧友网站提供《基于SOPC技术实现语音处理系统的设计方法.pdf》资料免费下载
    发表于 10-26 14:34 0次下载
    基于SOPC<b class='flag-5'>技术</b><b class='flag-5'>实现</b>的<b class='flag-5'>语音</b>处理系统的设计方法

    抗扰控制技术介绍

    本文简单介绍抗扰控制技术和它是如何从经典PID控制技术演变出新型实用控制技术的基本想法和关键技术
    发表于 09-28 06:04

    语音合成技术的简介与未来发展

    计算机技术生成人类可听的语音,从而实现语音交互的过程。根据合成方式的不同,语音合成技术可分为以下
    的头像 发表于 09-15 18:17 769次阅读

    小米机器狗二代来了,比上一代更瘦、更快、更强!NVIDIA主控+全志MR813+全志R329协处理器

    提到,此前有公司买CyberDog只是专门为了拆里面的微电机。因此随着CyberDog 2的发售,小米也发布的CyberGear微电机,并单独将CyberGear微电机面向行业开
    发表于 09-06 09:39

    线路板级电子增材制造技术实现全面突破,优势显著

    ,应用于电子线路板生产制造的EAMP™技术日趋成熟,“材料+工艺”配套技术实现全面突破,生产产品完成各端验证,当下
    的头像 发表于 07-11 10:58 381次阅读
    线路板级电子增材制造<b class='flag-5'>技术</b>已<b class='flag-5'>实现</b><b class='flag-5'>全面</b><b class='flag-5'>突破</b>,优势显著

    情感语音识别技术及其应用

    中的声学特征和语言学特征,来判断说话者情感的状态。常用的情感标签包括愉悦、悲伤、愤怒、惊讶等。该技术实现需要使用信号处理技术、机器学习和深度学习等
    的头像 发表于 06-24 03:24 737次阅读

    TTS语音合成技术及其应用

    。 TTS语音合成技术已经广泛应用于各个领域,如语音助手、智能客服、车载导航等。在语音助手方面,TTS
    的头像 发表于 06-24 02:28 831次阅读

    语音识别技术的概念及应用前景

    。AI+IoT技术的应用,大到汽车和电视,小到灯泡、闹钟,都可以使用智能语音的控制技术。 当前物联网已经非常成熟,各类设备都可以通过以太网、WIFI、蓝牙等方式进行连接,
    发表于 05-27 09:41

    什么是UWB技术?UWB技术有哪些应用场景?

    ”UWB 技术功能演示。手机指向支持 UWB 技术的电风扇,手机上会弹出一个控制卡片,进而实现对风扇的操控,无需实体遥控器,手机也不用再下载单独的 APP。除此以外,小米“一指连”还
    发表于 05-11 11:45

    单火线智慧屏(全面屏中控屏)触屏语音智能开关单火供电技术

    单火线供电全面屏无需零线:突破“屏”颈,解决痛点,单火线智慧屏供电技术 ,采用单火线模块XD301F,可驱动搭载安卓,Linux等系统的86全面屏触屏
    的头像 发表于 05-07 16:10 768次阅读
    单火线智慧屏(<b class='flag-5'>全面</b>屏中控屏)触屏<b class='flag-5'>语音</b>智能开关单火供电<b class='flag-5'>技术</b>