0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制技术让每一个家电都能说会听

星星科技指导员 来源:mouser 作者:Wang Jing 2023-05-09 10:32 次阅读

你是否曾经幻想过这些场景:回到家,对着电视说想看的节目,电视会自动开启并切换至目标频道?或者对着炉子说开始小火慢炖,晚餐会以恰当的火候自动烹饪?现如今,家用电器的确可以实现诸如此类的功能,通过语音控制,疲惫一天的你不用亲力亲为,坐在沙发上对着各种电器发出指令,它们便会听话地完成你的各种需求。

实际上,家用电器能说会听是物联网的产物。物联网架构复杂,涉及方面广,越来越多的企业选择云上托管物联网设备体系,因为云端架构安全便捷,基于人工智能(比如,自然语言处理)模型,训练和部署等过程都通过简单的点击即可完成,功能强大,可以极大程度地为公司节约人力和物力。云端物联网通常包括一个安置在家庭中的传感器设备,通过Wi-Fi连接到网络,用于接受数据,将数据传给云端数据库,在云环境中进行分析处理。

随着人工智能和物联网的发展,人机交互给人们带来越来越高端的体验。语音控制技术应用最为广泛,也是当今的热门研究课题。令人耳目一新的是在家用电器方面的应用,摒弃了传统的遥控器装备,通过口令让家用电器完成各项功能。语音控制家电技术围绕人工智能,机器学习语义识别,物联网 (IoT),云计算 (cloud computing) 而展开。

本文以云端架构为框架,为大家介绍语音控制技术是如何让家用电器能说会听的。主要内容将围绕以下几个方面展开:

A. Azure云端语音控制和识别技术

1. 云端物联网
2. 云端语音控制技术基本解决方案步骤

B. 相关主要技术说明

1. Universal Windows Platform (UWP)
2. Cognitive service 的语音识别APIs & SDK
3. Language Understanding Intelligent Service (LUIS)
4. 运行Windows 10 IoT核心版的Raspberry Pi 3

C. 语音控制技术如何应用于家电

1. 核心技术
2. 架构
3. 功能
4. 解决方案

D. 总结

Azure云端语音控制和识别技术

语音控制系统包括了语音识别、自然语音理解、对话管理、自然语言生成、语音合成。

pYYBAGRZsH2AasTIAABkO7w-87Q150.png

1) 云端物联网

语音识别是指语音到文本的转化。Azure 平台的TTS(text to speech)采用Universal language模型,该模型对Microsoft已有数据进行了训练,并部署在云端,也可以创建和训练自定义的语言模型,根据需要选择特定的词汇并将其加入训练数据中。
自然语言分析/自然语言处理,是机器学习的一部分,设计模型并进行训练。
对话管理的任务主要有下三点:

a. 预测用户意图

对话内容进行分析,机器学习模型预测,确定下一步做什么。

b. 作为接口与后端/任务模型进行交互

作为应用程序接口与服务器端或模型进行请求交互,获取反馈结果,生成文字结果。

c. 提供语义分析结果的期望值

根据用户的提问,通过一系列的语义解析,做出满足用户期望的回应。
语言答案的文本生成是通过模型分析用户的指令并作出文字回应。
语音合成技术主要作用是将文本转化成拟人化语音的需求,基础的Azure 云端语音合成使用语音SDK或REST API使用标准(详细说明见下文),神经或自定义语音实现文本转语音的过程。

家用电器中,对话模式的情感要求会低一些,因为用户发出的大多是功能请求,比如:开机,询问温度或湿度等等。

2) 云端语音控制技术基本解决方案步骤

对话模式
对话模式是人机语言交互的核心,所有模式围绕其展开。当用户发出指令,系统便切换到了对话模式。Azure上使用UWP 应用平台,开发一个界面,用于监测人声触发(例如:对平台说: ‘Hi, cloud!‘)成功与否。
听写模式
使用者说出一段较长的语音,然后等待语音识别的结果。当‘Hi, cloud!‘指令发起后,用户正式发出指令(说出想对机器说的话),这时语音便传到了语义分析系统(Azure LUIS),内容传入语义分析系统,Azure上的实时语音转文本服务使用初始化Universal Language模型,通过REST API/Speech software development kit (SDK)完成。
交互模式
使用者发出简短的请求, 并期望应用程序执行响应,交互模式主要是指将语音识别和文字到语音的转换过程嵌入到应用程序中去。本文例子中,Azure云端部署语音控制系统的交互模式体现在与用户交互的Universal Windows Platform(UWP)应用。在UWP上开发一个简单的界面供用户操控,或供开发者测试使用。

相关主要技术说明

1) Universal Windows Platform(UWP)

Windows通用应用平台,同一个API可以在电脑端,手机端,或其他windows10设备通用。换句话说,同样的代码可以在不同的终端运行,不必为不同的平台写不同的代码。

2) Cognitive service 的语音识别REST APIs & SDK

以语音识别为例:REST API 需要提前获取密钥,然后向服务器发送HTTP请求,经过身份验证后,服务器将转换后的音频返回至本地。

下面通过图示说明云上的REST APIS:

poYBAGRZsHeAP-ThAAD_tgGB0Bk868.png

这是Rest client应用于Application(应用程序)并在其中创建rest client的实例,然后在Application上调用一些方法。当调用Rest client方法时,该方法将输入转换为http请求,并将请求发送到Rest api。来自端点的响应是http响应,Rest client将其转换为Application可识别的类型,并返回给Application端。

由于我们不想向我们的Application(应用程序)公开Rest client的详细信息,可以添加Adapter(适配器)用来与外部服务通信。适配器接受Application(应用程序)中已知类型的参数,并且返回值也是Application(应用程序)中已知类型的参数。

SDK即为可以调用的库,支持PythonC#, C++, Java, JavaScript, Objective-C/Swift.
官方文献明确指出:“作为语音 SDK 的一种替代方法,语音服务允许使用 REST API 将语音转换为文本。每个可访问的终结点都与某个区域相关联。 应用程序需要所用终结点的订阅密钥。REST API 非常有限,只应在语音 SDK 不能使用的情况下使用。”

3) Language Understanding Intelligent Service (LUIS)

Azure的LUIS是基于云的对话式AI服务,作用是使机器理解人的语言。 运行方式可用一句话概括为:客户端通过应用程序直接发送语音请求到 LUIS, LUIS中的自然语言处理功能将命令转换为JSON格式,分析后答案同样以JSON的形式返回。LUIS平台为用户提供了训练模型的服务,并且模型具备“不断学习的功能”,通过使用模型去回应客户请求,模型会不断自动修正以提高准确度。

下面通过图示说明云上的REST APIS:

poYBAGRZsHSAZ3UDAAEX--lGSug883.png

自然语言处理离不开以下几个方面:
(例如:用户向家用检测湿度系统发出”检查湿度?”的指令。)

目的性(动词)- “检查”就是一个动词, LUIS模型最大接受80个目的性词汇。
完整的语言内容 - 用户发出的完整指令,LUIS模型最多接受500字的语音请求。
实体(名词)- 湿度是一个名词。LUIS模型最多接受30个实体名词。
LUIS定义特征,意思就是当你的模型很难识别某一个或几个单词的时候,可以自动加进数据中进行再训练。

运行Windows 10 IoT核心版的Raspberry Pi 3

Raspberry Pi 是一个开发板,可以连接到不同类型的传感器。Raspberry Pi可以被用作Web服务器,该服务器接收不同的解释命令并发送电信号,以控制安装在Smart Home中的家用电器。

语音控制技术如何应用于家电

语音控制使家庭环境更智能,实现家电的自动化。我们可以将其定义为:通过提供如健康,多媒体,娱乐和能源相关应用的不同服务,通过引入技术改善居住者的生活质量。

应用举例:智能湿度计---云端部署

1) 核心技术

在Raspberry Pi 3上运行的Universal Windows Platform(UWP)应用,使用语音识别API与传感器与用户进行交互, LUIS 进行语义分析,经由Raspberry pi 3 将用户的问题传入,最后通过Cognitive service 的语音识别APIs 技术给出答案。

2) 架构

pYYBAGRZsHCAAmbPAAFc1dyTRjA201.png

3) 功能

存储数据,通过传感器搜集数据并存储在云端。
语音到文本和文本到语音的API,用于识别用户提出的问题,并使用语音提供答案。
LUIS语音识别,语义分析,通过预先训练的模型预测答案,以准确响应客户的指令。
通过Raspberry Pi 3传入语音,和Cognitive Services的语音识别API,让家电可以回答用户提出的问题。

4) 解决方案

数据到云端
从传感器到云端数据库的数据传输过程已经可以通过完善的架构实现,客户可以直接使用不同类型的数据库,以满足不同的需求。
开展语音对话:UWP应用
例如:用户希望了解家里的湿度,‘Hey, cloud !’  ’ What is the humidity in the room now? ’通过UWP平台进行文本输出显示,UWP应用将在中安装的Raspberry Pi 3上运行,该应用程序将能够与所有传感器和执行器进行通信, 系统被触发后,问题会被传到LUIS中进行语义分析。
问题分析,与LUIS连接
LUIS 用于了解从Raspberry Pi 3接收的命令。经过对模型的训练,应用程序能够识别意图:检索室内湿度。之后,将LUIS API添加到UWP应用程序中,用户触发命令 “Hey, cloud ! ” 之后,所有内容通过API发送到LUIS进行分析。LUIS在UWP内被调用,接收输入并分析意图。根据预测意图的置信度向用户提供正确答案,将命令发送到IoT中心以获取传感器的温度。
开发网页端应用
开发一个网页端应用程序用于设备管理。该程序可以显示连接到IoT中心的所有传感器,使管理设备变得更加容易,实现重新启动,固件更新等功能。
人机交互
UWP应用与网页端应用进行交互给客户进行响应,网页端应用负责将指令发送到指定的传感器,从特定的传感器检索当前室内的空气湿度,回答用户问题,最后通过 “文本到语音” API向用户提供当前室内的湿度值。

总结

语音交互为用户提供了一种全新的家居控制方式,使家用电器能说会听,与此同时,当下语言识别面临的困难也不同忽视,主要包括以下几点:

1. 中文方言的识别/不同国家英语口音的识别。
2. 模型预测准确度:
想要使语音识别达到一个近似于人大脑的效果,必须结合语言学、心理学及生理学等领域知识达到与人近似的情感分析。此外,预测模型是不可能达到百分之百准确的,总会有新的指令,新的词汇出现,这时,模型的不断迭代训练变得尤为重要。
排除噪声干扰:让语音控制系统精准定位到与其交互的用户声音,而不是其他较高音量的噪音。

作者认为,想要让机器像人一样思考问题,最大的挑战是机器学习/人工智能技术与医学(生理和心理学)的结合,因为当今科学界懂得医学知识的人工智能科学家寥寥无几。家用电器的人机对话可以大大减轻用户的劳动力,机器有了情感以后,便可以增加聊天功能,机器会像朋友一样在回答问题之余闲聊几句,增添生活的乐趣。此外,机器对温度等数据的把控度极为精准,这是人类无法达到的。

综上所述,语音控制技术应用于家用电器是非常有前景的项目,未来会说话的家用电器会普及所有家庭。将来希望大量科学家进入这个领域,致力于不断创新与研发,使这一目标早日实现。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2526

    文章

    48093

    浏览量

    740070
  • 物联网
    +关注

    关注

    2869

    文章

    41622

    浏览量

    358380
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230605
收藏 人收藏

    评论

    相关推荐

    家电中的新秀——语音导航电冰箱

    导航电冰箱单调的“嘀、嘀”提示。语音导航电冰箱还可以拷贝个性语音当作提示语,操控电器不再乏味枯燥,例如有小宝宝的家庭可选择把小宝宝的声音当作提示语,记录小宝宝可爱的面。情侣间可以录
    发表于 11-07 13:01

    规模最大的第四届家电IC创新技术与节能管理研讨会听众报名

    、会议规模:家电和电源等研发工程师、技术应用工程师、专业技术管理和生产采购等专业人员参与听会。会议规划400多位家电研发工程师相聚。四、会议免费:参
    发表于 05-28 16:48

    语音控制家电

    使用安芯号SLH89F5162芯片作为主控芯片,通过非特定语音识别芯片来识别声音命令,从而达到控制家电的目的。
    发表于 11-03 22:11

    【DNA Kit申请】家电智能语音控制

    申请理由:用该开发板设计开发无线语音声控家电项目描述:用手机和语音双遥控家电,实现家电的远程遥控开与关
    发表于 09-29 09:59

    【Nuvoton ISD9160语音识别申请】语音控制家电

    申请理由:项目描述:有客户需要开发语音控制电陶炉的开关,温度控制和模式切换,想申请贵公司的开发板用来测试看看能否达到客户的要求,第次做
    发表于 10-24 10:15

    【NXP LPC54110试用申请】智能语音家电

    项目名称:智能语音家电试用计划:公司名称:杭州九阳申请理由:项目方案选型项目名称:公司通用语音模块预期成果:作为公司家电类设备的通用语音模块
    发表于 07-14 14:38

    智能家电控制系统,你从遥控器中解放出来

    多少次?智能家电控制系统,帮您从众多遥控器中解脱出来,部手机、语音指令就能轻松控制众多
    发表于 08-01 11:51

    STM32的每一个GPIO都能配置成外部中断触发源

    STM32 的每一个GPIO都能配置成外部中断触发源,这点也是 STM32 的强大之处。STM32 通过根据引脚的序号不同将众多中断触发源分成不同的组,比如:PA0,PB0,PC0
    发表于 08-13 09:12

    怎样去设计种基于单片机和语音识别的智能家电控制平台

    语音与“家电沟通”,控制其开启和关断。基本思路:作品融合单片机技术、基于非特定人的语音识别技术
    发表于 09-15 06:50

    语音识别技术的概念及应用前景

    种最自然的交互方式,和IOT结合可以解决IOT控制中配网麻烦、需要中心的些痛点,又可以设备互联后共同为用户提供服务,实现
    发表于 05-27 09:41

    智能语音控制技术每一个家电都能说会听

    随着物联网的发展,智能家居已经慢慢从风口项目变成未来的“刚需”。那么智能家居的背后,都赋予了哪些神奇的魔法呢?最基本的就是语音识别了,让机器能听懂人的声音,此外还有语音唤醒、语音合成等AI技术
    发表于 10-09 11:14 4331次阅读

    灵云离线智能语音控制芯片让每一个家电能说会听

    随着物联网的发展,智能家居已经慢慢从风口项目变成未来的“刚需”。那么智能家居的背后,都赋予了哪些神奇的魔法呢?最基本的就是语音识别了,让机器能听懂人的声音,此外还有语音唤醒、语音合成等AI技术
    发表于 10-18 17:27 1701次阅读

    语音控制芯片可让每一个家电实现随心控制

    随着物联网的发展,智能家居已经慢慢从风口项目变成未来的“刚需”。那么智能家居的背后,都赋予了哪些神奇的魔法呢?最基本的就是语音识别了,让机器能听懂人的声音,此外还有语音唤醒、语音合成等AI技术
    发表于 12-12 11:13 1957次阅读

    2020年将有75%的智能家电通过语音进行控制

    IDC报告显示,语音交互正在向家电市场快速渗透,越来越多的家电设备能够进行语音控制,到2020年,75%的智能
    发表于 01-06 11:18 1315次阅读

    语音模块在智能家电上更易用

    离线语音识别模块不需要联网,也不需要安装任何App,套壳即用,可以轻松进行语音识别。无论是想要控制家电,还是其他设备,语音识别模块
    的头像 发表于 03-13 17:35 401次阅读
    <b class='flag-5'>语音</b>模块在智能<b class='flag-5'>家电</b>上更易用