0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析语音界面带来的隐私问题

CEVA 来源:YXQ 2019-07-11 16:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

未来的语音界面将会更加普及,那些能够提供优质产品和隐私保护的供应商拥有广阔商机。

我们都习惯了便捷的智能扬声器,比如在家中使用的亚马逊Echo和手机上的Siri等语音助手,然而,除了方便,我们是否应该更关注它们对隐私的影响?当我们将数据交给亚马逊、谷歌或其他一些大公司后,我们的数据和对话是否会被泄露?

语音识别成为主流

对语音识别最早的尝试出现在20世纪60年代,但直到20世纪90年代,这项技术才在电脑上实现并变得普及。Siri在iPhone 4S上的首次亮相为市场带来了真正的巨变,而这竟然已经是2011年的事情了。

今天,许多产品和设备上都设有语音控制的“虚拟助手”,例如苹果的Siri和谷歌访问助手。事实上,现在有六分之一的美国人拥有智能扬声器。目前,虽然亚马逊凭借在其Echo扬声器和其他设备上运行的Alexa引领市场,但它依然面临着强劲的竞争对手,比如谷歌、苹果和其他公司。

当然,采用语音界面的不只是智能扬声器和移动设备,还有智能显示器,他们通常包含与智能扬声器相同的语音助手界面和AI功能,例如亚马逊的Echo Show。语音控制也被添加到智能电视和汽车,以及家用恒温器等普通电器中,而微软已将Cortana作为Windows系统的核心部分。

语音识别热潮背后的技术是在高性能云服务器上运行的人工智能(AI)和人工神经网络(ANN)。在本地设备中还需要一些复杂的信号处理,例如远场拾音,它可以从背景噪声中提取语音。

隐私问题

我们都知道技术有用,但一旦这些设备能收听、处理和响应我们的语音,那么会发生什么?微软最近的一项调查显示,41%的语音助手用户存有隐私方面的担忧。

通常,大多数智能扬声器会接收您的问题或指令音频,并将其上传到自己的服务器进行处理。这意味着您询问或告知扬声器的任何内容至少暂时由服务提供商存储。

虽然智能扬声器总是在“听”,但只有在听到“唤醒词”时才会上传音频,例如“Alexa”。但有些建议说,在实际使用中,扬声器可能会将你说的其它话误认为唤醒词,在违背你意愿的情况下开始录音和上传。

另一个值得关注的领域是服务提供商的员工对录音和数据的访问权限。最近的新闻报道称亚马逊有专门的人员听取录音以提高质量,这似乎合乎逻辑,但也带来了一些理论上的风险。另一方面,我们已经习惯了大公司存储我们的网络浏览历史和聊天消息,添加语音真的有什么不同吗?

有人担心这些员工会将语音数据链接到我们的其他个人详细信息,包括位置。了解你居住的地方对于提供本地化推荐很有用,例如您所在城市的最佳餐厅,但这确实会引发对于隐私的担忧。

本地处理

解决这些隐私问题的一种方法是将云处理与更多的本地AI处理相结合。这可以通过使用能够理解指令并做出相应响应的专用处理器来实现。

对于控制智能家居的许多交互,是可以无需与云进行任何通信的。而在需要交换信息的情况下——例如,当用户提出问题或者请求控制诸如Spotify或互联网广播电台之类的网络应用程序时,智能扬声器可以只将元信息(而不是实际对话)发送到云。

随着语音激活和控制被添加到更多的消费产品中,已经足够成熟的神经网络处理器可以部署到嵌入式应用程序中,并且可以用于本地计算,而无需将数据发送到云,这将有助于减轻许多人的隐私担忧。

虽然云公司更喜欢收集原始对话以建立数据库,但如果家用设备能发挥安全网关的作用,限制哪些信息可以与云共享,用户将更有可能信任语音服务。

这里的透明度至关重要:设备制造商需要向消费者表明哪些数据将在本地进行处理,哪些会发送到云。当然,关于这一问题的争论亦存在一个积极的角度:不难想象,设备供应商会使用其本地处理能力作为一个差异化因素,说服消费者购买具有更多“仅限本地”功能的智能扬声器。

OEM可以做什么?

提高公众信心的另一个方法是提供“从设计着手保护隐私”的功能,以便用户可以看到设备在提供信息保密。例如,亚马逊的Echo Show 5智能显示器带有覆盖摄像头的物理快门。所有智能扬声器设备都设有一个静音按钮,用于禁用麦克风。

无论硬件功能如何,无论我们的技术能力或经验水平如何,软件都必须提供让我们信任的用户体验。一个重要的步骤是为用户提供明确的路径,让用户能够设置隐私偏好,以及随时删除所有录音和历史记录。

保护隐私的另一个步骤是确保“唤醒词”提取(在本地执行)尽可能准确,以便消费者确信他们可以在不回避语音界面的情况下谈论私密话题。随着更强大的处理器和更复杂的算法在语音控制设备中趋于普遍,智能扬声器也能够可靠地确定用户是否在请求它们的帮助。

结论

未来的语音界面只会更加普及,那些能够提供优质产品和隐私保护的供应商拥有广阔商机。消费者想要便捷,有关其他技术产品的证据表明,如果供应商能够证明隐私可以得到保护,消费者会很乐意与语音控制设备进行交谈,就像在智能手机上打字一样。

最后,我刚刚问我Echo扬声器中的Alexa:“你能保守秘密吗?”它回答:“你可以放心地告诉我你想让我知道的秘密。”听上去有些含糊,但这是一个很好的起点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2736

    浏览量

    85889
  • Alexa
    +关注

    关注

    2

    文章

    197

    浏览量

    24419

原文标题:专家解读 | 浅析语音界面带来的隐私问题

文章出处:【微信号:CEVA-IP,微信公众号:CEVA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何实现远程更换语音?WT588E02B-B2语音芯片引领行业创新

    ,耗时耗力。为了解决这一痛点,广州唯创电子推出了WT588E02B-B2语音芯片,支持远程更换语音,并配套提供上位机网页和下载器,为客户带来前所未有的便捷体验。本
    的头像 发表于 03-16 09:27 304次阅读
    如何实现远程更换<b class='flag-5'>语音</b>?WT588E02B-B2<b class='flag-5'>语音</b>芯片引领行业创新

    基于Arm平台的端到端int8 Conformer模型部署

    在边缘侧运行高质量的语音与音频模型颇具挑战,需满足时延、内存、功耗和模型大小等多方面的严苛约束。不同于云端部署,边缘侧系统通常离线运行,需兼顾用户隐私与可预测的实时性能。这些落地场景涵盖端侧语音转文本、
    的头像 发表于 02-24 10:23 437次阅读
    基于Arm平台的端到端int8 Conformer模型部署

    开发智能体配置-隐私协议服务

    1.已有描述隐私政策和用户隐私权利的隐私网址:在智能体【配置】-【隐私协议服务】页面,隐私声明处选择“自定义
    发表于 02-03 15:54

    离线语音芯片哪些品牌好用?如何选择?

    随着智能家居市场的快速发展,语音交互已成为主流控制方式之一。离线语音芯片因其本地处理、即时响应、高隐私性等特点,正成为越来越多智能设备的首选。目前市场上可供选择的离线语音芯片品牌与型号
    的头像 发表于 01-27 15:10 290次阅读

    国产32位MCU语音识别方案

    在智能家居、工业控制及便携设备领域,语音交互正成为人机界面的重要发展方向。针对离线语音识别需求,基于国产32位MCU的解决方案日益成熟,其中以CH32V307等为代表的32位MCU芯片,凭借高集成度与专用优化,为嵌入式设备提供了
    的头像 发表于 12-04 15:11 685次阅读

    发布元服务配置隐私声明

    元服务必须先使用AGC的隐私声明托管服务生成自己的隐私声明,才能在版本信息页面选择到。详细内容参见配置隐私声明(元服务)和配置用户协议。 登录AppGallery Connect,点击“APP与元
    发表于 11-25 11:24

    发布元服务配置隐私说明

    如果检测到元服务中涉及获取敏感隐私权限或者使用受限开放权限,需要填写“应用隐私说明”。 注意 如果软件包中声明使用了受限开放权限,请确保创建的发布Profile也申请了对应权限,否则元服务审核时将会
    发表于 11-24 15:19

    高性能的AT700系列语音芯片方案分享

    在智能化设备快速普及的今天,语音识别IC正成为人机交互的重要桥梁。特别是离线语音识别技术,凭借其无需网络、响应迅速、隐私性高等优势,被广泛应用于智能家居、工业控制、穿戴设备等领域。
    的头像 发表于 11-21 16:19 114次阅读

    零代码实现茶吧机自定义语音控制定制

    本地指令处理实现毫秒级响应,断网时仍能正常使用,避免在线语音的网络依赖问题;同时语音数据本地存储不联网,有效保障用户隐私安全,且低误唤醒率可过滤环境噪音、减少干扰;还能通过口语化指令与语音
    的头像 发表于 10-17 16:43 1408次阅读
    零代码实现茶吧机自定义<b class='flag-5'>语音</b>控制定制

    瑞萨电子高级语音用户界面解决方案

    语音用户界面(VUI)正在彻底改变我们与技术交互的方式,实现免提、无缝的通信。通过整合先进语音命令识别功能,再加上语音反欺骗和说话人识别功能,开发人员可以构建具有更高安全性、个性化和功
    的头像 发表于 08-27 09:41 927次阅读
    瑞萨电子高级<b class='flag-5'>语音</b>用户<b class='flag-5'>界面</b>解决方案

    【HarmonyOS 5】鸿蒙应用隐私保护详解

    【HarmonyOS 5】鸿蒙应用隐私保护详解 ##鸿蒙开发能力 ##HarmonyOS SDK应用服务##鸿蒙金融类应用 (金融理财# 一、前言 在今天这个手机不离手的时代,我们每天用手机支付
    的头像 发表于 07-11 18:30 1412次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    同步电机失步浅析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:同步电机失步浅析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-20 17:42

    蓝牙语音遥控器:智能家居的智慧控制核心

    (BLE)技术,实现了无需对准、覆盖范围广的操控优势。它不仅支持语音指令简化复杂操作,还通过双向通信提升交互流畅性,为用户带来前所未有的便利。 工作原理 蓝牙语音遥控器的核心在于其灵活的控制方式
    发表于 06-01 20:24

    蓝牙语音遥控器 低功耗芯片选型HS6621CxC/OM6621

    (BLE)技术,实现了无需对准、覆盖范围广的操控优势。它不仅支持语音指令简化复杂操作,还通过双向通信提升交互流畅性,为用户带来前所未有的便利。 工作原理 蓝牙语音遥控器的核心在于其灵活的控制方式
    发表于 05-22 15:23