0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI可以根据声音进行信息解码

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-09-04 16:33 次阅读

根据杜伦大学、萨里大学和伦敦大学的研究人员最近发表的一篇论文(显示,输入的信息可以通过手指敲击按键的声音来进行解码。

研究人员训练了两个机器学习模型来识别苹果笔记本电脑键盘上每个键的独特点击。这些模型是根据从两个来源收集的音频进行训练的:一个是放置在附近的智能手机,另一个是通过Zoom进行的视频通话。他们报告称,智能手机音频模型的准确率为95%,Zoom通话模型的准确度为93%。

这些模型可以使所谓的声学侧通道攻击成为可能。虽然本文提出的技术依赖于当代机器学习技术,但此类攻击至少可以追溯到20世纪50年代,当时英国情报部门秘密记录了埃及政府使用的机械加密设备。笔记本电脑声学侧通道攻击可能会泄露用户的敏感信息,如银行PIN、账户密码或政府凭据。

该团队的模型是围绕卷积神经网络(CNNs)构建的。就像这样的网络可以识别人群中的人脸一样,它们也可以识别声谱图中的模式,声谱图是音频信号的图形。该程序分离每个按键的音频,将其波形转换为频谱图,从中提取每次点击的频率模式,并计算给定按键被按下的相对概率。

该报告的合著者Ehsan Toreini说:“我们认为声学数据是CNN的图像。我认为这是我们的方法如此有效的核心原因。”

本文提出的攻击范围有限。这两个音频解码模型是根据从同一用户在一台笔记本电脑上打字收集的数据进行训练和评估的。此外,他们使用的训练过程要求按键声音与按键标签配对。如果在不同音频环境和不同用户的其他笔记本电脑型号上使用,这种攻击的有效性还有待观察。此外,对标记训练数据的需求限制了模型的部署范围。

尽管如此,在一些可能的情况下,攻击者可以访问一个人打字的标记音频数据。尽管这些数据可能很难秘密收集,但一个人可能会被迫提供。在最近的一次Smashing Security播客采访中,Toreini和合著者Maryam Mehrnezhad描述了一个假设场景,即公司要求新员工提供这些数据,以便日后对其进行监控。在接受IEEE Spectrum采访时,Mehrnezhad说,“另一个例子是亲密伴侣暴力。”

研究小组提出了几种降低此次袭击风险的方法。首先,你可以简单地快速打字:触摸打字可以混合单个按键,并使按键隔离和解码复杂化。系统性变革也会有所帮助。Zoom等视频通话服务可能会在录音中引入音频噪声或失真配置文件,从而阻止机器学习模型轻松地将音频与键入的字符进行匹配。

Mehrnezhad说:“网络安全和隐私社区应该拿出更安全、更保护隐私的解决方案,让人们能够在没有风险和恐惧的情况下使用现代技术。我们相信,行业和政策制定者有空间找到更好的解决方案,在不同的环境和应用中保护用户。”






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18058

    浏览量

    177059
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130558
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21298
  • 卷积神经网络

    关注

    4

    文章

    284

    浏览量

    11713

原文标题:AI可以根据声音判断你在键入什么

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数字信号处理操作教程_音频解码:3-8 G711A音频解码实验

    用脉冲编码调制对音频采样,采样率为8k每秒。它利用一个 64Kbps 未压缩通道传输语音讯号。起压缩率为1:2,即把16位数据压缩成8位。G711是主流的波形声音解码器。 PCM是对模拟的连续信号进行
    发表于 04-24 15:09

    嵌入式操作教程_数字信号处理_音频编解码:3-6 AAC音频解码实验

    了HE-AAC v1和PS技术。PS指“parametric stereo”(参数立体声)。原来的立体声文件文件大小是一个声道的两倍。但是两个声道的声音存在某种相似性,根据香农信息熵编码定理,相关性应该被去掉
    发表于 04-11 09:22

    让“聋人”看到声音 行空板 —“AI助听器”

    世界上有各种各样的残障人士,这些人或不能说话,或听不见声音。聋人,是听力因先天遗传或后天人为因素而受损的残疾人,也叫听力障碍者,简称听障人。根据最近的全国人口普查统计,全中国大约有2700
    的头像 发表于 01-12 13:12 161次阅读

    labview声音采集与处理

    ,LabVIEW提供了丰富的声音采集工具。用户可以通过声卡或其他外部设备将声音信号输入电脑。LabVIEW支持多种声音输入接口,包括麦克风、音频接口、模拟输入等。用户
    的头像 发表于 01-04 10:48 729次阅读

    AI大模型可以设计电路吗?

    AI大模型
    电子发烧友网官方
    发布于 :2024年01月02日 15:09:29

    首例“AI声音侵权案”,声音AI化用于短视频

    电子发烧友网报道(文/李弯弯)AI技术的应用,给我们的生活带来了巨大改变。同时,它的不当使用也带来了侵权、诈骗等风险。近日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案
    的头像 发表于 12-20 00:28 1252次阅读

    国产嵌入式教学实验箱_创龙教仪_DSP教学实验箱:3-4 mp3音频解码实验

    MP3位流。解码器要简单得多,它的任务是从编码后的谱线成分中,经过反量化和逆变换,提取出声音信号。 (1)编码:从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=
    发表于 11-07 13:48

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    的,比如cv的需要图片数据、asr的需要语音数据;为了适配数据类型的差异,AI引擎对外提供了对基本数据类型的编解码能力,将不同数据类型转换为AI引擎可以使用的通用数据类型。 编码后的数
    发表于 09-19 18:54

    聚焦语音 AI:在 AR 眼镜上可视化语音和声音

    的对话和非语音声音。通过将语音和声音 AI 相结合,可以将这些可视化效果叠加到 AR 眼镜上,从而使用户能够看到并理解他们无法听到的声音
    的头像 发表于 07-26 19:30 449次阅读

    国产生成式AI,不能仅仅看向前方#生成式AI #信息无障碍

    AI
    脑极体
    发布于 :2023年06月15日 19:06:36

    AI视觉检测在工业领域的应用

    可以随着工艺流程调整和升级。 二、工业AI视觉检测系统的工作原理 工业AI视觉检测系统的工作原理包括以下几个步骤: 1.图像采集:系统首先通过高分辨率的摄像头或彩色相机对产品进行拍摄,
    发表于 06-15 16:21

    走向实用的AI解码阐述

    大家好,今天我分享的是走向实用的AI图像编解码。本次将着重从 “走向”两个字出发,阐述AI解码研发的关键内容和进展。
    发表于 06-15 09:19 507次阅读
    走向实用的<b class='flag-5'>AI</b>编<b class='flag-5'>解码</b>阐述

    国产工业级RK3568核心板-AI人脸识别产品方案

    和流畅度。 声音模组:在人脸识别终端产品中,通常需要输出语音提示信息,以指导用户操作。因此,可以选择支持高保真音质、多种音频格式解码声音
    发表于 05-06 14:30

    什么是视频解码器?

    的网络通讯中进行传输,经过压缩后的视频信息就会比原始的小很多,减小了视频传输时间。然后在终端进行解压,解压出来的视频就可以在屏幕上清晰地显示出来。要想要高清、低延迟的视频监控,当然这高
    的头像 发表于 05-06 11:10 3896次阅读
    什么是视频<b class='flag-5'>解码</b>器?