0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI可以根据声音进行信息解码

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-09-04 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

根据杜伦大学、萨里大学和伦敦大学的研究人员最近发表的一篇论文(显示,输入的信息可以通过手指敲击按键的声音来进行解码。

研究人员训练了两个机器学习模型来识别苹果笔记本电脑键盘上每个键的独特点击。这些模型是根据从两个来源收集的音频进行训练的:一个是放置在附近的智能手机,另一个是通过Zoom进行的视频通话。他们报告称,智能手机音频模型的准确率为95%,Zoom通话模型的准确度为93%。

这些模型可以使所谓的声学侧通道攻击成为可能。虽然本文提出的技术依赖于当代机器学习技术,但此类攻击至少可以追溯到20世纪50年代,当时英国情报部门秘密记录了埃及政府使用的机械加密设备。笔记本电脑声学侧通道攻击可能会泄露用户的敏感信息,如银行PIN、账户密码或政府凭据。

该团队的模型是围绕卷积神经网络(CNNs)构建的。就像这样的网络可以识别人群中的人脸一样,它们也可以识别声谱图中的模式,声谱图是音频信号的图形。该程序分离每个按键的音频,将其波形转换为频谱图,从中提取每次点击的频率模式,并计算给定按键被按下的相对概率。

该报告的合著者Ehsan Toreini说:“我们认为声学数据是CNN的图像。我认为这是我们的方法如此有效的核心原因。”

本文提出的攻击范围有限。这两个音频解码模型是根据从同一用户在一台笔记本电脑上打字收集的数据进行训练和评估的。此外,他们使用的训练过程要求按键声音与按键标签配对。如果在不同音频环境和不同用户的其他笔记本电脑型号上使用,这种攻击的有效性还有待观察。此外,对标记训练数据的需求限制了模型的部署范围。

尽管如此,在一些可能的情况下,攻击者可以访问一个人打字的标记音频数据。尽管这些数据可能很难秘密收集,但一个人可能会被迫提供。在最近的一次Smashing Security播客采访中,Toreini和合著者Maryam Mehrnezhad描述了一个假设场景,即公司要求新员工提供这些数据,以便日后对其进行监控。在接受IEEE Spectrum采访时,Mehrnezhad说,“另一个例子是亲密伴侣暴力。”

研究小组提出了几种降低此次袭击风险的方法。首先,你可以简单地快速打字:触摸打字可以混合单个按键,并使按键隔离和解码复杂化。系统性变革也会有所帮助。Zoom等视频通话服务可能会在录音中引入音频噪声或失真配置文件,从而阻止机器学习模型轻松地将音频与键入的字符进行匹配。

Mehrnezhad说:“网络安全和隐私社区应该拿出更安全、更保护隐私的解决方案,让人们能够在没有风险和恐惧的情况下使用现代技术。我们相信,行业和政策制定者有空间找到更好的解决方案,在不同的环境和应用中保护用户。”






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18672

    浏览量

    185538
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136215
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23244
  • 卷积神经网络

    关注

    4

    文章

    371

    浏览量

    12713

原文标题:AI可以根据声音判断你在键入什么

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何进行声音定位?

    文章主要介绍了如何利用一种简单的TDOA算法进行声音点位,并使用数据采集卡进行声音定位的实验。
    的头像 发表于 09-23 15:47 1025次阅读
    如何<b class='flag-5'>进行</b><b class='flag-5'>声音</b>定位?

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    为计算机可以处理的数字信息。 认知层: 认知层是具身智能的第二层, 负责对数据进行处理和分析,以便更好地理解和利用这些数据。 包括各种算法和模型,如DNN、神经形态计算、决策树等。 作用:是对感知到的
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    彻底改变了自然语义处理的研究和应用。它引入了自注意机制和位置编码,能够有效的捕捉输入序列中的关联信息,实现更好的上下文理解和建模。 Transformer 模型由一个编码器和一个解码器组成,是一种
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    AI的应用多种多样。比如:DALL-E2、Midjourney、Stable Diffusion等,不仅包括对话功能,还包括生成图像、视频、语音和程序代码等功能。 竟然连代码都可以生成,会取代程序员
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是20W,在
    发表于 09-06 19:12

    如何使用 M487 微控制器和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中?

    使用 M487 微控制器和外部音频编解码器NAU88L25将 AMR 格式的声音录制到 MicroSD 卡中
    发表于 08-20 06:28

    HarmonyOS AI辅助编程工具(CodeGenie)代码续写

    利用AI大模型分析并理解开发者在代码编辑区的上下文信息或自然语言描述信息,智能生成符合上下文的ArkTS或C++代码片段。 一、使用约束 建议在编辑区内已有较丰富上下文,能够使模型对编程场景有一定
    发表于 07-15 16:15

    【「零基础开发AI Agent」阅读体验】+Agent的工作原理及特点

    感知系统从环境中收集信息并从中提取相关知识的能力,这类包括文本、图像、声音等。 2)规划 规划是指Agent为了实现某一目标而进行的决策过程,在该阶段Agent会根据收集的
    发表于 05-11 10:24

    求助,关于SGTL5000 LINE-IN声音录制问题

    位值显示为0x1。所以那里也没有问题。 我使用 tinycap 进行录音。 我用 tinyplay 打开声音文件。我通过争边球引脚获得声音。我可以听普通的 wav 文件,只有我录制的
    发表于 04-11 06:49

    i.MX8作为从模式,无声音是怎么回事?

    解码 WM8960 通过 i2s 和 i2c 连接到 imx8qxp,i2s (SAI1) 连接如下: 编解码器上的 MCLK 引脚具有 24Mhz 振荡器。 当我将设备树 i.MX8qxp
    发表于 04-09 08:19

    《DNESP32S3使用指南-IDF版_V1.6》第五十七章 乐鑫AI库简介

    第五十七章 乐鑫AI库简介 乐鑫的ESP-WHO库是一个基于乐鑫芯片的图像处理开发平台,其中包括了实际应用中可能出现的开发示例,如人脸检测、人脸识别、猫脸检测和手势识别等。开发者可以根据这些示例衍生
    发表于 03-21 09:47

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    上传与视频生成相关的知识库文档,以便AI助手能够基于这些知识进行回答和生成视频。 在AI助手的配置中,找到与视频生成相关的功能模块。 根据需要选择或上传视频生成模型,这些模型
    发表于 03-05 19:52

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    不需要人类持续干预的AI系统,它可以根据当前的环境和背景信息,去自主分析各种遇到的问题并做出合理的决策,比如几年前打败人类棋手李昌镐的AlphaGo,它就是一个典型的
    发表于 01-13 11:04

    AN-155:使用Linduino PSM进行故障日志解码

    电子发烧友网站提供《AN-155:使用Linduino PSM进行故障日志解码.pdf》资料免费下载
    发表于 01-12 10:03 0次下载
    AN-155:使用Linduino PSM<b class='flag-5'>进行</b>故障日志<b class='flag-5'>解码</b>

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布了一款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现了对网络信息的高效检索与深度挖掘,进一步满足了用户对精准、详尽信息的需求。 据悉
    的头像 发表于 12-16 09:35 1024次阅读