0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Neurotech重建听到的声音 并探究人们是如何感知音乐的

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-08-25 16:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

你脑子里有没有一首歌?加州大学伯克利分校神经科学家团队的一项新研究在了解音乐感知和认知的神经基础方面取得了重大进展,真正推动了与音乐相关的神经科学的发展。

最近发表在PLOS Biology杂志上的这项研究结果(journals.plos.org/plosbiology/article?id=10.1371/journal.pbio.3002176)显示了人类大脑对音乐表演的反应。当我们的耳朵听到一段歌曲片段后,它会被我们的耳蜗(内耳的螺旋腔)转化为神经元活动。Ludovic Bellier是加州大学伯克利分校Helen Wills神经科学研究所的博士后,他研究大脑中的神经网络最终是如何“听到”这些声音的。

在他的团队的实验中,Bellier和同事分析了听迷幻摇滚乐队Pink Floyd歌曲的人的大脑活动。29名参与者是纽约州奥尔巴尼市奥尔巴尼医疗中心的癫痫患者。作为治疗的一部分,这些患者的大脑表面植入了电子传感器,他们被要求专心听Pink Floyd的歌曲“Another Brick in the Wall”。研究人员记录了每个脑电极的振荡电位,这些测量被称为皮层电图记录(ECoG),是反映每个电极周围大脑小区域神经活动的宽带信号

研究人员假设,每位患者记录的ECoG信号反映了他们的大脑是如何感知为他们播放的音乐的。为了验证他们的假设,并了解患者大脑中哪些区域最参与音乐感知,该团队拟合模型,以重建歌曲的音频频谱图,当以ECoG特征作为输入时,音频频谱图显示了声能在频率上随时间的分布。如果模型能够在正则化训练后准确地重建声谱图,那么ECoG特征必须反映关于向患者播放的音乐的一些信息。

根据Bellier的说法,研究小组能够验证他们的假设。通过使用多种类型的模型来重建听觉信号,科学家们可以解码出歌曲输出音频的至少部分可听见的相似性。研究人员表示,据他们所知,他们的研究结果是第一份从ECoG数据中回归的音乐音频出版物。尽管原始音频和重建音频之间的相关性仍远未达到1比1——统计r平方值为0.325——但当将一些模型的输出转换回音频波形时,如果距离较远,则可以将其识别为经典歌曲。一种更复杂、更非线性的重建算法——所谓的多层感知器,或简单的双层人工神经网络——会产生0.429的更高r平方拟合值和更清晰的音频重建。

为了测试大脑中哪些区域最参与音乐处理,研究人员在去除电极输入的同时,对模型进行了相同的音频重建任务训练。总之,来自所有患者的ECoG数据覆盖了大脑的大部分总表面积,因此科学家们能够将大脑的许多潜在区域视为产生听音乐体验的关键参与者。

通过比较涉及所有大脑区域的模型和没有涉及的模型之间的性能变化——有时称为消融研究——研究人员能够说出每个大脑区域提供了多少信息。换言之,如果当特定区域的电极被移除时,重建精度没有大的变化,那么该区域就不会像音乐感知那样参与其中。

从这个过程中,研究人员发现,去除从大脑左右两侧一个称为颞上回(STG)的区域收集的脑电波数据会导致重建精度的最大下降。这个区域恰好位于耳朵附近,也被认为在语音处理中发挥着重要作用,因此它实际上可能在大脑处理复杂结构化声音的能力中发挥更大的作用。

该团队还发现,从左右STG中单独去除数据特征对重建精度的影响显著不同。这表明,参与者大脑右侧STG的活动比左侧STG有更多关于歌曲的信息。奇怪的是,该领域先前的研究表明,语音处理的情况似乎恰恰相反,左侧STG通常比右侧STG做更多的工作。Bellier说:“在95%的右撇子中,言语主要位于左半球。我们在论文中表明,音乐(在左右STG之间)分布更广,但具有右侧优势”——这意味着右侧STG处理的音乐信息比左侧多。”

“我们可以做一个非常简单的后续跟进,”Bellier说。也就是说,本研究只考虑了70到150赫兹的高频脑电波信息。然而,Bellier表示,根据ECoG信号的较低频率范围计算的音频特征也可以对重要信息进行编码。这就是为什么他说,该团队计划在当前论文中对不同频率范围的神经活动重复相同的分析。正如论文所总结的那样,该小组目前和未来的工作将增加“我们对人脑音乐处理理解的又一块砖”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106797
  • 电极
    +关注

    关注

    5

    文章

    880

    浏览量

    28291
  • 神经元
    +关注

    关注

    1

    文章

    369

    浏览量

    19110

原文标题:Neurotech重建听到的声音 并探究人们是如何感知音乐的

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    赋能 BEV 感知课题!高校科研多传感器时间同步方案

    在高校自动驾驶实验室里,团队可能常以BEV(Bird’s-EyeView)感知架构为研究主线。旨在通过相机阵列和激光雷达的数据,在空间上重建统一的车周环境,为下游检测、分割提供高精度“语义地图”。然而,一旦相机间的时间同步存在几十毫秒及以上的
    的头像 发表于 11-14 17:32 2703次阅读
    赋能 BEV <b class='flag-5'>感知</b>课题!高校科研多传感器时间同步方案

    仅使用智能手机在NVIDIA Isaac Sim中重建场景

    使用 iPhone 拍摄照片,到利用 3DGUT 进行 3D 场景重建,再到将重建的场景导入 NVIDIA Isaac Sim 添加机器人。若要跳过重建步骤(步骤 1–3),直接在
    的头像 发表于 11-10 14:03 428次阅读

    解锁声音定位新维度,AR-1105 双数字麦克风阵列板引领音频感知革命

    广泛应用于智能家居、工业监测、智能交互等领域,为设备提供精准的声音定位与高保真音频采集能力,是声学智能应用的核心组件,助力产品在声音感知与处理方面实现突破性升级
    的头像 发表于 11-07 09:14 520次阅读
    解锁<b class='flag-5'>声音</b>定位新维度,AR-1105 双数字麦克风阵列板引领音频<b class='flag-5'>感知</b>革命

    如何进行声音定位?

    文章主要介绍了如何利用一种简单的TDOA算法进行声音点位,使用数据采集卡进行声音定位的实验。
    的头像 发表于 09-23 15:47 1062次阅读
    如何进行<b class='flag-5'>声音</b>定位?

    多路混音声音播放芯片型号推荐

    以下是唯创知音旗下主流的多路声音播放芯片深度解析,结合精准参数、丰富场景及技术特性,满足智能设备多样化音频需求: 一、WTV380/890 系列:高集成多模态交互芯片 核心参数 通道能力:支持8 路
    的头像 发表于 08-15 16:51 604次阅读

    华系首款家用纯电SUV全新岚图知音下线

    华系首款家用纯电SUV——全新岚图知音今天正式下线,将于8月13日正式开启预售,预计8月底上市。
    的头像 发表于 08-11 11:39 900次阅读

    声源定位模块-AR1105# 声源定位# 声音定位

    声音降噪
    深圳市声讯电子有限公司
    发布于 :2025年08月01日 16:01:09

    无刷直流电机电流测量的探究

    电流进行采样,利用二阶巴特沃思低通滤波器进行滤波,得到较为平滑的电流,到达有效控制电机的目的。 纯分享帖,点击下方附件免费获取完整资料~~~ *附件:无刷直流电机电流测量的探究.pdf 【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权
    发表于 06-26 13:45

    紫光展锐T8300 5G SoC为用户开创主流音频新体验

    数字化时代,从语音通话到智能交互,从聆听音乐到创作Vlog,声音已成为隐形的基础措施。日益发展的音频技术正在重构用户感知世界的方式,重塑用户的听觉体验。
    的头像 发表于 06-13 10:07 748次阅读

    音乐盒芯片方案——N9305音乐芯片

    音乐盒芯片方案开发音乐盒,作为一种融合艺术与机械智慧的精巧物件,散发着独特魅力。它以灵动的音符为载体,承载着人们的情感、回忆与祝福。从孩童手中开启梦幻世界的木质八音盒,到恋人间传递爱意的精致
    的头像 发表于 06-05 15:29 617次阅读
    <b class='flag-5'>音乐</b>盒芯片方案——N9305<b class='flag-5'>音乐</b>芯片

    从安防到元宇宙:RK3588如何重塑视觉感知边界?

    定义图像处理的精度与效率。 应用场景深度解析: 智能安防:在智慧园区部署中,单板可同时接入32路1080P摄像头,通过AI算法实现人脸识别、异常行为检测,实时压缩传输至云端,带宽占用降低40%。 AR
    发表于 04-07 16:11

    PCM2912APJTR设计的USB声卡播放声音有哒哒的声音的原因有哪些

    最近学习PCB设计设计了一个USB声卡,电路图参考了官方demo模块的原理图,但是设计出来的板子发现播放音乐会有哒哒的声音。本人由于是初学者,所以有点不懂是PCB不对的问题还是原理图设计的问题了。 希望有人能够给点修改建议。 下面是原理图。 布线图如下:
    发表于 03-21 11:54

    首批岚图知音全球版SUV正式发往挪威

    近日,岚图汽车迎来了全球化进程中的重要时刻,首批岚图知音全球版SUV正式发往挪威,标志着岚图知音全球版SUV开启海外交付。 2024年10月,岚图知音全球版在挪威、瑞典、芬兰三国同步发售。2024年
    的头像 发表于 01-24 10:06 639次阅读

    首批岚图知音全球版Courage发往挪威

    东风出海继续提速,旗下岚图全球化战略加快推进,开启东风岚图全球化2025新篇章,首批岚图知音全球版Courage1月22日搭乘中欧班列正式发往挪威,迎来东风岚图2025年“开门红”。岚图知音是2024年纯电SUV品类中的硬核代表,东风岚图将通过岚图
    的头像 发表于 01-24 09:20 820次阅读

    CD4051/CD4052的频响特性怎么样?能做声音通道的选择吗?

    放大的话,可以听到很悦耳的音乐,但是假如通过CD4052选择后,再到功放放大的话,只能听到背景音乐,而唱歌的声音不在了。从而怀疑是CD405
    发表于 01-23 07:07