0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让“聋人”看到声音 行空板 —“AI助听器”

话说科技 来源:话说科技 作者:话说科技 2024-01-12 13:12 次阅读


世界上有各种各样的残障人士,这些人或不能说话,或听不见声音。聋人,是听力因先天遗传或后天人为因素而受损的残疾人,也叫听力障碍者,简称听障人。根据最近的全国人口普查统计,全中国大约有2700多万听障人,包括弱听、重听、老化聋等。因为各种不方便让其在这个世界上生活极为不方便。比如有人敲门,水龙头忘关、孩子在卧室里啼哭,可是“听障人”他们听不见。利用人工智能,让模型学习各种声音,使用开源硬件-行空板采集声音,通过物联网将相应文字信息发送给Arduino主板在显示屏上显示并利用灯光提醒,并且利用micro:bit制作的手表进行文字、灯光加震动提醒,让“听障人”看见、感触到声音。

音频信号


声音以音频信号的形式表示,音频信号具有频率、带宽、分贝等参数,音频信号一般可表示为振幅和时间的函数。这些声音有多种格式,因此计算机可以对其进行读取和分析。例如:mp3 格式、WMA (Windows Media Audio) 格式、wav (Waveform Audio File) 格式。


【语谱图】


语谱图是二战时期发明的一种语音频谱图,一般是通过处理接收的时域信号得到频谱图。
语谱图是频谱分析视图,如果针对语音数据的话,叫语谱图。语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。

语音的时域分析和频域分析是语音分析的两种重要方法,但是都存在着局限性。时域分析对语音信号的频率特性没有直观的了解,频域特性中又没有语音信号随时间的变化关系。而语谱图综合了时域和频域的优点,明显的显示出了语音频谱随时间的变化情况、语谱图的横轴为时间,纵轴为频率,任意给定频率成分在给定时刻的强弱用颜色深浅来表示。颜色深的,频谱值大,颜色浅的,频谱值小。语谱图上不同的黑白程度形成不同的纹路,称之为声纹,不同讲话者的声纹是不一样的,可用作声纹识别。

使用Librosa库批量生成各类声音的语谱图,如敲门声、水龙头流水声、婴儿啼哭声、警报声等。Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大。


【录制音频】


使用pyaudio库这个可以进行录音,生成wav文件。PyAudio 提供了 PortAudio 的 Python 语言版本,这是一个跨平台的音频 I/O 库,使用 PyAudio 你可以在 Python 程序中播放和录制音频。为PoTaTudio提供Python绑定,跨平台音频I/O库。使用PyAudio,您可以轻松地使用Python在各种平台上播放和录制音频。

【硬件制作过程】

一、行空板主控

按钮接行空板引脚21(用于关闭提醒),LED灯接引脚22(用于亮灯提醒)。

二、“掌控板”手表

将震动马达接“掌控宝”的M2接口,并粘在表带上。当掌控板收到信息后,启动震动马达开始震动,提醒“听障人”查看屏幕提示信息。

【训练模型】


将图片上传到“英艻AI训练平台”进行模型训练。类型有[size=18.6667px]“background”[size=18.6667px]、“door”、“water”。

【行空板推理】

下载模型,放到行空板程序相应目录。

利用行空板板载麦克风采集声音,利用matplotlib变换成图片,使用keras加载训练好的模型“keras_model.h5”,进行预测出声音类型。点亮LED灯并通过物联网发送相关信息指令。

【掌控板手表程序】

通过物联网接收行空板传来的指令,屏幕显示相应信息,板载LED灯循环闪烁,并驱动马达震动。

通过利用人工智能和物联网技术,我们可以为听障人士创造一个更加便利和包容的世界。通过让模型学习各种声音,并使用开源硬件采集声音,我们可以通过文字信息、显示屏、灯光和震动等方式,让听障人士能够看见、感受到声音的存在。这种技术的应用,不仅可以帮助听障人士更好地融入社会和生活,还能提高他们的生活质量和安全感。

关于行空板—“AI助听器”项目的详细实现过程,请访问DF创客社区了解更多。

上海智位机器人

上海智位机器人成立于2010年,是全球领先的从事开源硬件、机器人产品和科创教育的高科技企业,打造了DFRobot、蘑菇云科创教育等品牌,是国内最早的创客理念引入者和倡导者,创客教育的开拓者和引领者。旗下拥有中国最大的线上DF创客社区和国家级创客空间——蘑菇云创客空间,提供丰富的线上和线下学习资源,构建了一个自由、开放和富于创造力的交流空间。其Gravity产品已被全球超过100万开发者选用。合作伙伴包括微软、英特尔、Autodesk、霍尼韦尔、NASA、MIT等知名厂商和机构。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 助听器
    +关注

    关注

    18

    文章

    155

    浏览量

    39987
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264044
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47685
收藏 人收藏

    评论

    相关推荐

    星际飞船驾驶舱模拟器、创意数字时钟、智能骑行气象助手

    LED显示不同颜色来指示是否适合长时间运动。而“风向标”则是一个远程风向指示系统,通过1采集外部风向信息,并通过Easy Iot平台发送给室内的
    发表于 03-22 10:59

    星际飞船驾驶舱模拟器、创意数字时钟、智能骑行气象助手|DF创客周刊(第75期)

    /Geneva-Digital-Clock/ 智能骑行气象助手与远程风向指示器 这个创客项目来自DF创客社区云天老师之手——包含两个脑洞创意,一个是“风速车”,将自行车转变为一个移动气象站,不仅可以采集气象信息,还能通
    发表于 03-15 11:46

    基于IC555构建的助听器电路

    通过互联网提供的助听器的一般电路使用普通的晶体管电路,因此它消耗更多的功率。所以,在这里我们集中精力设计一个耗电量更低的电路,DIY助听器电路使用555。
    的头像 发表于 02-25 17:13 350次阅读
    基于IC555构建的<b class='flag-5'>助听器</b>电路

    Capsense组件是v7.0,void CapSense_Sleep(void)是的,如何设置组件进入低功耗?

    我用的Capsense组件是v7.0,void CapSense_Sleep(void)是的,如何设置组件进入低功耗,谢谢。
    发表于 02-19 08:30

    从处方助听器到非处方助听器测试-处方助听器测试

    本文主要介绍:处方助听器、处方助听器测试配置、处方助听器测试项目、处方助听器测试架构。
    的头像 发表于 01-16 14:15 147次阅读
    从处方<b class='flag-5'>助听器</b>到非处方<b class='flag-5'>助听器</b>测试-处方<b class='flag-5'>助听器</b>测试

    从处方助听器到非处方助听器测试-OTC非处方助听器测试

    本文主要介绍:OTC非处方助听器、OTC非处方助听器测试配置、OTC非处方助听器测试项目、OTC非处方助听器测试架构。
    的头像 发表于 01-16 14:07 232次阅读
    从处方<b class='flag-5'>助听器</b>到非处方<b class='flag-5'>助听器</b>测试-OTC非处方<b class='flag-5'>助听器</b>测试

    首例“AI声音侵权案”,声音AI化用于短视频

    电子发烧友网报道(文/李弯弯)AI技术的应用,给我们的生活带来了巨大改变。同时,它的不当使用也带来了侵权、诈骗等风险。近日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案
    的头像 发表于 12-20 00:28 1251次阅读

    骨传导耳机开源助听器研究

    该系统包括一块电池和一套双耳耳后 (BTE) 助听器,每侧包括两个麦克风和耳道内的接收器 (RIC)。BTE-RIC 设备通过柔性电缆与处理盒连接。硬件上运行优化的Linux操作系统Mahalia 。整个系统可由用户通过颈带佩戴,并允许基于 openMHA 进行助听器现场
    发表于 11-30 09:53 345次阅读
    骨传导耳机开源<b class='flag-5'>助听器</b>研究

    助听器中可接受声音延迟度的研究和标准建议

    声音的延时,是个对立矛盾的指标。怎样的声音延迟水平是可以接受的。这个问题在助听行业已经讨论了20多年,但是一直没有形成一个行业的标准。
    的头像 发表于 11-25 15:00 523次阅读
    <b class='flag-5'>助听器</b>中可接受<b class='flag-5'>声音</b>延迟度的研究和标准建议

    关爱听障群体,拓普联科为助听器行业发展助力

    拓普联科为Bose的这款助听器精研了充电仓内壳组件及助听器端磁吸精密组件。充电仓内壳组件由Pogo Pin、磁铁、磁吸线及外壳组件组成,充电仓内壳组件模块化的设计,使客户整体实现更容易。拓普联科Pogo Pin承受大电流传输1A-10A设计,可实现快速充电。
    的头像 发表于 08-31 10:32 903次阅读
    关爱听障群体,拓普联科为<b class='flag-5'>助听器</b>行业发展助力

    聚焦语音 AI:在 AR 眼镜上可视化语音和声音

    的对话和非语音声音。通过将语音和声音 AI 相结合,可以将这些可视化效果叠加到 AR 眼镜上,从而使用户能够看到并理解他们无法听到的声音
    的头像 发表于 07-26 19:30 449次阅读

    助听器电路原理图详解

    这是一种更便宜的DIY助听器选择。它不能替代听力学家开出的真正助听器。放大所有声音和频率,或在嘈杂的环境中持续使用都可能导致额外的听力损失。该电路可能有助于某些类型的听力损失和偶尔使用,以及在人们等待获得
    的头像 发表于 07-23 17:47 2785次阅读
    <b class='flag-5'>助听器</b>电路原理图详解

    聋人智能门铃开源构建

    电子发烧友网站提供《聋人智能门铃开源构建.zip》资料免费下载
    发表于 07-04 11:21 0次下载
    <b class='flag-5'>聋人</b>智能门铃开源构建

    无线充电助听器解决方案

    助听器是一种微小型扩声设备,将外界的声音放大到听力损失患者需要的程度。利用患者的残余听力进行补偿听力不足,使听力损失患者能和正常听力一样能听到声音,是目前帮助耳聋患者改善听力的最有效工具。
    的头像 发表于 06-12 02:56 388次阅读
    无线充电<b class='flag-5'>助听器</b>解决方案

    国产工业级RK3568核心-AI人脸识别产品方案

    迅为RK3568开发采用瑞芯微推出的一款高性能、低功耗的RK3568处理器,其拥有强大的AI计算能力和图像处理能力,非常适合用于人脸识别终端产品的设计。 针对人脸识别终端产品,可以采用RK3568
    发表于 05-06 14:30