0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

让“聋人”看到声音 行空板 —“AI助听器”

话说科技 来源:话说科技 作者:话说科技 2024-01-12 13:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


世界上有各种各样的残障人士,这些人或不能说话,或听不见声音。聋人,是听力因先天遗传或后天人为因素而受损的残疾人,也叫听力障碍者,简称听障人。根据最近的全国人口普查统计,全中国大约有2700多万听障人,包括弱听、重听、老化聋等。因为各种不方便让其在这个世界上生活极为不方便。比如有人敲门,水龙头忘关、孩子在卧室里啼哭,可是“听障人”他们听不见。利用人工智能,让模型学习各种声音,使用开源硬件-行空板采集声音,通过物联网将相应文字信息发送给Arduino主板在显示屏上显示并利用灯光提醒,并且利用micro:bit制作的手表进行文字、灯光加震动提醒,让“听障人”看见、感触到声音。

音频信号


声音以音频信号的形式表示,音频信号具有频率、带宽、分贝等参数,音频信号一般可表示为振幅和时间的函数。这些声音有多种格式,因此计算机可以对其进行读取和分析。例如:mp3 格式、WMA (Windows Media Audio) 格式、wav (Waveform Audio File) 格式。


【语谱图】


语谱图是二战时期发明的一种语音频谱图,一般是通过处理接收的时域信号得到频谱图。
语谱图是频谱分析视图,如果针对语音数据的话,叫语谱图。语谱图的横坐标是时间,纵坐标是频率,坐标点值为语音数据能量。由于是采用二维平面表达三维信息,所以能量值的大小是通过颜色来表示的,颜色深,表示该点的语音能量越强。

语音的时域分析和频域分析是语音分析的两种重要方法,但是都存在着局限性。时域分析对语音信号的频率特性没有直观的了解,频域特性中又没有语音信号随时间的变化关系。而语谱图综合了时域和频域的优点,明显的显示出了语音频谱随时间的变化情况、语谱图的横轴为时间,纵轴为频率,任意给定频率成分在给定时刻的强弱用颜色深浅来表示。颜色深的,频谱值大,颜色浅的,频谱值小。语谱图上不同的黑白程度形成不同的纹路,称之为声纹,不同讲话者的声纹是不一样的,可用作声纹识别。

使用Librosa库批量生成各类声音的语谱图,如敲门声、水龙头流水声、婴儿啼哭声、警报声等。Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大。


【录制音频】


使用pyaudio库这个可以进行录音,生成wav文件。PyAudio 提供了 PortAudio 的 Python 语言版本,这是一个跨平台的音频 I/O 库,使用 PyAudio 你可以在 Python 程序中播放和录制音频。为PoTaTudio提供Python绑定,跨平台音频I/O库。使用PyAudio,您可以轻松地使用Python在各种平台上播放和录制音频。

【硬件制作过程】

一、行空板主控

按钮接行空板引脚21(用于关闭提醒),LED灯接引脚22(用于亮灯提醒)。

二、“掌控板”手表

将震动马达接“掌控宝”的M2接口,并粘在表带上。当掌控板收到信息后,启动震动马达开始震动,提醒“听障人”查看屏幕提示信息。

【训练模型】


将图片上传到“英艻AI训练平台”进行模型训练。类型有[size=18.6667px]“background”[size=18.6667px]、“door”、“water”。

【行空板推理】

下载模型,放到行空板程序相应目录。

利用行空板板载麦克风采集声音,利用matplotlib变换成图片,使用keras加载训练好的模型“keras_model.h5”,进行预测出声音类型。点亮LED灯并通过物联网发送相关信息指令。

【掌控板手表程序】

通过物联网接收行空板传来的指令,屏幕显示相应信息,板载LED灯循环闪烁,并驱动马达震动。

通过利用人工智能和物联网技术,我们可以为听障人士创造一个更加便利和包容的世界。通过让模型学习各种声音,并使用开源硬件采集声音,我们可以通过文字信息、显示屏、灯光和震动等方式,让听障人士能够看见、感受到声音的存在。这种技术的应用,不仅可以帮助听障人士更好地融入社会和生活,还能提高他们的生活质量和安全感。

关于行空板—“AI助听器”项目的详细实现过程,请访问DF创客社区了解更多。

上海智位机器人

上海智位机器人成立于2010年,是全球领先的从事开源硬件、机器人产品和科创教育的高科技企业,打造了DFRobot、蘑菇云科创教育等品牌,是国内最早的创客理念引入者和倡导者,创客教育的开拓者和引领者。旗下拥有中国最大的线上DF创客社区和国家级创客空间——蘑菇云创客空间,提供丰富的线上和线下学习资源,构建了一个自由、开放和富于创造力的交流空间。其Gravity产品已被全球超过100万开发者选用。合作伙伴包括微软、英特尔、Autodesk、霍尼韦尔、NASA、MIT等知名厂商和机构。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 助听器
    +关注

    关注

    18

    文章

    195

    浏览量

    41415
  • AI
    AI
    +关注

    关注

    90

    文章

    38204

    浏览量

    297061
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Knowles发布MM60麦克风:掀起助听器AI听觉”革命

    最大化提升助听器AI芯片组性能而设计的MEMS麦克风,可提供更清晰的声音信号和更低的噪声水平。   当前,全球助听器市场正以稳健速度扩张,2020-2025年复合年增长率达6.6%,2
    的头像 发表于 11-03 05:53 6740次阅读

    理论到操作实现 AI玩具机器人等智能硬件在嘈杂环境中只听我说话

    如何ai在嘈杂的环境中仅识别你的声音呢?我们的方案即是使用声纹来进行分别
    的头像 发表于 10-17 17:34 507次阅读

    轻松配置小智AI语音开发,安信可IOT小程序功能更新

    版使用教程: 安信可AI语音开发全面升级商用版!(附教程) 为了让开发体验更加流畅,安信可IOT小程序本次进行了多项功能升级,一起来看看吧   PART.01角色音色试听 选声音,不再“盲选”。 在语音交互场景中,
    的头像 发表于 08-19 17:46 930次阅读
    轻松配置小智<b class='flag-5'>AI</b>语音开发<b class='flag-5'>板</b>,安信可IOT小程序功能更新

    DFRobotM10扩展板组合:科创项目开发更简单的“黄金搭档”

    M10一直作为备受科创爱好者与竞赛学生青睐的开发利器,此前推出的扩展板组合(电机IO扩展板+电池扩展板)已帮助无数创客实现创意构想。这套采用叠装设计的组合不仅完美解决了供电难题,更能让行
    的头像 发表于 08-01 10:32 1031次阅读
    DFRobot<b class='flag-5'>行</b><b class='flag-5'>空</b><b class='flag-5'>板</b>M10扩展板组合:<b class='flag-5'>让</b>科创项目开发更简单的“黄金搭档”

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    缺的是那些能把技术做成产品的工程师。”越来越多的AI芯片厂商开始提供端侧SDK、开放板卡、量产评估工具, “能焊AI工程师”进入主舞台 。从电子发烧友网社区的活跃趋势也能看出,2
    发表于 07-30 16:15

    联想,AI计算发生“钟摆革命”

    AI基础设施革新,智能化越过山丘
    的头像 发表于 05-15 19:12 1917次阅读
    联想,<b class='flag-5'>让</b><b class='flag-5'>AI</b>计算发生“钟摆革命”

    首创开源架构,天玑AI开发套件端侧AI模型接入得心应手

    Studio提供了最优解。Neuron Studio可针对模型到应用,提供一站式、全链路、自动化的开发协助,不仅AI应用开发的全流程可视化,更带来整个多种工具的一站式开发能力,还支持神经网络自动化调优和跨
    发表于 04-13 19:52

    雷卯收集AI实验课程开发

    收集目的:方便客户选用AI实验课程开发,并且能够AI实验课程开发稳定工作。雷卯EMC小哥围绕AI
    的头像 发表于 04-02 12:14 557次阅读
    雷卯收集<b class='flag-5'>AI</b>实验课程开发<b class='flag-5'>板</b>

    华为全光网加速AI普惠千万业

    技术会快速从数据中心内部以及数据中心互联,延伸到每张行业通信网、每个园区、每个感知终端,实现以光强算、以光促算、以光惠算、以光赋算,AI普惠千万业。
    的头像 发表于 04-01 15:32 859次阅读

    MWC 2025 | 广和通发布「AI For X」:以AI重塑千百业

    作为全球领先的AIoT模组及解决方案提供商,广和通26年来始终致力于为全球千百业打造创新物联方式。面向全新的AI时代,广和通推出「AI For X」,宣布以全方位、多方式的AI技术能
    的头像 发表于 03-03 18:06 761次阅读
    MWC 2025 | 广和通发布「<b class='flag-5'>AI</b> For X」:以<b class='flag-5'>AI</b>重塑千<b class='flag-5'>行</b>百业

    MWC 2025 广和通发布「AI For X」:以AI重塑千百业

    深圳2025年2月28日 /美通社/ -- 作为全球领先的AIoT模组及解决方案提供商,广和通26年来始终致力于为全球千百业打造创新物联方式。面向全新的AI时代,广和通推出「AI For X
    的头像 发表于 03-03 16:39 571次阅读

    AI Agent应用与项目实战》阅读体验--跟着迪哥学Agent

    的知识是自由,那么阅读《Agent》就是跟团游。它我对AI落地应用有了更系统和清晰的了解。 《Agent》第一章是全书的导引章节,本章我对Agent的理解从模糊到清晰,然后逐一介
    发表于 03-02 12:28

    百度AI手语数字人助力听障人士“听见”声音

    近几年,百度先后与天津理工大学、鲸言科技合作,共同研发出百度智能云曦灵AI手语平台与双向手语翻译机,手语的“声音”,被更多人听见。
    的头像 发表于 02-21 11:29 1323次阅读

    KT148A语音芯片的声音小,如何喇叭声音变大?声音影响注意点

    声音的大小是一个系统的工作,KT148A本身驱动声音的能力是很大的,达到200mA,通过电流也可以看出来。所以一般8欧姆1w以内的,不需要考虑外挂功放 喇叭的选择原则上越大越好,视结构而定。 尽量选择纸盆类型的喇叭【某宝搜搜】,发声更清晰,更大,也就贵一点点而已
    的头像 发表于 01-10 09:53 1221次阅读
    KT148A语音芯片的<b class='flag-5'>声音</b>小,如何<b class='flag-5'>让</b>喇叭<b class='flag-5'>声音</b>变大?<b class='flag-5'>声音</b>影响注意点

    DFRobotM10:重塑智能家居体验,构建全屋高效便捷的控制终端

    基于DFRobotM10开发的一款全新的智能家居终端,旨在提供简单直观的操作体验和更高效的设备管理。通过这一终端,用户可以轻松控制家中的各种设备,享受安全、便捷的智能生活。
    的头像 发表于 12-20 12:23 1111次阅读
    DFRobot<b class='flag-5'>行</b><b class='flag-5'>空</b><b class='flag-5'>板</b>M10:重塑智能家居体验,构建全屋高效便捷的控制终端