0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

嵌入式神经网络赋予人工智能视觉、听觉和分析能力

电子工程师 来源:未知 作者:邓佳佳 2018-03-28 10:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

工智能(AI)潜在的应用与日俱增。不同的神经网络(NN)架构能力经过测试、调整和改进,解决了不同的问题,也开发出以AI优化数据分析的各种方法。当今大部份的AI应用,例如Google翻译(Google Translate)和亚马逊(Amazon) Alexa语音识别和视觉识别系统,都利用了云端的力量。

藉由依赖常时连网(always-on)的因特网联机、高带宽链路和网络服务,物联网(IoT)产品和智能手机应用也可以整合AI功能。到目前为止,大部份的注意力都集中在基于视觉的人工智能上,部份原因在于它易于出现在新闻报导和视频中,另外一部份的原因则是它更类似于人类的活动。

在影像识别中,针对一个2D影像进行分析——每次处理一组像素,透过神经网络的连续层识别更大的特征点。一开始检测到的边缘是具有高对比度差异的部份。以人脸为例,最早识别的部位是在眼睛、鼻子和嘴巴等特征外围。随着检测过程深入神经网络,将会检测到整个脸部的特征。

而在最后阶段,结合这些特征及其位置信息,就能在可用的数据库中识别到具有最匹配的一张特定人脸。

神经网络的特征提取

为了匹配经由相机拍摄或撷取的物体,希望能透过神经网络在其数据库中找到匹配机率最高的人脸。其巧妙之处在于撷取物体时并不需要与数据库中的照片拍摄角度或场景完全相同,也不必处于相同的光线条件下。

AI这么快就流行起来,在很大程度上是因为开放的软件工具(也称为架构),使得建构和训练神经网络实现目标应用变得容易起来,即使是使用各种不同的编程语言。两个常见的通用架构是TensorFlow和Caffe。对于已知的识别目标,可以脱机定义和训练神经网络。一旦训练完成,神经网络就可以很容易地部署到嵌入式平台上。这是一种很聪明的划分方式,能够藉由开发PC或云端的力量来训练神经网络,而功耗敏感的嵌入式处理器只需为了识别目的而使用训练数据。

这种类似人类的人/物识别能力与流行的应用密切相关,例如工业机器人自动驾驶车。然而,人工智能在音频领域同样具有吸引力和强大的能力。它采用和影像特征分析同样的方式,可以将音频分解成特征点而馈入神经网络。其中一种方法是使用梅尔频率倒谱系数(MFCC)将音频分解成有用的特性。一开始,音频样本被分解成短时间的讯框,例如20ms,然后再对信号进行傅利叶转换(Fourier transforms),使用重迭三角窗将音频频谱的功率映像到非线性尺度上。

声音神经网络分解图

透过这些提取的特征,神经网络可以用来确定音频样本和音频样本数据库中词汇或者语音的相似度。就像影像识别一样,神经网络为特定词汇在数据库中提取了可能的匹配。对于那些想要复制Google和亚马逊的‘OK Google’或‘Alexa’语音触发(VT)功能的业者来说,KITT.AI透过Snowboy提供了一个解决方案。触发关键词可以上传到他们的平台进行分析,导出一个档案后再整合进嵌入式平台上的Snowboy应用程序,这样语音触发(VT)的关键词在脱机情况下也可以被检测到。音频识别并不局限于语言识别。TensorFlow提供了一个iOS上的示例,可以区分男性和女性的声音。

另一个替代应用是检测我们居住的城市和住宅周围动物和其他声音。这已经由安装在英国伦敦伊丽莎白女王奥林匹克公园(Queen Elizabeth Olympic Park)的深度学习蝙蝠监控系统验证过了。它提供了将视觉和听觉识别神经网络整合于一个平台的可能性。例如透过音频识别别特定的声音,可以用来触发安全系统进行录像。

有很多基于云端的AI应用是不实际的,一方面存在数据隐私的问题,另一方面由于数据连接性差或带宽不够造成服务不能持续。另外,实时性能也是一个值得关注的问题。例如工业制造系统需要实时响应,以便实时操作生产线,如果连接云端服务的延迟就太长了。

因此,将AI功能移动到“边缘”(edge)越来越受到关注。也就是说,在使用中的装置上发挥人工智能的力量。很多IP供货商都提供了解决方案,如CEVA的CEVA-X2和NeuPro IP核心和配套软件,都很容易和现有的神经网络架构进行整合。这为开发具备人工智能的嵌入式系统提供了可能性,同时提供了低功耗处理器的灵活性。以一个语音识别系统为例,可以利用整合在芯片上的功耗优化人工智能,以识别一个语音触发关键词和语音命令(VC)的最小化组合。更复杂的语音命令和功能,可以在应用从低功耗的语音触发状态下唤醒之后,由基于云端的AI完成。

最后,卷积神经网络(CNN)也可以用来提高文本到语音(TTS)系统的质量。一直以来,TTS用于将同一个配音员的许多高质量录音片段,整合成连续的声音。虽然所输出的结果是人类可以理解的,但由于输出结果存在奇怪的语调和音调,仍然感觉像是机器人的声音。如果试图表现出不同的情绪则需要一组全新的录音。Google的WaveNet改善了当前的情况,透过CNN以每秒16,000个样本产生TTS波形。与之前的声音样本相比,其输出结果是无缝连接的,明显表现出更自然、更高质量的声音。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5186

    文章

    20146

    浏览量

    328814
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106796
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261511

原文标题:嵌入式神经网络赋予机器视觉、听觉和分析能力

文章出处:【微信号:robot-1hjqr,微信公众号:1号机器人网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    人工智能正在重新定义嵌入式系统

    人工智能(AI)正在从设计到功能等各个层面重新定义嵌入式系统。
    的头像 发表于 09-04 16:57 1669次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖
    发表于 08-07 14:23

    【RK3588】嵌入式人工智能实验箱——智启高校产教融合新平台

    在AIoT技术驱动产业变革的浪潮中,嵌入式人工智能已成为工业物联网、智慧交通、智慧医疗等领域创新突破的关键引擎。飞凌嵌入式教育品牌ElfBoard立足产业前沿,重磅推出嵌入式
    的头像 发表于 06-11 14:29 1349次阅读
    【RK3588】<b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>实验箱——智启高校产教融合新平台

    【新品发布】嵌入式人工智能实验箱EDU-AIoT ELF 2正式发布

    在万物互联的智能化时代,将AI算法深度植入硬件终端的技术,正悄然改变着工业物联网、智慧交通、智慧医疗等领域的创新边界。为了助力嵌入式人工智能在教育领域实现高质量发展,飞凌嵌入式旗下教育
    的头像 发表于 05-27 14:01 885次阅读
    【新品发布】<b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>实验箱EDU-AIoT ELF 2正式发布

    开售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 处理器、神经网络处理器 NPU, Android 14.0/debian11/ubuntu20.04 操作系统
    发表于 04-23 10:55

    入行嵌入式难度大不大?

    技术的不断进步,嵌入式工程师需要不断学习新的技术,如人工智能、物联网等。同时,提升自己的项目经验和解决问题的能力,也有助于提高薪资待遇和职业发展空间。 (四)感兴趣入行 如果你对嵌入式
    发表于 04-17 10:14

    【「芯片通识课:一本书读懂芯片技术」阅读体验】从deepseek看今天芯片发展

    近日有幸得到一本关于芯片制造的书籍,刚打开便被npu章节吸引,不禁感叹芯片发展速度之快令人咂舌:如deepseek搬强大的人工智能,也能运行在嵌入式soc板卡了! 这里先看书里是怎么介绍npu
    发表于 04-02 17:25

    BP神经网络的优缺点分析

    自学习能力 : BP神经网络能够通过训练数据自动调整网络参数,实现对输入数据的分类、回归等任务,无需人工进行复杂的特征工程。 泛化能力
    的头像 发表于 02-12 15:36 1581次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工
    的头像 发表于 01-09 10:24 2246次阅读
    <b class='flag-5'>人工</b><b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法

    哪些专业适合学习嵌入式开发?

    市场的80%以上,那什么专业能够轻松转行呢? 1)计算机科学与技术:作为基础学科,计算机科学与技术专业提供了编程、算法、数据结构等基础知识,适合转行到嵌入式人工智能和物联网领域。 2)电子信息工程
    发表于 01-03 13:44

    开源项目 ! 利用边缘计算打造便携视觉识别系统

    的物品 硬件 Khadas VIM4 单板计算机 :配备具备 3.2 万亿次每秒(TOPS)算力的神经网络处理器(NPU),为人工智能运算提供强大动力。 Khadas IMX415 摄像头 :像素为
    发表于 12-16 16:31

    RT-Thread Smart 嵌入式人工智能师资培训通知

    随着AI技术的不断成熟和发展,人工智能正成为推动经济社会发展的新引擎,被广泛应用于各行业。嵌入式人工智能人工智能落地的重要形式,人工智能
    的头像 发表于 12-12 18:45 1444次阅读
    RT-Thread Smart <b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>师资培训通知

    什么是嵌入式人工智能

    嵌入式人工智能的目标是使嵌入式系统具备智能化的感知、分析和响应能力,从而实现自主决策、自适应学
    的头像 发表于 12-11 09:23 1519次阅读
    什么是<b class='flag-5'>嵌入式</b><b class='flag-5'>人工智能</b>