0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过计算机视觉和深度学习技术分析面部表情的方法

电子设计 来源:互联网 作者:佚名 2017-12-21 17:03 次阅读

识别面部表情和情绪是人类社交初期阶段的一项基本且非常重要的技能。人类可以观察一个人的面部,并且快速识别常见的情绪:怒、喜、惊、厌、悲、恐。将这一技能传达给机器是一项复杂的任务。研究人员通过几十年的工程设计,试图编写出能够准确识别一个特征的计算机程序,但不得不反复重新开始,以识别出只有细微差别的特征。 如果不对机器进行编程,而是教会机器精确识别情绪,这样会如何呢?

深度学习技能对于降低计算机视觉识别和分类的错误率展现出了巨大的优势。在嵌入式系统中实施深度神经网络(见图1)有助于机器通过视觉解析面部表情,并达到类似人类的准确度。

图1. 深度神经网络的简单例子

神经网络可通过训练而识别出模式,而且如果它拥有输入输出层以及至少一个隐含的中间层,则被认为具有“深度”识别能力。每个节点从上一层中的多个节点的加权输入值而计算出来。这些加权值可经过调整而执行特别的图像识别任务。这称为神经网络训练过程。

例如,为了训练深入神经网络识别出面带开心的照片,我们向其展示开心的图片作为输入层上的原始数据(图像像素)。由于知道结果是开心,网络会识别图片中的模式,并调整节点权重,最大限度减少开心类别图片的错误。每个显示出开心表情并带有注释的新图片都有助于优化图片权重。凭借充足输入信息的训练,网络可以摄入不带标记的图片,并且准确地分析和识别与开心表情相对应的模式。

深度神经网络需要大量的计算能力,用于计算所有这些互连节点的权重值。此外,数据内存和高效的数据移动也很重要。卷积神经网络 (CNN)(见图2所示)是当前针对视觉的深度神经网络中实现效率最高的。CNN之所以效率更高,原因是这些网络能够重复使用图片间的大量权重数据。它们利用数据的二维输入结构减少重复计算。

图2. 用于面部分析的卷积神经网络架构(或示意图)举例

实施用于面部分析的CNN需要两个独特且互相独立的阶段。第一个是训练阶段。第二个是部署阶段。

训练阶段(见图3所示)需要一个深度学习框架 – 例如Caffe或TensorFlow – 它采用CPUGPU进行训练计算,并提供框架使用知识。这些框架通常提供可用作起点的CNN图形范例。深度学习框架可对图形进行微调。要实现尽可能最佳的精确度,可以增加、移除或修改层次。

图3. CNN训练阶段

在训练阶段的一个最大挑战是寻找标记正确的数据集,以对网络进行训练。深度网络的精确度非常依赖训练数据的分布和质量。面部分析需考虑的多个选项是来自面部表情识别挑战赛 (FREC) 的情感标注数据集和来自VicarVision (VV) 的多标注私有数据集。

部署阶段(见图4所示)针对实时嵌入式设计,可在嵌入式视觉处理器上实施,例如带有可编程CNN引擎的Synopsys DesignWare® EV6x嵌入式视觉处理器。嵌入式视觉处理器是平衡性能和小面积及更低功耗关系的最佳选择。

图4. CNN部署阶段

标量单元和向量单元采用C和OpenCL C(用于实现向量化)进行编程,而CNN引擎不必手动编程。来自训练阶段的最终图形和权重(系数)可以传送到CNN映射工具中,而嵌入式视觉处理器的CNN引擎可以经过配置而随时用于执行面部分析。

从摄像头和图像传感器捕捉的图像或视频帧被送入嵌入式视觉处理器。在照明条件或者面部姿态有显著变化的识别场景中,CNN比较难以处理,因此,图像的预处理可以使面部更加统一。先进的嵌入式视觉处理器和CNN和异构架构允许CNN引擎对图像进行分类,向量单元会对下一个图像进行预处理 – 光线校正、图像缩放、平面旋转等,而标量单元则处理决策(即如何处理CNN检测结果)。

图像分辨率、帧率、图层数和预期精确度都要考虑所需的并行乘累加数量和性能要求。Synopsys带有CNN的EV6x嵌入式视觉处理器可采用28nm工艺技术以800MHz的速率运行,同时提供高达880 MAC的性能。

一旦CNN经过配置和训练而具备检测情感的能力,它就可以更轻松地进行重新配置,进而处理面部分析任务,例如确定年龄范围、识别性别或种族,并且识别发型或是否戴眼镜。

总结
嵌入式视觉处理器上运行的CNN开辟了视觉处理的新领域。很快,我们周围能够解析情感的电子设备将很常见,例如检测开心情绪的玩具,以及能够通过识别面部表情而确定学生理解情况的电子教师。深度学习、嵌入式视觉处理和高性能CNN的结合将很快将这一愿景变为现实。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98748
  • 计算机视觉
    +关注

    关注

    8

    文章

    1600

    浏览量

    45616
  • 深度学习
    +关注

    关注

    73

    文章

    5237

    浏览量

    119908
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21298
收藏 人收藏

    评论

    相关推荐

    让机器“看见”—计算机视觉入门及实战 第二期基础技术

    、图像检索等技术的主流方法和基本思路,并从数据处理、模型训练、系统优化以及模型评测的角度讲解解决实际问题时的应对方法,让大家对计算机视觉
    发表于 09-04 17:56

    基于深度学习计算机视觉面部表情分析

    、厌、悲、恐。将这一技能传达给机器是一项复杂的任务。研究人员通过几十年的工程设计,试图编写出能够准确识别一个特征的计算机程序,但不得不反复重新开始,以识别出只有细微差别的特征。 如果不对机器进行编程,而是教会机器精确识别情绪,这样会如何呢?
    发表于 07-17 07:31

    请问计算机视觉深度学习要看什么书?

    计算机视觉深度学习,看这本书就够了
    发表于 05-21 12:43

    深度学习计算机视觉领域图像应用总结 精选资料下载

    突破的领域,真正让大家大吃一惊的颠覆传统方法的应用领域是语音识别,做出来的公司是微软,而不是当时如日中天的谷歌。计算机视觉应用深度学习堪称突
    发表于 07-28 08:22

    深度学习与传统计算机视觉简介

    文章目录1 简介1.1 深度学习与传统计算机视觉1.2 性能考量1.3 社区支持2 结论3 参考在计算机
    发表于 12-23 06:17

    深度学习不能取代计算机视觉技术背后的真正原因

    深度学习只是一种 计算机视觉 工具,而不是包治百病的良药,不要因为流行就一味地使用它。传统的计算机视觉
    的头像 发表于 04-05 11:37 4552次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>不能取代<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>技术</b>背后的真正原因

    技术 | 深度学习计算机视觉领域的瓶颈已至

    霍金的弟子,约翰霍普金斯大学教授Alan Yuille提出“深度学习计算机视觉领域的瓶颈已至。
    的头像 发表于 07-05 10:07 2356次阅读

    深度学习计算机视觉上的四大应用

    计算机视觉中比较成功的深度学习的应用,包括人脸识别,图像问答,物体检测,物体跟踪。
    的头像 发表于 08-24 16:16 4072次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>在<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>上的四大应用

    DL和传统计算机视觉的比较

    分析每种方法的优缺点。本文的目的是促进有关是否应保留经典计算机视觉技术知识的讨论。本文还将探讨如何将
    的头像 发表于 10-31 11:06 4835次阅读
    DL和传统<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的比较

    面部表情识别应用方法

    面部表情识别是指通过计算机技术和图像处理技术来识别人脸表情的过程。
    的头像 发表于 04-20 18:16 2797次阅读

    人脸面部表情识别的原理及其应用

    人脸面部表情识别是一种通过计算机视觉技术分析人脸图
    的头像 发表于 06-02 17:57 2854次阅读

    面部表情识别的技术实现

    面部表情识别是一项复杂的技术,需要综合运用计算机视觉、机器学习
    的头像 发表于 08-02 18:10 782次阅读

    面部表情识别研究:解读情绪的密码

    是一种通过计算机算法分析面部表情,从而理解人类情绪的技术。它结合了图像处理、机器
    的头像 发表于 08-14 18:09 569次阅读

    面部表情识别:心理学与计算机科学的交汇点

    面部表情识别不仅是计算机科学领域的研究热点,也是心理学的重要研究方向。这两个领域的交叉点在于理解和解析人类情绪。 心理学家通常通过观察和描述个体的
    的头像 发表于 08-14 18:19 354次阅读

    计算机视觉中的九种深度学习技术

    计算机视觉中仍有许多具有挑战性的问题需要解决。然而,深度学习方法正在针对某些特定问题取得最新成果。 在最基本的问题上,最有趣的不仅仅是深度
    发表于 08-21 09:56 360次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>中的九种<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>技术</b>