发烧友10周年庆典,全网超值优惠来袭!千元现金券,下单抽奖赶紧参与》》

【干货】计算机视觉必读:目标跟踪、网络压缩、图像分类、人脸识别等

新智元 2018-03-30 10:02 次阅读

深度学习目前已成为发展最快、最令人兴奋的机器学习领域之一。本文以计算机视觉的重要概念为线索,介绍深度学习在计算机视觉任务中的应用,包括网络压缩、细粒度图像分类、看图说话、视觉问答、图像理解、纹理生成和风格迁移、人脸识别、图像检索、目标跟踪等。

网络压缩(network compression)

尽管深度神经网络取得了优异的性能,但巨大的计算和存储开销成为其部署在实际应用中的挑战。有研究表明,神经网络中的参数存在大量的冗余。因此,有许多工作致力于在保证准确率的同时降低网路复杂度。

低秩近似用低秩矩阵近似原有权重矩阵。例如,可以用SVD得到原矩阵的最优低秩近似,或用Toeplitz矩阵配合Krylov分解近似原矩阵。

剪枝(pruning) 在训练结束后,可以将一些不重要的神经元连接(可用权重数值大小衡量配合损失函数中的稀疏约束)或整个滤波器去除,之后进行若干轮微调。实际运行中,神经元连接级别的剪枝会使结果变得稀疏,不利于缓存优化和内存访问,有的需要专门设计配套的运行库。相比之下,滤波器级别的剪枝可直接运行在现有的运行库下,而滤波器级别的剪枝的关键是如何衡量滤波器的重要程度。例如,可用卷积结果的稀疏程度、该滤波器对损失函数的影响、或卷积结果对下一层结果的影响来衡量。

量化(quantization)对权重数值进行聚类,用聚类中心数值代替原权重数值,配合Huffman编码,具体可包括标量量化或乘积量化。但如果只考虑权重自身,容易造成量化误差很低,但分类误差很高的情况。因此,Quantized CNN优化目标是重构误差最小化。此外,可以利用哈希进行编码,即被映射到同一个哈希桶中的权重共享同一个参数值。

降低数据数值范围默认情况下数据是单精度浮点数,占32位。有研究发现,改用半精度浮点数(16位)几乎不会影响性能。谷歌TPU使用8位整型来表示数据。极端情况是数值范围为二值或三值(0/1或-1/0/1),这样仅用位运算即可快速完成所有计算,但如何对二值或三值网络进行训练是一个关键。通常做法是网络前馈过程为二值或三值,梯度更新过程为实数值。此外,有研究认为,二值运算的表示能力有限,因此其使用一个额外的浮点数缩放二值卷积后的结果,以提升网络表示能力。

精简结构设计有研究工作直接设计精简的网络结构。例如,(1).瓶颈(bottleneck)结构及1×1卷积。这种设计理念已经被广泛用于Inception和ResNet系列网络设计中。(2).分组卷积。(3).扩张卷积。使用扩张卷积可以保持参数量不变的情况下扩大感受野。

知识蒸馏(knowledge distillation)训练小网络以逼近大网络,但应该如何去逼近大网络仍没有定论。

软硬件协同设计常用的硬件包括两大类:(1). 通用硬件,包括CPU(低延迟,擅长串行、复杂运算)和GPU(高吞吐率,擅长并行、简单运算)。(2). 专用硬件,包括ASIC(固定逻辑器件,例如谷歌TPU)和FPGA(可编程逻辑器件,灵活,但效率不如ASIC)。

细粒度图像分类(fine-grained image classification)

相比(通用)图像分类,细粒度图像分类需要判断的图像类别更加精细。比如,我们需要判断该目标具体是哪一种鸟、哪一款的车、或哪一个型号的飞机。通常,这些子类之间的差异十分微小。比如,波音737-300和波音737-400的外观可见的区别只是窗户的个数不同。因此,细粒度图像分类是比(通用)图像分类更具有挑战性的任务。

细粒度图像分类的经典做法是先定位出目标的不同部位,例如鸟的头、脚、翅膀等,之后分别对这些部位提取特征,最后融合这些特征进行分类。这类方法的准确率较高,但这需要对数据集人工标注部位信息。目前细粒度分类的一大研究趋势是不借助额外监督信息,只利用图像标记进行学习,其以基于双线性CNN的方法为代表。

双线性CNN (bilinear CNN)其通过计算卷积描述向量(descriptor)的外积来考察不同维度之间的交互关系。由于描述向量的不同维度对应卷积特征的不同通道,而不同通道提取了不同的语义特征,因此,通过双线性操作,可以同时捕获输入图像的不同语义特征之间的关系。

精简双线性汇合双线性汇合的结果十分高维,这会占用大量的计算和存储资源,同时使后续的全连接层的参数量大大增加。许多后续研究工作旨在设计更精简的双线性汇合策略,大致包括以下三大类:(1).PCA降维。在双线性汇合前,对深度描述向量进行PCA投影降维,但这会使各维不再相关,进而影响性能。一个折中的方案是只对一支进行PCA降维。(2).近似核估计。可以证明,在双线性汇合结果后使用线性SVM分类等价于在描述向量间使用了多项式核。由于两个向量外积的映射等于两个向量分别映射之后再卷积,有研究工作使用随机矩阵近似向量的映射。此外,通过近似核估计,我们可以捕获超过二阶的信息(如下图)。(3).低秩近似。对后续用于分类的全连接层的参数矩阵进行低秩近似,进而使我们不用显式计算双线性汇合结果。

“看图说话”(image captioning)

“看图说话”旨在对一张图像产生对其内容一两句话的文字描述。这是视觉和自然语言处理两个领域的交叉任务。

编码-解码网络(encoder-decoder networks)看图说话网络设计的基本思想,其借鉴于自然语言处理中的机器翻译思路。将机器翻译中的源语言编码网络替换为图像的CNN编码网络以提取图像的特征,之后用目标语言解码网络生成文字描述。

Show, attend, and tell注意力(attention)机制是机器翻译中用于捕获长距离依赖的常用技巧,也可以用于看图说话。在解码网络中,每个时刻,除了预测下一个词外,还需要输出一个二维注意力图,用于对深度卷积特征进行加权汇合。使用注意力机制的一个额外的好处是可以对网络进行可视化,以观察在生成每个词的时候网络注意到图像中的哪些部分。

Adaptive attention之前的注意力机制会对每个待预测词生成一个二维注意力图(图(a)),但对于像the、of这样的词实际上并不需要借助来自图像的线索,并且有的词可以根据上文推测出也不需要图像信息。该工作扩展了LSTM,以提出“视觉哨兵”机制以判断预测当前词时应更关注上文语言信息还是更关注图像信息(图(b))。此外,和之前工作利用上一时刻的隐层状态计算注意力图不同,该工作使用当前隐层状态。

视觉问答(visual question answering)

给定一张图像和一个关于该图像内容的文字问题,视觉问答旨在从若干候选文字回答中选出正确的答案。其本质是分类任务,也有工作是用RNN解码来生成文字回答。视觉问答也是视觉和自然语言处理两个领域的交叉任务。

基本思路使用CNN从图像中提取图像特征,用RNN从文字问题中提取文本特征,之后设法融合视觉和文本特征,最后通过全连接层进行分类。该任务的关键是如何融合这两个模态的特征。直接的融合方案是将视觉和文本特征拼成一个向量、或者让视觉和文本特征向量逐元素相加或相乘。

注意力机制 和“看图说话”相似,使用注意力机制也会提升视觉问答的性能。注意力机制包括视觉注意力(“看哪里”)和文本注意力(“关注哪个词”)两者。HieCoAtten可同时或交替产生视觉和文本注意力。DAN将视觉和文本的注意力结果映射到一个相同的空间,并据此同时产生下一步的视觉和文本注意力。

双线性融合通过视觉特征向量和文本特征向量的外积,可以捕获这两个模态特征各维之间的交互关系。为避免显式计算高维双线性汇合结果,细粒度识别中的精简双线性汇合思想也可用于视觉问答。例如,MFB采用了低秩近似思路,并同时使用了视觉和文本注意力机制。

网络可视化(visualizing)和网络理解(understanding)

这些方法旨在提供一些可视化的手段以理解深度卷积神经网络。

直接可视化第一层滤波器由于第一层卷积层的滤波器直接在输入图像中滑动,我们可以直接对第一层滤波器进行可视化。可以看出,第一层权重关注于特定朝向的边缘以及特定色彩组合。这和生物的视觉机制是符合的。但由于高层滤波器并不直接作用于输入图像,直接可视化只对第一层滤波器有效。

t-SNE对图像的fc7或pool5特征进行低维嵌入,比如降维到2维使得可以在二维平面画出。具有相近语义信息的图像应该在t-SNE结果中距离相近。和PCA不同的是,t-SNE是一种非线性降维方法,保留了局部之间的距离。下图是直接对MNIST原始图像进行t-SNE的结果。可以看出,MNIST是比较容易的数据集,属于不同类别的图像聚类十分明显。

可视化中间层激活值对特定输入图像,画出不同特征图的响应。观察发现,即使ImageNet中没有人脸或文字相关的类别,网络会学习识别这些语义信息,以辅助后续的分类。

最大响应图像区域选择某一特定的中间层神经元,向网络输入许多不同的图像,找出使该神经元响应最大的图像区域,以观察该神经元用于响应哪种语义特征。是“图像区域”而不是“完整图像”的原因是中间层神经元的感受野是有限的,没有覆盖到全部图像。

输入显著性图对给定输入图像,计算某一特定神经元对输入图像的偏导数。其表达了输入图像不同像素对该神经元响应的影响,即输入图像的不同像素的变化会带来怎样的神经元响应值的变化。Guided backprop只反向传播正的梯度值,即只关注对神经元正向的影响,这会产生比标准反向传播更好的可视化效果。

梯度上升优化选择某一特定的神经元,计算某一特定神经元对输入图像的偏导数,对输入图像使用梯度上升进行优化,直到收敛。此外,我们需要一些正则化项使得产生的图像更接近自然图像。此外,除了在输入图像上进行优化外,我们也可以对fc6特征进行优化并从其生成需要的图像。

DeepVisToolbox该工具包同时提供了以上四种可视化结果。该链接中提供了一个演示视频:Jason Yosinski(yosinski.com/deepvis#toolbox)

遮挡实验(occlusion experiment)用一个灰色方块遮挡住图像的不同区域,之后前馈网络,观察其对输出的影响。对输出影响最大的区域即是对判断该类别最重要的区域。从下图可以看出,遮挡住狗的脸对结果影响最大。

Deep dream 选择一张图像和某一特定层,优化目标是通过对图像的梯度上升,最大化该层激活值的平方。实际上,这是在通过正反馈放大该层神经元捕获到的语义特征。可以看出,生成的图像中出现了很多狗的图案,这是因为ImageNet数据集1000类别中有200类关于狗,因此,神经网络中有很多神经元致力于识别图像中的狗。

对抗样本(adversarial examples) 选择一张图像和一个不是它真实标记的类别,计算该类别对输入图像的偏导数,对图像进行梯度上升优化。实验发现,在对图像进行难以察觉的微小改变后,就可以使网络以相当大的信心认为该图像属于那个错误的类别。实际应用中,对抗样本会将会对金融、安防等领域产生威胁。有研究认为,这是由于图像空间非常高维,即使有非常多的训练数据,也只能覆盖该空间的很小一部分。只要输入稍微偏离该流形空间,网络就难以得到正常的判断。

纹理生成(texture synthesis)和风格迁移(style transform)

给定一小张包含特定纹理的图像,纹理合成旨在生成更大的包含相同纹理的图像。给定一张普通图像和一张包含特定绘画风格的图像,风格迁移旨在保留原图内容的同时,将给定风格迁移到该图中。

特征逆向工程(feature inversion) 这两类问题的基本思路。给定一个中间层特征,我们希望通过迭代优化,产生一个特征和给定特征接近的图像。此外,特征逆向工程也可以告诉我们中间层特征中蕴含了多少图像中信息。可以看出,低层的特征中几乎没有损失图像信息,而高层尤其是全连接特征会丢失大部分的细节信息。从另一方面讲,高层特征对图像的颜色和纹理变化更不敏感。

Gram矩阵给定D×H×W的深度卷积特征,我们将其转换为D×(HW)的矩阵X,则该层特征对应的Gram矩阵定义为

G=XX^T

通过外积,Gram矩阵捕获了不同特征之间的共现关系。

纹理生成基本思路对给定纹理图案的Gram矩阵进行特征逆向工程。使生成图像的各层特征的Gram矩阵接近给定纹理图像的各层Gram。低层特征倾向于捕获细节信息,而高层特征可以捕获更大面积的特征。

风格迁移基本思路优化目标包括两项,使生成图像的内容接近原始图像内容,及使生成图像风格接近给定风格。风格通过Gram矩阵体现,而内容则直接通过神经元激活值体现。

直接生成风格迁移的图像上述方法的缺点是需要多次迭代才能收敛。该工作提出的解决方案是训练一个神经网络来直接生成风格迁移的图像。一旦训练结束,进行风格迁移只需前馈网络一次,十分高效。在训练时,将生成图像、原始图像、风格图像三者前馈一固定网络以提取不同层特征用于计算损失函数。

示例归一化(instance normalization)和批量归一化(batch normalization)作用于一个批量不同,示例归一化的均值和方差只由图像自身决定。实验中发现,在风格迁移网络中使用示例归一化可以从图像中去除和示例有关的对比度信息以简化生成过程。

条件示例归一化(conditional instance normalization)上述方法的一个问题是对每种不同的风格,我们需要分别训练一个模型。由于不同风格之间存在共性,该工作旨在让对应于不同风格的风格迁移网络共享参数。具体来说,其修改了风格迁移网络中的示例归一化,使其具有N组缩放和平移参数,每组对应一个不同的风格。这样,我们可以通过一次前馈过程同时获得N张风格迁移图像。

人脸验证/识别(face verification/recognition)

人脸验证/识别可以认为是一种更加精细的细粒度图像识别任务。人脸验证是给定两张图像、判断其是否属于同一个人,而人脸识别是回答图像中的人是谁。一个人脸验证/识别系统通常包括三大步:检测图像中的人脸,特征点定位、及对人脸进行验证/识别。人脸验证/识别的难题在于需要进行小样本学习。通常情况下,数据集中每人只有对应的一张图像,这称为一次学习(one-shot learning)。

两种基本思路当作分类问题(需要面对非常多的类别数),或者当作度量学习问题。如果两张图像属于同一个人,我们希望它们的深度特征比较接近,否则,我们希望它们不接近。之后,根据深度特征之间的距离进行验证(对特征距离设定阈值以判断是否属于同一个人),或识别(k近邻分类)。

DeepFace第一个将深度神经网络成功用于人脸验证/识别的模型。DeepFace使用了非共享参数的局部连接。这是由于人脸不同区域存在不同的特征(例如眼睛和嘴巴具有不同的特征),经典卷积层的“共享参数”性质在人脸识别中不再适用。因此,人脸识别网络中会采用不共享参数的局部连接。其使用孪生网络(siamese network)进行人脸验证。当两张图像的深度特征小于给定阈值时,认为其来自同一个人。

FaceNet 三元输入,希望和负样本之间的距离以一定间隔(如0.2)大于和正样本之间的距离。此外,输入三元的选择不是随机的,否则由于和负样本之间的差异很大,网络学不到什么东西。选择最困难的三元组(即最远的正样本和最近的负样本)会使网络陷入局部最优。FaceNet采用半困难策略,选择比正样本远的负样本。

大间隔交叉熵损失近几年的一大研究热点。由于类内波动大而类间相似度高,有研究工作旨在提升经典的交叉熵损失对深度特征的判断能力。例如,L-Softmax加强优化目标,使对应类别的参数向量和深度特征夹角增大。 A-Softmax进一步约束L-Softmax的参数向量长度为1,使训练更集中到优化深度特征和夹角上。实际中,L-Softmax和A-Softmax都很难收敛,训练时采用了退火方法,从标准softmax逐渐退火至L-Softmax或A-Softmax。

活体检测(liveness detection) 判断人脸是来自真人或是来自照片等,这是人脸验证/识别需要解决的关键问题。在产业界目前主流的做法是利用人的表情变化、纹理信息、眨眼、或让用户完成一系列动作等。

图像检索(image retrieval)

给定一个包含特定实例(例如特定目标、场景、建筑等)的查询图像,图像检索旨在从数据库图像中找到包含相同实例的图像。但由于不同图像的拍摄视角、光照、或遮挡情况不同,如何设计出能应对这些类内差异的有效且高效的图像检索算法仍是一项研究难题。

图像检索的典型流程首先,设法从图像中提取一个合适的图像的表示向量。其次,对这些表示向量用欧式距离或余弦距离进行最近邻搜索以找到相似的图像。最后,可以使用一些后处理技术对检索结果进行微调。可以看出,决定一个图像检索算法性能的关键在于提取的图像表示的好坏。

(1)无监督图像检索

无监督图像检索旨在不借助其他监督信息,只利用ImageNet预训练模型作为固定的特征提取器来提取图像表示。

直觉思路由于深度全连接特征提供了对图像内容高层级的描述,且是“天然”的向量形式,一个直觉的思路是直接提取深度全连接特征作为图像的表示向量。但是,由于全连接特征旨在进行图像分类,缺乏对图像细节的描述,该思路的检索准确率一般。

利用深度卷积特征由于深度卷积特征具有更好的细节信息,并且可以处理任意大小的图像输入,目前的主流方法是提取深度卷积特征,并通过加权全局求和汇合(sum-pooling)得到图像的表示向量。其中,权重体现了不同位置特征的重要性,可以有空间方向权重和通道方向权重两种形式。

CroW深度卷积特征是一个分布式的表示。虽然一个神经元的响应值对判断对应区域是否包含目标用处不大,但如果多个神经元同时有很大的响应值,那么该区域很有可能包含该目标。因此,CroW把特征图沿通道方向相加,得到一张二维聚合图,并将其归一化并根号规范化的结果作为空间权重。CroW的通道权重根据特征图的稀疏性定义,其类似于自然语言处理中TF-IDF特征中的IDF特征,用于提升不常出现但具有判别能力的特征。

Class weighted features 该方法试图结合网络的类别预测信息来使空间权重更具判别能力。具体来说,其利用CAM来获取预训练网络中对应各类别的最具代表性区域的语义信息,进而将归一化的CAM结果作为空间权重。

PWAPWA发现,深度卷积特征的不同通道对应于目标不同部位的响应。因此,PWA选取一系列有判别能力的特征图,将其归一化之后的结果作为空间权重进行汇合,并将其结果级联起来作为最终图像表示。

(2)有监督图像检索

有监督图像检索首先将ImageNet预训练模型在一个额外的训练数据集上进行微调,之后再从这个微调过的模型中提取图像表示。为了取得更好的效果,用于微调的训练数据集通常和要用于检索的数据集比较相似。此外,可以用候选区域网络提取图像中可能包含目标的前景区域。

孪生网络(siamese network)和人脸识别的思路类似,使用二元或三元(++-)输入,训练模型使相似样本之间的距离尽可能小,而不相似样本之间的距离尽可能大。

目标跟踪(object tracking)

目标跟踪旨在跟踪一段视频中的目标的运动情况。通常,视频第一帧中目标的位置会以包围盒的形式给出,我们需要预测其他帧中该目标的包围盒。目标跟踪类似于目标检测,但目标跟踪的难点在于事先不知道要跟踪的目标具体是什么,因此无法事先收集足够的训练数据以训练一个专门的检测器。

孪生网络类似于人脸验证的思路,利用孪生网络,一支输入第一帧包围盒内图像,另一支输入其他帧的候选图像区域,输出两张图的相似度。我们不需要遍历其他帧的所有可能的候选区域,利用全卷积网络,我们只需要前馈整张图像一次。通过互相关操作(卷积),得到二维的响应图,其中最大响应位置确定了需要预测的包围盒位置。基于孪生网络的方法速度快,能处理任意大小的图像。

CFNet 相关滤波通过训练一个线性模板来区分图像区域和它周围区域,利用傅里叶变换,相关滤波有十分高效的实现。CFNet结合离线训练的孪生网络和在线更新的相关滤波模块,提升轻量级网络的跟踪性能。

生成式模型(generative models)

这类模型旨在学得数据(图像)的分布,或从该分布中采样得到新的图像。生成式模型可以用于超分辨率重建、图像着色、图像转换、从文字生成图像、学习图像潜在表示、半监督学习等。此外,生成式模型可以和强化学习结合,用于仿真和逆强化学习。

显式建模根据条件概率公式,直接进行最大似然估计对图像的分布进行学习。该方法的弊端是,由于每个像素依赖于之前的像素,生成图像时由于需要从一角开始序列地进行,所以会比较慢。例如,WaveNet可以生成类似人类说话的语音,但由于无法并行生成,得到1秒的语音需要2分钟的计算,无法达到实时。

变分自编码器(variational auto-encoder, VAE)为避免显式建模的弊端,变分自编码器对数据分布进行隐式建模。其认为图像的生成受一个隐变量控制,并假设该隐变量服从对角高斯分布。变分自编码器通过一个解码网络从隐变量生成图像。由于无法直接进行最大似然估计,在训练时,类似于EM算法,变分自编码器会构造似然函数的下界函数,并对这个下界函数进行优化。变分自编码器的好处是,由于各维独立,我们可以通过控制隐变量来控制输出图像的变化因素。

生成式对抗网络(generative adversarial networks, GAN)由于学习数据分布十分困难,生成式对抗网络绕开这一步骤,直接生成新的图像。生成式对抗网络使用一个生成网络G从随机噪声中生成图像,以及一个判别网络D判断其输入图像是真实/伪造图像。在训练时,判别网络D的目标是能判断真实/伪造图像,而生成网络G的目标是使得判别网络D倾向于判断其输出是真实图像。实际中,直接训练生成式对抗网络会遇到mode collapse问题,即生成式对抗网络无法学到完整的数据分布。随后,出现了LS-GAN和W-GAN的改进。和变分自编码器相比,生成式对抗网络的细节信息更好。以下链接整理了许多和生成式对抗网络有关的论文:hindupuravinash/the-gan-zoo。以下链接整理了许多训练生成式对抗网络的其技巧:soumith/ganhacks。

视频分类(video classification)

前面介绍的大部分任务也可以用于视频数据,这里仅以视频分类任务为例,简要介绍处理视频数据的基本方法。

多帧图像特征汇合这类方法将视频看成一系列帧的图像组合。网络同时接收属于一个视频片段的若干帧图像(例如15帧),并分别提取其深度特征,之后融合这些图像特征得到该视频片段的特征,最后进行分类。实验发现,使用"slow fusion"效果最好。此外,独立使用单帧图像进行分类即可得到很有竞争力的结果,这说明单帧图像已经包含很多的信息。

三维卷积将经典的二维卷积扩展到三维卷积,使之在时间维度也局部连接。例如,可以将VGG的3×3卷积扩展为3×3×3卷积,2×2汇合扩展为2×2×2汇合。

图像+时序两分支结构这类方法用两个独立的网络分别捕获视频中的图像信息和随时间运动信息。其中,图像信息从单帧静止图像中得到,是经典的图像分类问题。运动信息则通过光流(optical flow)得到,其捕获了目标在相邻帧之间的运动情况。

CNN+RNN捕获远距离依赖之前的方法只能捕获几帧图像之间的依赖关系,这类方法旨在用CNN提取单帧图像特征,之后用RNN捕获帧之间的依赖。

此外,有研究工作试图将CNN和RNN合二为一,使每个卷积层都能捕获远距离依赖。

原文标题:【新智元干货】计算机视觉必读:目标跟踪、网络压缩、图像分类、人脸识别等

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

龙哥教你1天学会LabVIEW人脸识别

首发labview人脸识别编程,识别率达到97%。在“刷脸”技术不断趋于成熟的今天,提前掌握最新技术,意味先于别人获得职
发表于 04-17 00:00 0次 阅读
龙哥教你1天学会LabVIEW人脸识别

生物识别想要开启新时代首先应该怎样做

随着技术发展,生物识别技术已经开始落地商用,刷脸安检,指纹支付,都是生物识别的应用。
发表于 09-20 08:41 6次 阅读
生物识别想要开启新时代首先应该怎样做

人工智能完全可以打造属于你的智能生活管家

与此同时随时随地的刷脸,让我们避免了忘记带卡的尴尬。聪明的智能管家提供着乐此不疲的精致家居服务,只要....
的头像 倩倩 发表于 09-19 11:15 148次 阅读
人工智能完全可以打造属于你的智能生活管家

在古代并没有什么采集器、指纹数据库,人们是如何识别指纹的呢?

但是,现代指纹识别主要是依靠光学式、 硅芯片式、 超声波式等采集设备将指纹的细节特征点,包括纹线的起....
的头像 倩倩 发表于 09-18 16:08 173次 阅读
在古代并没有什么采集器、指纹数据库,人们是如何识别指纹的呢?

艾芯智能人脸识别门锁解决方案,助力智能门锁迈入“3D刷脸时代”

随着人工智能(AI)在家庭场景中应用与普及,智能锁逐渐成为智能家居不可或缺的“门面担当”,安全防盗、....
的头像 丫丫119 发表于 09-18 15:40 974次 阅读
艾芯智能人脸识别门锁解决方案,助力智能门锁迈入“3D刷脸时代”

宁夏计质院完成了宁夏博物馆安防设备系统工程现场检测

此次需检测的安防系统包括人脸识别、入侵报警和视频监控等多个子系统,覆盖博物馆内各个位置和出入口。系统....
的头像 倩倩 发表于 09-17 11:23 212次 阅读
宁夏计质院完成了宁夏博物馆安防设备系统工程现场检测

面对复杂的业务场景 安防企业“各显神通”

可以看出,机场安防涉及的系统面非常广,业务场景复杂。以大兴国际机场为例,整个机场建设了统一的大安防平....
的头像 倩倩 发表于 09-17 10:23 266次 阅读
面对复杂的业务场景 安防企业“各显神通”

Ubuntu下试玩visionseed工具的数据可视化

日前购得一套AI视觉模组visionseed,我准备先在Ubuntu下试玩visionseed工具来了解这套视觉模组。当然前期准备工作是要做的:...
发表于 09-16 11:29 354次 阅读
Ubuntu下试玩visionseed工具的数据可视化

周末你ZAO了吗?ZAO是做什么的?

因此,ZAO瞬间走红的原因不外乎两个:第一,使用门槛低;第二,可以满足大家的“明星梦”。 从一夜爆红....
的头像 新智元 发表于 09-13 16:39 453次 阅读
周末你ZAO了吗?ZAO是做什么的?

中国药科大学在教室试点安装人脸识别系统

据报道,中国药科大学在两间教室试点安装的人脸识别系统,除了能自动识别学生的出勤情况外,还能够实现对学....
的头像 新智元 发表于 09-13 16:18 1377次 阅读
中国药科大学在教室试点安装人脸识别系统

一张照片进行AI“换脸”之后,可以突破刷脸支付的安全系统吗?

对于引起广泛争议的用户个人隐私和支付安全等问题,“ZAO”运营团队称,“ZAO”所呈现的“换脸”效果....
的头像 倩倩 发表于 09-12 14:20 207次 阅读
一张照片进行AI“换脸”之后,可以突破刷脸支付的安全系统吗?

2019年生物识别技术行业投融资数量达5件,金额达12亿元

整体来看,近三年来,中国生物识别技术行业投融资热度逐渐上涨。据IT桔子数据统计,2012年,我国生物....
的头像 倩倩 发表于 09-12 14:14 480次 阅读
2019年生物识别技术行业投融资数量达5件,金额达12亿元

各行多家企业上马布局 智慧校园解决方案层出不穷

事实上,安装“人脸识别”系统并非上述几所学校首创。目前,国内多所学校都已进入“刷脸时代”,人脸识别功....
的头像 倩倩 发表于 09-12 10:50 392次 阅读
各行多家企业上马布局 智慧校园解决方案层出不穷

生物识别的发展带来了什么隐患

人脸识别技术已经不仅仅可以用来识别对象身份,已经可以收集更多的信息了。
发表于 09-12 10:11 259次 阅读
生物识别的发展带来了什么隐患

AI换脸的真正问题,在生物识别信息收集

而ZAO如此安排用户协议的原因亦有苦衷,一方面是ZAO希望以用户协议方式将肖像权授权收于囊中,以免用....
的头像 倩倩 发表于 09-11 16:10 294次 阅读
AI换脸的真正问题,在生物识别信息收集

生物识别技术的滥用正给我们的安全带来更大的隐患

即便不谈那么遥远的,只说现在,当我们在自动售货机刷脸购物时,如果犯罪分子像之前给ATM机偷偷改造一样....
的头像 倩倩 发表于 09-11 16:06 324次 阅读
生物识别技术的滥用正给我们的安全带来更大的隐患

对于人脸识别技术的影响问题,科技巨头纷纷呼吁政府制定法规

前几天,AI换脸软件“ZAO”在人们的社交圈大火了一把,用户只需通过真人验证注册,在APP内上传自己....
的头像 电子魔法师 发表于 09-11 15:40 477次 阅读
对于人脸识别技术的影响问题,科技巨头纷纷呼吁政府制定法规

亚马逊安防业务正抓住机会开疆辟土

比如通过 Amazon Rekognition,用户现在可以对数以万计的面孔进行实时面部搜索。和之前....
的头像 倩倩 发表于 09-11 14:49 403次 阅读
亚马逊安防业务正抓住机会开疆辟土

旷视科技与安防巨头抢市场,技术落地场景是瓶颈

城市物联网解决方案已成为旷视科技的主要营收业务,而在2016年该项业务的营收为0.19亿元,占总营收....
的头像 倩倩 发表于 09-11 14:38 490次 阅读
旷视科技与安防巨头抢市场,技术落地场景是瓶颈

什么是艾芯智能人脸识别门锁解决方案?

随着人工智能(AI)在家庭场景中应用与普及,智能锁逐渐成为智能家居不可或缺的“门面担当”,安全防盗、便利生活成为住户选购...
发表于 09-11 11:52 210次 阅读
什么是艾芯智能人脸识别门锁解决方案?

为什么人脸识别走进课堂困难重重

科技是把双刃剑,在支持者眼中,人脸识别技术极大便利了学校的管理;而在反对者眼中,这种“方便管理”让学....
发表于 09-10 10:58 377次 阅读
为什么人脸识别走进课堂困难重重

人工智能监督课堂,到底哪些该做哪些不该做?

比如,上海中医药大学附属闵行蔷薇小学也被爆出正在构建智能课堂行为分析系统,运用如姿态评估、表情识别、....
的头像 倩倩 发表于 09-09 15:23 364次 阅读
人工智能监督课堂,到底哪些该做哪些不该做?

手脉识别会是生物识别技术的未来吗

由于手脉识别的采样样本来自于人体内部,所以匹配过程中受到外界的干扰非常小。
发表于 09-09 15:05 501次 阅读
手脉识别会是生物识别技术的未来吗

人脸识别的风险谁来买单

随着科技的发展,人脸识别技术频繁应用于人们的日常生活中,买东西支付可以刷脸、出入安检可以刷脸、甚至回....
发表于 09-09 14:42 408次 阅读
人脸识别的风险谁来买单

第18届世界商业领袖圆桌会议举行

新加坡国立大学终身教授、IEEE Fellow、快商通首席科学家李海洲,阿里巴巴CEO助理、集团副总....
的头像 倩倩 发表于 09-09 11:20 689次 阅读
第18届世界商业领袖圆桌会议举行

人工智能以后的发展方向是往哪里

人工智能的发展速度可以说非常的快,从以前的指纹识别到现在的人脸识别技术
发表于 09-06 16:09 114次 阅读
人工智能以后的发展方向是往哪里

智能家居的几个新趋势解析

智慧别墅主要采用有线系统,其功能性的系统,包括音乐、可视对讲、安防交互等部分为无线,只不过它表现的形....
的头像 倩倩 发表于 09-06 14:36 440次 阅读
智能家居的几个新趋势解析

为何对人脸识别技术出现两种不同的反应

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、....
发表于 09-05 14:13 459次 阅读
为何对人脸识别技术出现两种不同的反应

ZAO只用了4天时间被追捧、封杀,反转来得未免太快了一点

从8月31日一夜刷屏爆红,到9月3日被主管部门约谈,ZAO只用了4天时间。
的头像 半导体商城 发表于 09-05 10:08 388次 阅读
ZAO只用了4天时间被追捧、封杀,反转来得未免太快了一点

人脸识别有哪些利与弊

进入全民刷脸时代,人脸识别技术已经成为当代最为流行的黑科技技术。
发表于 09-04 17:37 631次 阅读
人脸识别有哪些利与弊

Facebook将向用户提示有关人脸识别功能的信息

9月3日,美国社交巨头Facebook在其网站发布了对人脸识别功能更新的公告,人脸识别功能不再默认开....
的头像 PCB资讯 发表于 09-04 16:55 461次 阅读
Facebook将向用户提示有关人脸识别功能的信息

Facebook表示将不会默认开启人脸识别功能,被罚怕了?

据外媒报道,Facebook在本周二表示,该公司的人脸识别功能现将面向所有用户开放,不过用户可以选择....
的头像 工业IoT 发表于 09-04 15:27 396次 阅读
Facebook表示将不会默认开启人脸识别功能,被罚怕了?

2017年至2022年,人工智能行业复合增长率将达到54.5%

虽然经营亏损,但海鑫科金在报告期内,仍然紧跟技术发展趋势和用户需求进行持续创新,人工智能算法性能进一....
的头像 倩倩 发表于 09-03 10:23 399次 阅读
2017年至2022年,人工智能行业复合增长率将达到54.5%

宿舍门前装上人脸识别系统,扔垃圾需提前分类!

 与其他学校报到流程相同,新生和家长进校后需要先到宿舍整理内务,再去教室开班会。记者在宿舍区看到,每....
的头像 倩倩 发表于 09-02 15:48 270次 阅读
宿舍门前装上人脸识别系统,扔垃圾需提前分类!

法律职业资格考试,聊城考区引入人脸识别技术防作弊

2019年,是国家统一法律职业资格考试全面推行计算机化考试的第一年。为确保考试质量水平,聊城市市委政....
的头像 倩倩 发表于 09-02 15:45 286次 阅读
法律职业资格考试,聊城考区引入人脸识别技术防作弊

商品识别在零售行业的应用,商品识别的难点

类似于淘宝购物,如果商超能够实现对顾客从进店那一刻起的所有行为进行识别和分析,那么会大大提升店内的商....
的头像 倩倩 发表于 09-02 15:42 295次 阅读
商品识别在零售行业的应用,商品识别的难点

AI科技嘉年华在上海世博展览馆中厅舞台区精彩上演

来自意大利的特奥钢琴机器人在音乐方面“造诣”颇深,身穿黑色燕尾服、打着黑色领结的它,带来一首钢琴弹唱....
的头像 倩倩 发表于 09-02 14:14 292次 阅读
AI科技嘉年华在上海世博展览馆中厅舞台区精彩上演

ZAO或将步前辈短命后尘,“AI换脸”已形成黑色产业链

8月30日晚,一款主打视频换脸功能的、名为“ZAO”的APP“点燃”社交网络。其操作十分简单,用户只....
的头像 电路设计技能 发表于 09-02 10:18 737次 阅读
ZAO或将步前辈短命后尘,“AI换脸”已形成黑色产业链

人工智能国家队中科视拓宣布,开源商用级SeetaFace2人脸识别算法

SeetaFace2采用标准C++开发,全部模块均不依赖任何第三方库,支持x86架构(Windows....
的头像 新智元 发表于 09-01 09:27 454次 阅读
人工智能国家队中科视拓宣布,开源商用级SeetaFace2人脸识别算法

内外结合预防保障生物识别信息安全

生物识别的信息安全问题是一个长期工程,非一朝一夕就能轻松解决。眼下,以支付宝为代表的企业已经开始在探....
发表于 08-31 09:48 146次 阅读
内外结合预防保障生物识别信息安全

“双马”对话成焦点,人与机器谁更聪明?

马云表示,计算机可能更聪明,但人类有更多的智慧。机器只有“芯片”,但人有“心”,通过改革教育体系能让....
的头像 倩倩 发表于 08-30 15:02 439次 阅读
“双马”对话成焦点,人与机器谁更聪明?

想要保护人脸信息 反人脸识别技术来助力

从移动支付到手机解锁,从交通出行到旅游检票,从门禁打卡到关卡安防,从银行办理到政务协助。。。。。。如....
发表于 08-30 11:16 704次 阅读
想要保护人脸信息 反人脸识别技术来助力

人脸识别技术发展迅速 但也带来了很大的风险

伴随着电子信息、电子技术及互联网发展,大数据以及云计算的应用,人脸识别技术得已快速发展应用。人脸识别....
发表于 08-29 14:56 686次 阅读
人脸识别技术发展迅速 但也带来了很大的风险

人脸识别系统定位功能剖析

经常被网友问到“人脸识别系统是如何找到人的?”,本文将通过实际案例具体分析人脸识别系统的组成、人脸识....
发表于 08-29 14:46 669次 阅读
人脸识别系统定位功能剖析

美国智慧城市发展为什么受到了严重的阻碍

而作为身份认证的重要手段之一,人脸识别已经成为智慧城市建设中的重要组成部分。
发表于 08-29 14:39 342次 阅读
美国智慧城市发展为什么受到了严重的阻碍

人脸识别在人类日常生活中普及 导致数据库逐渐扩大

大多数人脸识别产品研究方向目前走向“两极”。一极是大型系统:在应用中,数据库越大越好,速度越快越好,....
发表于 08-29 14:38 631次 阅读
人脸识别在人类日常生活中普及 导致数据库逐渐扩大

人脸识别针对智慧金融更多的是辅助功能 未来发展情况尚未可知

人脸识别技术可以归属于人工智能技术,目前已经有相关的产品推出,比如人脸识别智能锁,不过产品并不是很成....
发表于 08-29 14:28 620次 阅读
人脸识别针对智慧金融更多的是辅助功能 未来发展情况尚未可知

中国人工智能城市排行榜,AI城市排名北京超杭州成第一

8月28日,在2019人工智能计算大会上,IDC和浪潮联合研究发布了《2019—2020中国人工智能....
的头像 人工智能学研社 发表于 08-29 10:16 5513次 阅读
中国人工智能城市排行榜,AI城市排名北京超杭州成第一

保时捷与FogHorn合作研发人脸探测和边缘红外视频处理技术

保时捷与智能边缘计算软件开发商FogHorn合作,研发出一个多因素身份验证(MFA)原型,以利用实时....
的头像 高工机器人 发表于 08-28 17:44 389次 阅读
保时捷与FogHorn合作研发人脸探测和边缘红外视频处理技术

“刷脸”逐渐成为常态 人脸识别技术应用广泛

你知道吗?人脸识别技术又又又火啦!8月20日,据某媒体曝出新闻,某男子在杀掉女友后用其尸体网上借贷,....
发表于 08-28 15:15 651次 阅读
“刷脸”逐渐成为常态 人脸识别技术应用广泛

人脸识别与生活逐渐融为一体 但技术和运营对接不畅

我们的生活开始到处都是人脸识别的影子。你看的视频可能是通过人脸识别辅助换脸的,拍的照片可能是人脸识别....
发表于 08-28 15:00 674次 阅读
人脸识别与生活逐渐融为一体 但技术和运营对接不畅

2019年《亚洲品牌500强》排行榜揭晓,封面新闻再次上榜

8月27日,由世界品牌实验室发布的2019年《亚洲品牌500强》排行榜揭晓。华西都市报-封面新闻再次....
的头像 玩物志 发表于 08-27 15:35 1466次 阅读
2019年《亚洲品牌500强》排行榜揭晓,封面新闻再次上榜

人工智能时代有数据才是真正的王者

精准的定位和即花即贷的便捷,使马上金融仅4年就跻身全国最大的内资消费金融公司,注册用户总数超过700....
的头像 倩倩 发表于 08-27 14:23 328次 阅读
人工智能时代有数据才是真正的王者

【Toybrick RK3399Pro AI开发板试用体验】opencv 人脸识别

opencv 可以实现的功能有很多,这次就试试人脸识别 省心的opencv在example中已经提供了 分类器的级联分类器的文件,省去重复造轮...
发表于 08-25 23:22 130次 阅读
【Toybrick RK3399Pro AI开发板试用体验】opencv 人脸识别

用腾讯优图AI视觉模组做一个驾驶疲劳监测仪

道路千万条,安全第一条,相信每个人都是牢记于心的,“喝酒不开车,开车不喝酒”其实不难,难的是防范始料未及的事件,疲倦就是...
发表于 08-16 12:08 324次 阅读
用腾讯优图AI视觉模组做一个驾驶疲劳监测仪

人脸识别的三大模式

人脸识别技术已成人工智能最火热的应用之一,如刷脸登机、刷脸取厕纸、刷脸支付、刷脸考勤、刷脸识别闯红灯的行人、刷脸人脸识别...
发表于 08-06 14:15 431次 阅读
人脸识别的三大模式

人脸识别会改变什么

导语:人脸识别已经在我们生活中随处可见,但人脸识别将会给我们生活带来便利的同时,也会重新改写我们社交的本质,以及引发隐私...
发表于 07-16 06:26 186次 阅读
人脸识别会改变什么

人脸识别技术在安防领域有哪些应用?

随着人脸识别技术的不断发展与成熟,以及图像采集设备成本日渐降低,数码相机、摄像机、拍照手机的不断普及极大地拓展了人脸识别...
发表于 06-28 11:42 173次 阅读
人脸识别技术在安防领域有哪些应用?

人脸识别跟踪代码核心思想怎么理解

[tr]您好,管理员。       我这在学习 人脸识别跟踪  的代码,里面很多的初始化的代码 (我也是...
发表于 06-28 10:46 549次 阅读
人脸识别跟踪代码核心思想怎么理解

LabVIEW人脸识别“3天挑战赛”,邀你来战!

LabVIEW人脸识别挑战赛一直非常的火热,挑战成功即可退款!给大家看看前期的“3天挑战赛”活动的学习气氛。 任何挑战赛活...
发表于 05-13 15:06 982次 阅读
LabVIEW人脸识别“3天挑战赛”,邀你来战!

奥尼A25高清人像采集摄像头HD1080P自动对焦

奥尼 A25高清人像采集摄像头:HD1080P高清AF自动对焦摄像头,提升工作效率;带LED补光夜视灯,夜晚视频更安心,画质清晰...
发表于 05-08 18:34 234次 阅读
奥尼A25高清人像采集摄像头HD1080P自动对焦