0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

神经网络技术解析:手写数字识别项目解读

电子设计 来源:机器之心 作者:泽南 张倩 2021-01-13 15:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

手写数字识别是很多人入门神经网络时用来练手的一个项目,但就是这么简单的一个项目,最近在 reddit 上又火了一把,因为在 MIT 计算机科学和人工智能实验室,有人挖到了一个「祖师爷」级别的视频……

这段视频录制于 1993 年,主人公是图灵奖得主 Yann LeCun(杨立昆)。彼时 LeCun 才 32 岁,刚刚进入贝尔实验室工作,而视频里机器学习识别的第一段数字 201-949-4038,是 LeCun 在贝尔实验室里的电话号码。 从这段视频中我们可以看到,LeCun 在 90 年代初创造的文本识别系统已经达到了惊人的速度和准确率,这在当时的条件下是非常难能可贵的。

这段视频由贝尔实验室自适应系统研究部门主任 Larry Jackel 拍摄(Larry 当时是 LeCun 的 boss,现任英伟达自动驾驶顾问)。视频中出镜的还有实验室负责人 Rich Howard(Larry 的 boss)和研究工程师 Donnie Henderson。Yann LeCun 本人表示:「Donnie Henderson 将整个演示系统整合在了一起…… 整套系统在算力为 20MFLOPS 的 DSP 版上运行。」

几位工程师在视频中洋溢的笑容也颇具感染力。

LeCun 表示,1993 年的文字识别系统已经用上了卷积神经网络(CNN),自己在这套系统中编写了一种网络数据结构的编译器,并生成了可编译的 C 语言代码,在源代码中以权重和网表(netlist)代表文字。 这段视频的惊艳之处还在于,它比经典手写数字数据集 MNIST 的问世还要早 6 年。

pIYBAF_-pMeAMHCAAABq5qkjYcU826.png

其实,早在 1989 年,LeCun 就已经发表了「将反向传播用于手写邮政编码识别」的相关研究,而且已经在美国的邮政系统中成功应用。随后,这一系统的应用范围扩展至银行支票。90 年代末期,该系统已经处理了美国 10%-20%的支票识别。

o4YBAF_-pNWAK3ObAALBa2Q5DDU736.png

1999 年,LeCun 等人联合发表了「MNIST」手写数字数据集。这一数据集包含数万个样本,被称为「计算机视觉领域的 hello world 数据集」、「机器学习界的果蝇」,如今已经作为基准被使用了二十余年。

pIYBAF_-pOWAejsuAAIT49kFyNQ943.png

在看了这段视频之后,有研究者感叹,「不要再抱怨 GPU 算力不够了」。

o4YBAF_-pPGAYaTEAAByJSj2qWU470.png

深度学习先驱 Yann LeCun 说起 Yann LeCun,熟悉人工智能领域的人肯定不会陌生,Yann LeCun 现在是纽约大学教授、美国工程院院士、Facebook 副总裁和首席 AI 科学家。 在深度学习还未流行的 20 世纪八九十年代,LeCun 与另两位先驱者 Yoshua Bengio、Geoffrey Hinton 一道探索了深度学习领域的概念基础,并通过实验向人们展示了新方法的前景。此外,他们还贡献了一系列工程进展,展示了深度神经网络的实用优势。 虽然在二十世纪八十年代,研究者就开始试用人工神经网络帮助计算机识别模式、模拟人类智能,但直到二十一世纪的前几年,这种方式仍未获得广泛认同,LeCun 等研究者试图重燃 AI 社区对神经网络兴趣的努力曾经一直被人们质疑,但如今他们的想法带来了重大的技术进步,他们的方法也已成为该领域的主导范式。 自 2012 年以来,深度学习方法促进计算机视觉、语音识别、自然语言处理和机器人技术等应用领域取得极大突破。 在 2019 年,美国计算机协会 ACM 公布了上一年度的图灵奖,Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun 三位深度学习巨头同时获奖。

从左至右:Yoshua Bengio、Geoffrey Hinton、Yann LeCun。 ACM 表示,Yann LeCun 主要作出了三大贡献:

  • 提出卷积神经网络
  • 改进反向传播算法
  • 拓宽神经网络的视角

20 世纪 80 年代后期,LeCun 就职于多伦多大学和贝尔实验室,也是在这一时期,他利用手写数字图像训练了第一个卷积神经网络系统。如今,卷积神经网络已成为计算机视觉、语音识别、语音合成、图像合成和自然语言处理领域的行业标准。卷积神经网络有着广泛的应用,如自动驾驶、医学图像分析、语音助手和信息过滤等。 这可不是搞定 MNIST 那么简单 与我们通常为 MINIST 数据集构建文字识别系统不同,Yann LeCun 在 1993 年展示的技术可是用摄像头直接拍摄的,还需要搞定文字缩放、位置等问题,后来也确实在邮政系统里获得了应用。 如此看来在当年就能实现这样的效果确实不容易,更何况在 20 世纪 90 年代,研究者们是没有 TensorFlow 可用的,全靠 C 语言手写,这个问题求解的非机器学习部分与其说是困难,不如说是繁琐。 在社交网络中,人们对 LeCun 展示的算法除了感兴趣,还有赞誉和膜拜,有人说道:「这并不是说他们在 1993 年就解决了 MNIST 上的问题,比那还要更进一步。」 在深度学习被 GPU 带动开展大规模应用以前,人工智能算法其实已经实现了相当的聪明程度。在 1993 年的文字识别之后,昨天,人们又挖出了 LeCun 参与的另一项研究:人脸检测。

在 2003 年,一个视频展示了 Rita Osadchy、Matt Miller 以及 Yann LeCun 等人在 NEC 实验室的研究,使用卷积神经网络进行人脸检测研究。 虽然只是人脸检测而不是人脸识别,但这种技术的意义不言而喻,如今自动驾驶汽车上的障碍物检测方法使用的就是和它相同的技术。在推特上,LeCun 也点赞了这段视频。

看来,如今我们在机器学习领域广泛使用的方法,早在几十年前就已完成了整体架构。 不过与此同时,也有网友发出了直击灵魂的提问:「既然 LeCun 在 1993 年就可以让 AI 这样识别文字了,为啥直到今天大多数网站仍然认为文字验证码是识别机器人的好办法?」
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92682
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261534
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907
  • 卷积网络
    +关注

    关注

    0

    文章

    43

    浏览量

    3161
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 705次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂度和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 886次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速<b class='flag-5'>技术</b>

    基于神经网络数字预失真模型解决方案

    在基于神经网络数字预失真(DPD)模型中,使用不同的激活函数对整个系统性能和能效有何影响?
    的头像 发表于 08-29 14:01 3070次阅读

    基于LockAI视觉识别模块:手写数字识别

    : 卷积神经网络(CNN):最流行的方法之一,能够自动从图像中学习特征。适用于复杂背景和不同书写风格的手写数字识别。 支持向量机(SVM):一种传统的机器学习方法,通过提取图像的特征(
    发表于 06-30 16:45

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写
    的头像 发表于 06-30 15:44 859次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:<b class='flag-5'>手写</b><b class='flag-5'>数字</b><b class='flag-5'>识别</b>

    基于FPGA搭建神经网络的步骤解析

    本文的目的是在一个神经网络已经通过python或者MATLAB训练好的神经网络模型,将训练好的模型的权重和偏置文件以TXT文件格式导出,然后通过python程序将txt文件转化为coe文件,(coe
    的头像 发表于 06-03 15:51 897次阅读
    基于FPGA搭建<b class='flag-5'>神经网络</b>的步骤<b class='flag-5'>解析</b>

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一种多层的前馈神经网络
    的头像 发表于 02-12 15:53 1307次阅读

    BP神经网络的优缺点分析

    BP神经网络(Back Propagation Neural Network)作为一种常用的机器学习模型,具有显著的优点,同时也存在一些不容忽视的缺点。以下是对BP神经网络优缺点的分析: 优点
    的头像 发表于 02-12 15:36 1586次阅读

    什么是BP神经网络的反向传播算法

    BP神经网络的反向传播算法(Backpropagation Algorithm)是一种用于训练神经网络的有效方法。以下是关于BP神经网络的反向传播算法的介绍: 一、基本概念 反向传播算法是BP
    的头像 发表于 02-12 15:18 1275次阅读

    BP神经网络与深度学习的关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Backpropagation Neural N
    的头像 发表于 02-12 15:15 1340次阅读

    BP神经网络在图像识别中的应用

    BP神经网络在图像识别中发挥着重要作用,其多层结构使得网络能够学习到复杂的特征表达,适用于处理非线性问题。以下是对BP神经网络在图像识别中应
    的头像 发表于 02-12 15:12 1188次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工神经网络   人工神经网络模型之所
    的头像 发表于 01-09 10:24 2249次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法