0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简单好上手的图像分类教程!

DPVg_AI_era 来源:未知 作者:李倩 2018-05-31 16:36 次阅读

今天,Google AI再次放出大招,推出一个专注于机器学习实践的“交互式课程”,第一门是图像分类机器学习实践,已有超过10000名谷歌员工使用这个教程构建了自己的图像分类器。内容简明易上手,不妨来试。

几个月前,Google AI教育项目放出大福利,将内部机器学习速成课程(MLCC)免费开放给所有人,以帮助更多开发人员学习和使用机器学习。

今天,Google AI再次放出大招,推出一个专注于机器学习实践的“交互式课程”。公开的第一门课程是谷歌AI团队与图像模型方面的专家合作开发的图像分类机器学习实践。

这个动手实践课程包含视频、文档和交互式编程练习,分步讲解谷歌最先进的图像分类模型是如何开发出来的。这一图像分类模型已经在Google相册的搜索功能中应用。迄今为止,已经有超过10000名谷歌员工使用这个实践指南来训练自己的图像分类器,识别照片上的猫和狗。

在这个交互式课程中,首先,你将了解图像分类是如何工作的,学习卷积神经网络的构建模块。然后,你将从头开始构建一个CNN,了解如何防止过拟合,并利用预训练的模型进行特征提取和微调。

机器学习实践:图像分类

学习本课程,你将了解谷歌state-of-the-art的图像分类模型是如何开发出来的,该模型被用于在Google Photos中进行搜索。这是一个关于卷积神经网络(CNN)的速成课程,在学习过程中,你将自己构建一个图像分类器来区分猫的照片和狗的照片。

预计完成时间:90~120 分钟

先修要求

已学完谷歌机器学习速成课程,或有机器学习基本原理相关的经验。

精通编程基础知识,并有一些Python编程的经验

在2013年5月,谷歌发布了对个人照片进行搜索的功能,用户能够根据照片中的对象在自己的相册中检索相应的照片。

在相册中搜索包含暹逻猫的照片

这一功能后来在2015年被Google Photos中,被广泛认为具有颠覆性的影响。这证明了计算机视觉软件可以按照人类的标准对图像进行分类,其价值包括:

用户不再需要用“beach”之类的标签手工地对照片内容进行分类,当需要管理几千张图片时,这一任务会变得非常繁琐。

用户可以用新的方式来探索他们的相册,使用搜索词来定位他们可能从未标记过的对象的照片。例如,他们可以搜索“棕榈树”,将所有背景中有棕榈树的度假照片放在一起。

软件可能会“看到”用户自己可能无法察觉的分类差别(例如,区分暹罗猫和阿比西尼亚猫),有效地增加了用户的专业知识。

图像分类是如何工作的

图像分类是一个有监督的学习问题:定义一组目标类(即图像中需要识别的对象),并使用已标记的示例照片来训练一个模型来识别目标。早期的计算机视觉模型依赖于原始的像素数据作为模型的输入。

然而,如下图所示,仅原始的像素数据并不能提供足够稳定的表示,以包含图像中捕获的无数个对象的细微变化。对象的位置、对象背后的背景、周围的光线、相机的角度和相机的焦点在原始像素数据中都可能产生波动;这些差异是非常重要的,它们不能通过对像素RGB值的加权平均来校正。

左:不同姿势、不同背景和光照条件的照片中,猫都可以被识别出来;右:用平均像素数据来解释这种变化无法产生任何有意义的信息

为了更灵活地对对象进行建模,经典的计算机视觉模型添加了来自像素数据的新特性,比如颜色直方图、纹理和形状。但这种方法的缺点是使特性工程变成了一种负担,因为需要调整的输入太多了。比如对于一个猫的分类器,哪种颜色最重要?形状的定义灵活度应该多大?由于特征需要非常精确地调整,构建一个稳定的模型非常具有挑战性,而且模型精度也会受到影响。

卷积神经网络

构建图像分类模型的一个突破是发现卷积神经网络(CNN)可以用来逐步地提取图像内容的更高层的表示。CNN不是预先处理数据以获得纹理、形状等特征,而是将图像的原始像素数据作为输入,并“学习”如何提取这些特征,最终推断它们构成的对象。

o4YBAFsPtHmAaTplAAGo0ECzBWc757.gif

首先,CNN接受到一个输入特征图:一个三维矩阵,其中前两个维度的大小对应于像素图像的长度和宽度。第三个维度的大小为3(对应于彩色图像的3个通道:红、绿和蓝)。CNN包含许多个模块,每个模块执行三个操作。

CNN部分接下来分别讲解卷积、ReLU、Pooling和全连接层。接下来两节是“防止过拟合”和“利用预训练的模型”,并提供三个练习:

练习1:为猫-狗分类(Cat-vs-Dog Classification)建立一个卷积神经网络

在这个练习中,你将得到动手建一个卷积神经网络的实战经验,从头开始建立一个图像分类器来区分猫的照片和狗的照片。

练习2:防止过拟合

在这个练习中,你将进一步改进练习1中构建的猫狗分类CNN模型,运用数据增强和dropout 正则化。

练习3:特征提取和微调

在这个练习中,你将对谷歌的初始 Inception v3 模型进行特征提取和fine-tuning,以使你的猫狗分类模型达到更高精度

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5847

    浏览量

    103245
  • 神经网络
    +关注

    关注

    42

    文章

    4570

    浏览量

    98707
  • 机器学习
    +关注

    关注

    66

    文章

    8108

    浏览量

    130542

原文标题:10000+谷歌员工学过的谷歌内部图像分类课程公开了!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于多通道分类合成的SAR图像分类研究

    【作者】:李长春;冒亚明;孙灏;慎利;【来源】:《计算机与现代化》2010年03期【摘要】:SAR具有全天时、全天候工作能力,且能够提供高分辨率图像数据。SAR图像分类是SAR图像处理
    发表于 04-23 11:52

    区分图像分类方法是什么

    区分图像分类方法
    发表于 05-07 09:37

    图像分类Caltech 256数据集

    教程图像分类 Caltech 256​数据集
    发表于 05-12 09:04

    Edge Impulse的分类模型浅析

    就Edge Impulse的三大模型之一的分类模型进行浅析。针对于图像分类识别模型,读者可参考OpenMv或树莓派等主流图像识别单片机系统的现有历程,容易
    发表于 12-20 06:51

    分享一下单片机和PLC哪个更好上手

    关注我,每天学习坚持学习一点点,你很快就会有进步哦!今天我们来分享一下单片机和PLC哪个更好上手,小小电工与你一起进步我是雄飞电气小栋,今天很高兴认识大家!!!!其实在自动化领域,很多人都会玩单片机
    发表于 02-16 06:54

    一种新的图像定位和分类系统实现方案

    首先简单介绍了图像定位和分类系统的基本概念。然后分析了几种图像定位和分类系统的实现方式与性能。在此基础上,提出了一种新型
    发表于 07-30 16:29 25次下载

    对一类JPEG图像隐秘算法的多类分类方案

    简单介绍了几种压缩分类方法,其次进行了多类分类的算法设计,最后对实验结果进行了分析。该方案在重加密特征的基础上,利用Fridrich J等提出的压缩分类方法,实现了对该类隐秘
    发表于 10-19 14:37 12次下载
    对一类JPEG<b class='flag-5'>图像</b>隐秘算法的多类<b class='flag-5'>分类</b>方案

    图像分类的方法之深度学习与传统机器学习

    图像分类,顾名思义,是一个输入图像,输出对该图像内容分类的描述的问题。它是计算机视觉的核心,实际应用广泛。
    发表于 09-28 19:43 0次下载

    Google图像分类速成ML实战课程

    近日,Google推出了一门机器学习课程——Machine Learning Practica,主要是针对那些已经有机器学习基础,希望上手实践的学生。此次的课程是图像分类,其他的实战课程在后期会陆续上线。
    的头像 发表于 06-01 10:01 3380次阅读

    相机图像质量的分类及应用

    能调的,哪些又不能调的,所以本文主要是从概念上简单介绍下图像质量,包括成像产品的分类、不同成像产品图像质量的要求、以及成像系统的介绍,希望对刚入行的小伙伴能有所帮助,可以加深一下对
    的头像 发表于 07-06 09:26 1769次阅读

    图像分类任务的各种tricks

    计算机视觉主要问题有图像分类、目标检测和图像分割等。针对图像分类任务,提升准确率的方法路线有两条,一个是模型的修改,另一个是各种数据处理和训
    的头像 发表于 09-14 16:42 923次阅读

    如何区分图像分类和目标检测技术

    目标检测的问题定义是确定目标在给定图像中的位置,如目标定位,以及每个目标属于哪个类别,即目标分类简单地说,目标检测是一种图像分类技术,除了
    发表于 07-11 12:50 345次阅读

    TinyML变得简单图像分类

    电子发烧友网站提供《TinyML变得简单图像分类.zip》资料免费下载
    发表于 07-13 10:04 0次下载
    TinyML变得<b class='flag-5'>简单</b>:<b class='flag-5'>图像</b><b class='flag-5'>分类</b>

    为什么含银的锡比不含锡的好上锡?

    与不含银的锡合金相比,含银的锡合金在上锡过程中通常表现更好,主要是因为银的添加可以提高锡合金的某些性能。那么含银的锡为什么比不含银的好上锡?下面锡线厂家来讲解一下:以下是一些含银的锡比不含银的好上
    的头像 发表于 12-05 16:49 403次阅读
    为什么含银的锡比不含锡的<b class='flag-5'>好上</b>锡?

    CNN图像分类策略

    在深度学习出现之前,自然图像中的对象识别过程相当粗暴简单:定义一组关键视觉特征(“单词”),识别每个视觉特征在图像中的存在频率(“包”),然后根据这些数字对图像进行
    发表于 12-25 11:36 124次阅读
    CNN<b class='flag-5'>图像</b><b class='flag-5'>分类</b>策略