0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么他却说“深度学习框架之争,现在谈结果为时尚早”?

电子工程师 来源:lq 2019-05-25 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

半个多世纪前,浙江大学老校长竺可桢曾有两个非常经典的教育问题:“诸位在校,有两个问题应该自己问问,第一,到浙大来做什么?第二,将来毕业后做什么样的人?”

半个多世纪后,以这位老校长名字命名的 “竺可桢学院” 求是科学班开启了一位少年的求是之路。他就是本期采访的主人公——彭靖田。

作为 5 月 25 日 - 5 月 27 日即将在杭州举办的 CTA 大会(官网:https://dwz.cn/iSZ7BQUR)机器学习论坛演讲嘉宾,彭靖田以谷歌技术专家的身份接受了 AI 科技大本营的采访。

彭靖田,Google Developers Expert

谷歌技术专家(Google Developers Expert,GDEs)是这么定义的:来自全球各地经验丰富的产品策略师、设计师、开发人员和营销专家,积极支持开发人员、初创企业和公司以通过 web 应用程序和移动应用程序来改变这个社区;面向 Android、Angular、Dart、Flutter、谷歌云平台、IOT、机器学习、web 开发等多个技术方向。

这么说起来,彭靖田与谷歌、与机器学习的渊源由来已久。

编程始于兴趣,终于成长

从中学时代的信息学奥林匹克竞赛(OI)起,彭靖田就开始接触编程和算法了。与绝大多数同龄人相比,这已经非常早了,他却自嘲:“我们班很多人小学 3 年级就开始编程,如今也在很多世界名校继续攻读 PhD”。相比起来,彭靖田在求是班反倒是接触最晚的了。

彭靖田借用了一句老话,“兴趣是最好的老师”。“可能我还是觉得 CS 这个学科本身比较有意思吧。高中阶段带给我启蒙的主要是靠《算法导论》、 USACO 题库、《浪潮之巅》,它们分别让我窥见了算法、编程和行业历史。”

光荣与梦想,伟大不是终点

大学毕业后,彭靖田顺利拿到 Special Offer 进入华为中央软件研究院。期间,他主要参与了深度学习云服务的设计和实现,当时的主要需求是支撑分布式机器学习训练和在线推理服务。

他想,如果抽象 TensorFlow 为一种容器作业,并基于 Kubernetes 在容器调度方面的优势,或许是一种实现路径吧?说干就干,很快,彭靖田与同事一起开发了 DLKS (Deep Learning Kubernetes Scheduler)项目。

一年后,彭靖田加入当时在容器技术领域颇有深耕的才云科技,主要负责 AI 云业务线。但如何将容器集群管理技术 Kubernetes 与深度学习框架 TensorFlow 结合也同样存在不小的挑战。2018 年初,彭靖田与 Google Cloud 一拍即合,决定参与到开源项目 Kubeflow 的推进中来。

要知道,尽管在当时 TensorFlow 已是主流深度学习框架之一,被广泛应用于国内外科技企业,但它也存在某些缺陷。作为 Google 在 2017 年推出的开源项目 Kubeflow,旨在支持多种机器学习框架如 TensorFlow、PyTorch、Caffe 运行在 Kubernetes 之上。

“这个项目的使命更加远大,一开始我们就希望它能够充分利用 Kubernetes 的优势,不仅支持 TensorFlow,还可以支持所有基于数据流图(Dataflow)的机器学习框架。”

将机器学习革命推进到底

2017 年下半年,一次偶然的机会,彭靖田开始了解到 Machine Learning GDE 这个项目。“那会儿国内应该还没有 ML GDE,才开始推广。”

彼时,他正与林健、白小龙合作撰写《深入理解 TensorFlow:架构设计与实现原理》这本书。抱着希望能够跟 Google TensorFlow 和 Google Brain 团队有更多交流和联系的想法,彭靖田申请了这个项目。

谈起这段经历,他仍记忆犹新,“第一轮面试是法国的一位 ML GDE,第二轮是 Google Cloud 东京团队的 Kaz Sato,过程很顺利。”

“不要总看模型准确率有多高,分布式规模有多大,而是要先了解业务本身,再根据已有资源设计相应的解决方案。”如今,不少企业正尝试搭建自己的机器学习云平台,在此过程中,却又因缺乏人才而不免踩坑。

实际上,Google 一直在追求人工智能教育的普及,包括开放了 TensorFlow 这样的高级项目。而如何帮助企业基于 Google 生态真正实现智能转型升级,是彭靖田这样的机器学习专家们正积极推动的事情。

以下为此次访谈实录:

AI 科技大本营:从华为深度学习团队核心成员,到才云 Cloud AI 负责人,按照您核心技术路线的变迁角度来讲,离不开基于 Kubernetes 作为机器学习部署平台的思路。能否讲讲您是如何认识到 Kubernetes 与 AI 结合的优势的?过去几年,您认为该项技术在落地应用方面又发生了怎样的显著改变?

彭靖田:准确来说,Kubernetes 之于 AI 不仅是部署,还是基础设施(Infrastructure)。KDD 2017 年 收录的《TFX: A TensorFlow­ Based Production ­Scale Machine Learning Platform》这篇论文给了我们一个很好的洞见。对于 Google 这样拥有海量数据的公司来说,从 Mining 到 Learning,最后商业落地是一个顺其自然的过程。不过,要想充分利用数据和模型,我们需要一个能够支撑它的端到端机器学习平台。

例如,Google 内部多年以来使用 Borg(大型集群管理系统),基于 TensorFlow 打造这个平台很稳健,也很高效,但对于 Google 的外部用户来说,我们认为 Borg 可行的替代方案是 Kubernetes。事实证明,这条路还是可以走通的,虽然前路还有一些乌云。

跳出 AI 云或者机器学习平台这个场景,云计算的技术变革趋势已经非常明朗,而 Kubernetes 的技术先进性和生态使得我们现在可以更聚焦于应用本身,而不再是基础设施、软件构建和发布、网络负载均衡等问题。现在已经有很多企业在生产环境使用 Kubernetes,国内规模最大的应该是京东。

AI 科技大本营:目前,越来越多的企业开始在分布式机器学习云平台上进行相关部署,您认为企业在做这一类的落地时需要注意哪些问题?如企业如何选择适合业务的平台和模型。

彭靖田:据我理解,应该是越来越多企业在尝试搭建自己的分布式机器学习云平台,而不是部署。

谈到落地,我觉得绝大部分的矛盾和分歧是 “需求没有理清楚”。现在这个行业最缺的就是既懂 AI 技术,又清楚业务场景的人才。企业应该多跟客户聊一聊需求,而不是一味讲“模型准确率有多高,分布式规模有多大”。客户更多关心的是技术是否解决问题。因此,正如你说的,先了解业务本身,再根据已有资源设计解决方案(包括算法、端到端模型、平台等)。

AI 科技大本营:据您的观察,目前什么类型的企业最先搭建了自己的机器学习平台?在这个过程中,会遇到哪些挑战?利用分布式机器学习平台会成为未来企业进行技术部署的主流趋势吗?

彭靖田:拥有数据的大企业,更确切的讲,是希望挖掘数据背后价值,洞察客户真实需求的大企业,如 Google、Uber、华为、京东等最先搭建了自己的机器学习平台。

挑战是多方面的,搭建一个类似于 TFX 这样的平台,需要企业具备从硬到软的技术实力。比如 Google 和华为都在研发自己的 AI 芯片、编译器、框架和平台,这其中的难度和挑战不言而喻。

在我看来,IT 到 DT 一定是未来趋势。互联网浪潮下,我们能看到整个原子世界都在不断被数字化。机器学习就是数据驱动的学科。未来所有的人和所有的行为都会被记录下来,这背后的商业价值是巨大的。相信看过美国科幻电视剧《西部世界》的朋友会有这个洞察。

AI 科技大本营:您针对 TensorFlow 撰写了相关著作,并开发了一个专门的视频课程,您认为相比于现有的其他框架 (如 PyTorch 等),TensorFlow 的优势在体现在哪里?深度学习框架之争,最后会是什么结果?

彭靖田:TensorFlow 的优势主要体现在高性能、灵活、对大规模分布式训练的支持等。目前,TensorFlow 对于 Senior 用户来说,足够定制化,满足了很多商业落地场景;但它也存在劣势,学习曲线对 Junior 用户不太友好,这也是 TensorFlow 2.0 要解决的重要问题。

现在谈结果还为时尚早。AI 落地是未来三年里所有从业人努力的方向,而这也是真实需求定义框架的未来。互联网(web 开发)和移动互联网(Android)的爆发,我们看到 Java 找到了自己的路。

现在的争斗都是暂时的,是学术圈和小部分产业界的存量博弈。在 AI 大规模落地前,我们不知道框架会走向何处。

AI 科技大本营:对于希望入门机器学习并使用 TensorFlow 的学习者,您有哪些入门和进阶的建议?

彭靖田:可以看看我在知乎 “ 如何高效地学习 TensorFlow 代码?” 问题的回答。(链接:

https://www.zhihu.com/question/41667903/answer/123150582)

简单来讲,还是搞清楚自身需求。你未来想成为做算法模型的、做平台的、做落地应用的,还是什么?当这个问题明确,你就知道应该深入了解 TensorFlow 的哪一层了。

AI 科技大本营:不久前竺可桢学院图灵班也开始公布招收首批人工智能本科班,如何评价浙江大学在人工智能教育以及科研方面的优势地位?

彭靖田:据我了解竺院上一届混合班 2/3 的学生选择了 CS,浙大 CS 这一届申请名校 PhD 的整体成绩也不错,看见母校越来越强很开心。谈到优势,我个人认为还是自由的学术氛围和优秀的教学资源吧。浙江大学里有很多院士带领学生做前沿课题,也有诸如像 MOOC 中国著名网红老师翁恺这样的优秀教学队伍可以进行一线教学指导。本科教学也一直紧跟美国名校的教学模式,相信浙大的同学都有体会。

AI 科技大本营:那么,在本次机器学习专场中,您会针对哪方面的内容和大家进行分享?

彭靖田:来 CTA,与我们一起聊聊 AI 的技术与落地。本次演讲,我将向大家介绍如何使用 TensorFlow 2.0 Alpha 快速开发和部署机器学习模型。同时,我将介绍如何实现 TensorFlow 1.x 和 2.0 模型之间的快速转换。最后,我将介绍 TensorFlow 和 AI 为民服务的落地案例。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 应用程序
    +关注

    关注

    38

    文章

    3346

    浏览量

    60421
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124635
  • tensorflow
    +关注

    关注

    13

    文章

    336

    浏览量

    62374

原文标题:TensorFlow 2.0来了,为什么他却说“深度学习框架之争,现在谈结果为时尚早”?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能-Python深度学习进阶与应用技术:工程师高培解读

    深度学习的工程化落地,早已不是纸上谈兵的事。从卷积神经网络到Transformer,从目标检测到大模型私有化部署,技术栈不断延伸,工程师面临的知识体系也越来越庞杂。现根据中际赛威工程师培训老师的一份
    的头像 发表于 04-21 11:01 318次阅读
    人工智能-Python<b class='flag-5'>深度</b><b class='flag-5'>学习</b>进阶与应用技术:工程师高培解读

    强化学习会让自动驾驶模型学习更快吗?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶大模型训练时,有的技术方案会采用模仿学习,而有些会采用强化学习。同样作为大模型的训练方式,强化学习有何不同?又有什么特点呢? 什么是强化
    的头像 发表于 01-31 09:34 831次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    LuatOS框架的使用(上)

    在资源受限的物联网终端设备中,如何实现快速开发与稳定运行是关键挑战。LuatOS框架通过将Lua语言与底层硬件抽象层深度融合,提供了一套简洁高效的开发范式。本文将围绕LuatOS框架的使用展开,从
    的头像 发表于 01-27 19:38 371次阅读
    LuatOS<b class='flag-5'>框架</b>的使用(上)

    机器学习深度学习中需避免的 7 个常见错误与局限性

    ,并验证输出结果,就能不断提升专业技能,养成优秀数据科学家的工作习惯。需避免的机器学习深度学习数据错误在训练数据驱动的人工智能模型时,我们会遇到一些常见错误和局
    的头像 发表于 01-07 15:37 350次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    穿孔机顶头检测仪 机器视觉深度学习

    LX01Z-DG626穿孔机顶头检测仪采用深度学习技术,能够实现顶头状态的在线实时检测,顶头丢失报警,顶头异常状态报警等功能,响应迅速,异常状态视频回溯,检测顶头温度,配备吹扫清洁系统,维护周期长
    发表于 12-22 14:33

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-03 13:50

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 332次阅读

    电机驱动EMC整改:传统VS智能,性价比之争

    电机驱动EMC整改:传统VS智能,性价比之争|深圳南柯电子
    的头像 发表于 10-21 10:13 672次阅读

    请问STM32如何移植Audio框架

    最近在学习音频解码,想用一下Audio框架。 1、这个该如何移植到自己创建的BSP并对接到device框架中?看了官方移植文档没有对没有对该部分的描述。 2、我只想实现一个简单的播放功能,只用一个DAC芯片(比如CS4344)是
    发表于 09-25 07:17

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概
    的头像 发表于 09-10 17:38 1051次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    深度学习对工业物联网有哪些帮助

    深度学习作为人工智能的核心分支,通过模拟人脑神经网络的层级结构,能够自动从海量工业数据中提取复杂特征,为工业物联网(IIoT)提供了从数据感知到智能决策的全链路升级能力。以下从技术赋能、场景突破
    的头像 发表于 08-20 14:56 1211次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 4367次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    深度学习遇上嵌入式资源困境,特征空间如何破局?

    近年来,随着人工智能(AI)技术的迅猛发展,深度学习(Deep Learning)成为最热门的研究领域之一。在语音识别、图像识别、自然语言处理等领域,深度学习取得了显著成果。从原理上看
    发表于 07-14 14:50 1323次阅读
    当<b class='flag-5'>深度</b><b class='flag-5'>学习</b>遇上嵌入式资源困境,特征空间如何破局?

    提问,现在有哪些开发板值得学习使用?

    提问一下,现在有哪些开发板值得学习使用?
    发表于 06-04 10:54