0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

吴恩达:不要建立一个以AI为先的企业

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-04-26 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

吴恩达一生中有很多头衔,你也许知道他是谷歌大脑团队的创始人,或者是百度的前首席科学家。你也许是上过他的课,通过广受欢迎的在线课程,他向无数学生、好奇的听众和商业领袖传授了机器学习的原理。

目前,他在 2017 年创立的最新创业项目 Landing AI 中,探索没有庞大数据集可供利用的企业如何加入 AI 革命。

3 月 23 日,吴恩达在《麻省理工技术评论》的虚拟 EmTech Digital 峰会上分享了他的经验教训。

《麻省理工技术评论》:我敢肯定人们经常问你:“怎么建立一个以 AI 为先的企业呢?”你通常会怎么回答呢?

吴恩达:我通常会说:“不要那样做”。如果我在带一个团队,就会说:“嘿,大家请以人工智能为先” ,团队就会把重点放在技术上,这也许对一个研究实验室来说挺好的。但做生意时,我一般是以客户或任务为导向,几乎没有以技术为导向过。

《麻省理工技术评论》:你建立了这个叫作 Landing AI 的新创业项目。你能告诉我们这个项目是什么吗?以及你为什么选择做这个项目?

吴恩达:在谷歌和百度带过 AI 团队后,我意识到 AI 已经改变了消费类软件互联网,比如网络搜索和在线广告,但我想把 AI 运用到其他所有行业,这在经济中占更大比重。

所以在研究了很多不同行业之后,我决定从制造业下手。我觉得很多行业已经具备了创建 AI 的条件,但一个行业创建 AI 条件更成熟的一个模式就是它正在经历数字转型,这样就会有一些数据,这为 AI 团队利用数据创造价值提供了机会。

我最近很感兴趣的一个项目是制造视觉检测,看着从生产线上下来的智能手机的图片,你能看出图片有没有缺陷呢?或者能看出汽车部件上有没有凹痕呢?

一个巨大的区别是在消费类软件互联网上,也许你有 10 亿用户和大量的数据。但在制造业,没有一家工厂生产过 10 亿部甚至 100 万部刮花的智能手机。所以挑战是你能用 AI 处理 100 张图像吗?

事实证明,你可以做到,用少量的数据就可以做这么多事情,我每次都惊叹不已。所以,尽管所有围绕 AI 的宣传、热度和公关都是以巨大的数据集为卖点,但我觉得我们也还有很大的发展空间来开创其他挑战大不相同的应用程序。

《麻省理工技术评论》:你是怎么运营这个项目的?

吴恩达:我看到首席执行官和首席信息官经常犯的一个错误是,他们对我说:“嘿,安德鲁,我们没有那么多数据,我的数据一团糟。所以给我两年时间来建立一个完善的 IT 基础设施,这样我们就有了构建 AI 所需的海量数据。”我总回答道:“这是错的。别这么做。”

首先,我认为当今世界上没有一家公司,甚至是科技巨头会觉得他们的数据是完美无瑕的,这是一个过程。而花 2-3 年时间构建一个漂亮的数据基础设施,意味着你没有 AI 团队的反馈,来帮助你优先考虑要构建什么样的 IT 基础设施。

例如,如果你有很多用户,你是否应该优先给他们做调查问卷来获得更多数据?或者在工厂里,你是否应该优先升级传感器,从记录每秒 10 次震动到每秒 100 次震动?通常情况下,在开始 AI 项目时,你掌握的数据能够让 AI 团队给你提供反馈,帮助你优先考虑还要收集哪些数据。

在不具备消费类软件互联网规模的行业,我觉得我们需要从大数据转向优质数据。如果你有一百万张图片,那就用吧。但使用小得多、标签清晰、精心整理的数据集就会出现很多问题。

《麻省理工技术评论》:你能举个例子吗?你说的优质数据是什么意思?

吴恩达:我先举一个语音识别的例子,我在使用语音搜索时,会听到有人说,“嗯,今天的天气”的音频片段,问题是这个音频片段该怎么正确转录呢?是“嗯,今天的天气”,还是“嗯、、、今天的天气”呢?抑或是“嗯”这个词我们没抄下来?

其实这三种都可以,但不同的转录器用这三种标记方式就有问题了,这样数据就会有噪音,损害语音识别系统。现在,你有数百万或 10 亿用户时,就可以把那些噪音数据平均分配一下——学习算法就可以很好做到这一点。但如果你的数据集比较小的话,如 100 个例子,那这类噪音数据会让效果大打折扣。

还有一个是制造业的例子:我们在钢材检验方面做了很多工作。如果你开一辆侧面曾经是用钢板做的车,有时钢板上会有一些小褶皱、小凹痕或斑点,你就可以用相机和计算机视觉来检查是否有缺陷。

但不同的贴标人员会对数据进行不同的标记,有些人会在整个区域周围放一个巨大的限位框,有些人会在小粒子周围设置小小的限位框。当你的数据集很小时,确保不同的质检人员统一标记数据是最重要的事情之一。

对很多 AI 项目来说,你从 GitHub 上下载的开源模型——你可以从文献中获得的神经网络——(这)已经够好了,(虽然)这不能解决所有问题,但可以解决主要问题。所以我跟我团队很多人说,“嘿,大家,神经网络已经够好了。我们不要再搅乱代码了。你们现在唯一要做的就是建立流程来提高数据质量。”事实证明,这通常能让算法的性能提高得更快。

《麻省理工技术评论》:你提到较小的数据集时,是指多大的数据?一百个例子?还是十个例子?

吴恩达:机器学习太多样化了,很难给出一刀切的答案。我曾经处理过有 2 亿到 3 亿张图片的问题,也处理过只有 10 张图片的问题,以及介于这两者之间的我也都处理过。我观察制造业应用程序时,我认为一个缺陷类有几十或上百个图像是很正常的,但即使在工厂内部也有很大的差异。

我确实发现,训练集的规模低于比如说 10000 个例子时,AI 实践就会切换,因为这是一个阈值,工程师基本可以查看每个例子,自己设计、然后做出决定。

最近,我和一位非常出色、在一家大型科技公司工作的工程师聊天。我问他:“嘿,如果标签不一致的话你会怎么办?”他回答道:“嗯,我们在海外有几百人的团队做标签,所以我会写下标签说明,让三个人给每张图片贴上标签,然后我取一个平均值。”我说:“是的,数据集很大时就得这么做。”但我和一个较小的团队合作时,如果标签不一致,我就会找到这两个意见不一致的人,让他们打一个 Zoom 视频电话,互相交谈一下,试图达成一个解决方案。

《麻省理工技术评论》:现在我想请你谈谈对一般 AI 产业的看法。我收集了我们读者想问你的问题。一位读者问道:AI 的发展似乎主要分两种方向,一种是学术研究,一种是大规模、资源密集型的大公司项目,如 OpenAI 和 DeepMind。这并没有给小型创业公司留下太多的空间。你认为小公司可以关注哪些实际问题来推动 AI 的真正商业应用呢?

吴恩达:我认为很多媒体都把注意力放在大公司上,有时也放在大型学术机构上。但如果你参加学术会议,就会发现很多工作是由小型研究小组和研究实验室完成的。我和不同公司各行各业的人士交谈时,我觉得他们可以利用 AI 来解决很多商业应用问题。我通常去问商业领袖:“你们最大的商业问题是什么?你最担心的事情是什么?”这样我就能更好理解企业的目标,然后集思广益是否有 AI 解决方案,有时找不到解决方案的话,那也没关系。

也许我要提几个我觉得兴奋的差异,我认为今天构建 AI 系统仍然需要大量的手工操作。你有一些聪明的机器学习工程师和数据科学家在计算机上做事情,然后把事情推向生产,在这个过程中有很多手动步骤。因此,我对 ML Ops(机器学习操作)感到兴奋,因为这是一门新兴学科,有助于让构建和部署 AI 系统的过程更加系统化。

此外,如果你看看许多典型的商业问题(从营销到人才)的所有职能,就会发现自动化和效率提高的空间很大。

我也希望 AI 社区能够关注最大的社会问题,看看我们能为气候变化、无家可归或贫困做些什么。除了有时非常有价值的商业问题,我们也应该致力于最大的社会问题。

《麻省理工技术评论》:你如何确定是否有机会在你的企业中进行机器学习呢?

吴恩达:我会试着自己学习一些商业知识,也会试着帮助商业领袖学习一些有关 AI 的知识,然后我们通常会集思广益一组项目,对于每个想法,我会同时在技术和业务上作出努力。我们将着眼于:你是否有足够的数据?精度是多少?您将其部署到生产环境中时,是否存在长尾现象?你如何填充数据,为持续学习形成闭合回路?所以要确保问题在技术上是可行的。然后是商业方面做出的努力:我们要确保这会实现我们期待的投资回报率。在这个过程之后,你通常要做这样的事情,比如评估资源、里程碑。

另一个建议是:开始要快,这很重要,从小处开始也没关系。我在谷歌第一个有意义的商业应用程序是语音识别,而不是网络搜索或广告,但帮助谷歌语音团队提高语音识别的准确度,给大脑团队确立了信誉以及提供必要的资金去追求更大的合作伙伴。

所以谷歌地图是我们第二大合作伙伴,我们使用计算机视觉,读取房屋号码,在谷歌地图上定位房屋。只有在前两个项目成功之后,我才与广告团队好好探讨了一下。我想我看到过很多公司因为起步太大而失败,这比起步太小而失败的要多。作为一个组织,你可以先做一个较小的项目,了解一下使用AI的感觉,然后再继续做大。

《麻省理工技术评论》:为了在自己的公司里实现 AI,我们的用户明天应该开始做一件什么事?

吴恩达:投入。AI 正在改变许多行业的格局,所以,如果你的公司还没有做出非常浩大和明智的投资,这是一个好时机。

原文标题:吴恩达:不要建立AI先行的企业,而要从任务导向开始 | 专访

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297387
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136280

原文标题:吴恩达:不要建立AI先行的企业,而要从任务导向开始 | 专访

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智浦助力亿境虚拟打造新AI眼镜解决方案

    智浦半导体宣布,深圳市亿境虚拟现实技术有限公司(简称“亿境虚拟”)在其新AI 眼镜解决方案SW3021中采用智浦i.MX RT685跨界MCU,实现了极致低功耗与强大音频处理
    的头像 发表于 10-16 09:03 4040次阅读

    继HBM之后,英伟带火又AI内存模组!颠覆AI服务器与PC

    电子发烧友网综合报道,据韩媒报道,下代低功耗内存模块 “SOCAMM” 市场已全面拉开帷幕。英伟作为 AI 领域的领军企业,计划在今年为其 AI
    的头像 发表于 07-27 07:50 4350次阅读

    智浦如何实现负责任的边缘AI

    当部分人仍在探索AI的应用方式时,智浦已着眼未来,提出关键问题:如何确保AI安全、可靠且负责任的方式运行?通过与技术、政府及商界精英的合作,使其真正落地,正是负责任
    的头像 发表于 06-24 16:44 1306次阅读

    AI智能体对电子企业的帮助是什么

    企业的具体帮助,并聚焦于万宝LAIDFU(来福)这创新产品,展示其如何通过自定义应用场景,轻松触及传统数据难以覆盖的领域。AI智能
    的头像 发表于 05-21 10:08 537次阅读
    <b class='flag-5'>AI</b>智能体对电子<b class='flag-5'>企业</b>的帮助是什么

    基于代理式AI建立网络安全防御体系

    NVIDIA AI 安全栈为先进的代理式系统提供信任、控制和管理支持。
    的头像 发表于 05-07 14:29 866次阅读

    IBM携手英伟AI数据平台推动企业AI创新

    近日,IBM(纽约证券交易所:IBM)宣布与英伟(纳斯达克股票代码:NVDA)开展全新合作,双方将基于英伟 AI 数据平台参考架构(reference architecture)进行产品集成
    发表于 03-24 19:20 428次阅读

    英伟GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    基础设施以及生成式 AI 服务首次实现集成,帮助全球企业组织加速创建代理式 AI 应用。 此次 Oracle Cloud Infrastructure (OCI) 与 NVIDIA
    的头像 发表于 03-21 12:01 1212次阅读
    英伟<b class='flag-5'>达</b>GTC2025亮点:Oracle与NVIDIA合作助力<b class='flag-5'>企业</b>加速代理式<b class='flag-5'>AI</b>推理

    智浦拟收购边缘AI企业Kinara

    智浦半导体宣布已达成最终协议收购Kinara, Inc.——高性能、低功耗且可编程的分立神经处理单元(NPU)行业的领先企业。该公司产品支持广泛的边缘AI应用,包括多模态生成式AI
    的头像 发表于 02-21 14:15 1100次阅读

    Gupshup加速企业AI应用进程

    推出其AI代理库(AI Agent Library),这是套由15预构建和可定制的AI代理组成的开创性套件,具备深厚的行业专业知识,可帮
    的头像 发表于 02-14 16:04 558次阅读

    智浦拟22.44亿人民币收购边缘NPU企业Kinara

    ,旨在进步拓展其在AI领域的布局。 此次收购预计将于2025年上半年完成,但须满足系列惯例成交条件,包括监管部门的批准。智浦表示,对Kinara的收购将增强其提供完整且可扩展的
    的头像 发表于 02-12 10:31 837次阅读

    企业AI模型托管怎么做的

    当下,越来越多的企业选择将AI模型托管给专业的第三方平台,实现高效、灵活和安全的模型运行。下面,AI部落小编为您介绍企业
    的头像 发表于 01-15 10:10 753次阅读

    AI与物联网双向奔赴,实智能已在AI应用赛道先行

    步释放   2025年,生成式AI已经成为实人有效的工作手段之。近期,实智能开展了
    的头像 发表于 01-13 10:39 1082次阅读

    英伟收购AI初创公司Run:ai

    :ai作为家专注于AI云计算软件平台开发的初创公司,其产品高效利用高性能GPU资源为核心,致力于为用户提供更快速、更便捷的机器学习加速方案。通过此次收购,英伟
    的头像 发表于 12-31 10:46 890次阅读

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,提升业务效率和竞争力。然而,AI模型的部署并非易事,需要企业在多个层面进行细致的规划和准备。下
    的头像 发表于 12-23 10:31 1345次阅读

    如何搭建企业AI开发环境

    搭建企业AI开发环境是复杂而细致的过程,涉及硬件选择、操作系统配置、软件安装、工具选用以及实践等多个方面。下面,AI部落小编将详细介绍如
    的头像 发表于 12-20 10:37 1264次阅读