0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

吴恩达:不要建立一个以AI为先的企业

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-04-26 10:05 次阅读

吴恩达一生中有很多头衔,你也许知道他是谷歌大脑团队的创始人,或者是百度的前首席科学家。你也许是上过他的课,通过广受欢迎的在线课程,他向无数学生、好奇的听众和商业领袖传授了机器学习的原理。

目前,他在 2017 年创立的最新创业项目 Landing AI 中,探索没有庞大数据集可供利用的企业如何加入 AI 革命。

3 月 23 日,吴恩达在《麻省理工技术评论》的虚拟 EmTech Digital 峰会上分享了他的经验教训。

《麻省理工技术评论》:我敢肯定人们经常问你:“怎么建立一个以 AI 为先的企业呢?”你通常会怎么回答呢?

吴恩达:我通常会说:“不要那样做”。如果我在带一个团队,就会说:“嘿,大家请以人工智能为先” ,团队就会把重点放在技术上,这也许对一个研究实验室来说挺好的。但做生意时,我一般是以客户或任务为导向,几乎没有以技术为导向过。

《麻省理工技术评论》:你建立了这个叫作 Landing AI 的新创业项目。你能告诉我们这个项目是什么吗?以及你为什么选择做这个项目?

吴恩达:在谷歌和百度带过 AI 团队后,我意识到 AI 已经改变了消费类软件互联网,比如网络搜索和在线广告,但我想把 AI 运用到其他所有行业,这在经济中占更大比重。

所以在研究了很多不同行业之后,我决定从制造业下手。我觉得很多行业已经具备了创建 AI 的条件,但一个行业创建 AI 条件更成熟的一个模式就是它正在经历数字转型,这样就会有一些数据,这为 AI 团队利用数据创造价值提供了机会。

我最近很感兴趣的一个项目是制造视觉检测,看着从生产线上下来的智能手机的图片,你能看出图片有没有缺陷呢?或者能看出汽车部件上有没有凹痕呢?

一个巨大的区别是在消费类软件互联网上,也许你有 10 亿用户和大量的数据。但在制造业,没有一家工厂生产过 10 亿部甚至 100 万部刮花的智能手机。所以挑战是你能用 AI 处理 100 张图像吗?

事实证明,你可以做到,用少量的数据就可以做这么多事情,我每次都惊叹不已。所以,尽管所有围绕 AI 的宣传、热度和公关都是以巨大的数据集为卖点,但我觉得我们也还有很大的发展空间来开创其他挑战大不相同的应用程序。

《麻省理工技术评论》:你是怎么运营这个项目的?

吴恩达:我看到首席执行官和首席信息官经常犯的一个错误是,他们对我说:“嘿,安德鲁,我们没有那么多数据,我的数据一团糟。所以给我两年时间来建立一个完善的 IT 基础设施,这样我们就有了构建 AI 所需的海量数据。”我总回答道:“这是错的。别这么做。”

首先,我认为当今世界上没有一家公司,甚至是科技巨头会觉得他们的数据是完美无瑕的,这是一个过程。而花 2-3 年时间构建一个漂亮的数据基础设施,意味着你没有 AI 团队的反馈,来帮助你优先考虑要构建什么样的 IT 基础设施。

例如,如果你有很多用户,你是否应该优先给他们做调查问卷来获得更多数据?或者在工厂里,你是否应该优先升级传感器,从记录每秒 10 次震动到每秒 100 次震动?通常情况下,在开始 AI 项目时,你掌握的数据能够让 AI 团队给你提供反馈,帮助你优先考虑还要收集哪些数据。

在不具备消费类软件互联网规模的行业,我觉得我们需要从大数据转向优质数据。如果你有一百万张图片,那就用吧。但使用小得多、标签清晰、精心整理的数据集就会出现很多问题。

《麻省理工技术评论》:你能举个例子吗?你说的优质数据是什么意思?

吴恩达:我先举一个语音识别的例子,我在使用语音搜索时,会听到有人说,“嗯,今天的天气”的音频片段,问题是这个音频片段该怎么正确转录呢?是“嗯,今天的天气”,还是“嗯、、、今天的天气”呢?抑或是“嗯”这个词我们没抄下来?

其实这三种都可以,但不同的转录器用这三种标记方式就有问题了,这样数据就会有噪音,损害语音识别系统。现在,你有数百万或 10 亿用户时,就可以把那些噪音数据平均分配一下——学习算法就可以很好做到这一点。但如果你的数据集比较小的话,如 100 个例子,那这类噪音数据会让效果大打折扣。

还有一个是制造业的例子:我们在钢材检验方面做了很多工作。如果你开一辆侧面曾经是用钢板做的车,有时钢板上会有一些小褶皱、小凹痕或斑点,你就可以用相机和计算机视觉来检查是否有缺陷。

但不同的贴标人员会对数据进行不同的标记,有些人会在整个区域周围放一个巨大的限位框,有些人会在小粒子周围设置小小的限位框。当你的数据集很小时,确保不同的质检人员统一标记数据是最重要的事情之一。

对很多 AI 项目来说,你从 GitHub 上下载的开源模型——你可以从文献中获得的神经网络——(这)已经够好了,(虽然)这不能解决所有问题,但可以解决主要问题。所以我跟我团队很多人说,“嘿,大家,神经网络已经够好了。我们不要再搅乱代码了。你们现在唯一要做的就是建立流程来提高数据质量。”事实证明,这通常能让算法的性能提高得更快。

《麻省理工技术评论》:你提到较小的数据集时,是指多大的数据?一百个例子?还是十个例子?

吴恩达:机器学习太多样化了,很难给出一刀切的答案。我曾经处理过有 2 亿到 3 亿张图片的问题,也处理过只有 10 张图片的问题,以及介于这两者之间的我也都处理过。我观察制造业应用程序时,我认为一个缺陷类有几十或上百个图像是很正常的,但即使在工厂内部也有很大的差异。

我确实发现,训练集的规模低于比如说 10000 个例子时,AI 实践就会切换,因为这是一个阈值,工程师基本可以查看每个例子,自己设计、然后做出决定。

最近,我和一位非常出色、在一家大型科技公司工作的工程师聊天。我问他:“嘿,如果标签不一致的话你会怎么办?”他回答道:“嗯,我们在海外有几百人的团队做标签,所以我会写下标签说明,让三个人给每张图片贴上标签,然后我取一个平均值。”我说:“是的,数据集很大时就得这么做。”但我和一个较小的团队合作时,如果标签不一致,我就会找到这两个意见不一致的人,让他们打一个 Zoom 视频电话,互相交谈一下,试图达成一个解决方案。

《麻省理工技术评论》:现在我想请你谈谈对一般 AI 产业的看法。我收集了我们读者想问你的问题。一位读者问道:AI 的发展似乎主要分两种方向,一种是学术研究,一种是大规模、资源密集型的大公司项目,如 OpenAI 和 DeepMind。这并没有给小型创业公司留下太多的空间。你认为小公司可以关注哪些实际问题来推动 AI 的真正商业应用呢?

吴恩达:我认为很多媒体都把注意力放在大公司上,有时也放在大型学术机构上。但如果你参加学术会议,就会发现很多工作是由小型研究小组和研究实验室完成的。我和不同公司各行各业的人士交谈时,我觉得他们可以利用 AI 来解决很多商业应用问题。我通常去问商业领袖:“你们最大的商业问题是什么?你最担心的事情是什么?”这样我就能更好理解企业的目标,然后集思广益是否有 AI 解决方案,有时找不到解决方案的话,那也没关系。

也许我要提几个我觉得兴奋的差异,我认为今天构建 AI 系统仍然需要大量的手工操作。你有一些聪明的机器学习工程师和数据科学家在计算机上做事情,然后把事情推向生产,在这个过程中有很多手动步骤。因此,我对 ML Ops(机器学习操作)感到兴奋,因为这是一门新兴学科,有助于让构建和部署 AI 系统的过程更加系统化。

此外,如果你看看许多典型的商业问题(从营销到人才)的所有职能,就会发现自动化和效率提高的空间很大。

我也希望 AI 社区能够关注最大的社会问题,看看我们能为气候变化、无家可归或贫困做些什么。除了有时非常有价值的商业问题,我们也应该致力于最大的社会问题。

《麻省理工技术评论》:你如何确定是否有机会在你的企业中进行机器学习呢?

吴恩达:我会试着自己学习一些商业知识,也会试着帮助商业领袖学习一些有关 AI 的知识,然后我们通常会集思广益一组项目,对于每个想法,我会同时在技术和业务上作出努力。我们将着眼于:你是否有足够的数据?精度是多少?您将其部署到生产环境中时,是否存在长尾现象?你如何填充数据,为持续学习形成闭合回路?所以要确保问题在技术上是可行的。然后是商业方面做出的努力:我们要确保这会实现我们期待的投资回报率。在这个过程之后,你通常要做这样的事情,比如评估资源、里程碑。

另一个建议是:开始要快,这很重要,从小处开始也没关系。我在谷歌第一个有意义的商业应用程序是语音识别,而不是网络搜索或广告,但帮助谷歌语音团队提高语音识别的准确度,给大脑团队确立了信誉以及提供必要的资金去追求更大的合作伙伴。

所以谷歌地图是我们第二大合作伙伴,我们使用计算机视觉,读取房屋号码,在谷歌地图上定位房屋。只有在前两个项目成功之后,我才与广告团队好好探讨了一下。我想我看到过很多公司因为起步太大而失败,这比起步太小而失败的要多。作为一个组织,你可以先做一个较小的项目,了解一下使用AI的感觉,然后再继续做大。

《麻省理工技术评论》:为了在自己的公司里实现 AI,我们的用户明天应该开始做一件什么事?

吴恩达:投入。AI 正在改变许多行业的格局,所以,如果你的公司还没有做出非常浩大和明智的投资,这是一个好时机。

原文标题:吴恩达:不要建立AI先行的企业,而要从任务导向开始 | 专访

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26411

    浏览量

    264021
  • 机器学习
    +关注

    关注

    66

    文章

    8114

    浏览量

    130546

原文标题:吴恩达:不要建立AI先行的企业,而要从任务导向开始 | 专访

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何使用MDK5建立完整的H750工程,保证不会出错误?

    请问如何使用MDK5建立完整的H750工程,保证不会出错误
    发表于 03-19 06:47

    Microsoft和Mistral AI宣布建立新的合作伙伴关系 加速AI创新

    微软与人工智能领域领先者Mistral AI宣布建立长期合作关系,共同推动AI发展。
    的头像 发表于 03-12 09:11 310次阅读

    FSLP建立接口,如何降低ADC-DMA的速度?

    我正在为 FSLP(力感线性电位计)建立接口,检测用户的触摸滑动。 我正在使用比较器 ISR 来检测用户触摸 FSLP 的情况,然后从 ADC 中读取压力读数,如果压力超过阈值,
    发表于 03-06 06:31

    比创元启新程 共创新佳绩:2023年度总结暨迎新年晚会圆满收官!a

    未来年的发展打好理论的基础。 比创能取得如此优异的成绩,全赖每一个部门的完美运作,每位员工的奋斗和拼搏,因为有他们的努力与汗水,才能凝聚成比创
    发表于 02-26 11:05

    企业如何推进AI

    要推动AI技术却不能为技术而技术、领导不要过于强调AI,而是要坚持价值驱动的原则、坚持做实用的技术、做解决实际问题的技术,在创造价值的过程中推动技术的发展。
    的头像 发表于 02-25 09:36 203次阅读

    英伟将用AI设计AI芯片

    AI芯片行业资讯
    深圳市浮思特科技有限公司
    发布于 :2024年02月19日 17:54:43

    AI语音机器人,企业营销新选择

    机器人AI
    jf_86111705
    发布于 :2023年09月25日 17:11:01

    2023英特尔on技术创新大会:加速AI创新

    英特尔为先进科技注入AI动力,提供开放、可扩展和值得信赖的解决方案,帮助客户赢在AI时代
    的头像 发表于 09-22 17:32 330次阅读

    企业级生成式AI应用,如何克服“幻觉”问题

    然而,企业AI 应用与个人 AI 应用需求之间存在巨大差异,对技术本身的要求也不在一个量级。仅拿当下生成式 AI 应用最让人诟病的“AI
    的头像 发表于 09-21 16:00 447次阅读

    AI智能呼叫中心

    实际情况进行资源的自动调度和优化,从而进步提高工作效率和降低人力成本。总结,AI智能呼叫中心凭借自动化处理、个性化服务、数据驱动决策以及节约成本等系列优势,为企业
    发表于 09-20 17:53

    爱芯元智上榜“中国AI芯片企业”先锋企业TOP 30

    近日,2023全球AI芯片峰会(GACS 2023)在深圳成功举办。会上重磅揭晓了2023年度「中国AI芯片企业」榜单,爱芯元智上榜「先锋企业TOP 30」。 2023全球
    的头像 发表于 09-20 10:01 760次阅读

    如何使用rt thread studio建立TI launchpad的工程?

    想使用rt thread studio建立TI launchpad的工程,打开建立项目界面后选择添加厂商: 然后进入SDK管理器: 安装完需要插件后,退出SDK管理器,然后
    发表于 08-04 16:04

    英伟达黄仁勋:不要低估中国企业的追赶能力

    美国半导体制造企业英伟达创始人兼ceo黄仁勋30日在台北就美国限制对华半导体出口问题再次警告说:“不要低估中国企业的追击能力。”当地的gpu初创企业正在大举出现。美国东部时间30日,英
    的头像 发表于 06-01 10:57 652次阅读

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    的发展,好的 AI 技术产品该如何迭代与运营…… 为了能够与广大开发者起更好地拥抱 AI 技术的发展,5 月 13 日,由天工开物开源
    发表于 05-09 09:49