0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI 的力量会被大公司独占还是会被平均分配?

8g3K_AI_Thinker 来源:未知 作者:李倩 2018-05-09 15:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

上周,Facebook 宣布其打造了世界上最准确的目标识别系统,该系统使用了 35 亿张图像(全来自于 Instagram )。在 AI 界有这么一句老话:越大越好。要训练最快的算法,必须使用最大的数据集和性能最强的处理器。这种传统观念帮助科技巨头吸引了不少人才和投资,但是斯坦福大学最近组织的一项 AI 竞赛表明这种观念并不一定正确。在人工智能领域,原来才智仍旧可以打败性能。

证据来自于 DAWNBench 挑战赛,去年 11 月斯坦福大学的研究员宣布正式启动这项比赛,上周他们宣布了比赛的获胜者。我们可以将 DAWNBench 看作是 AI 工程师的田径运动会,不过比赛项目不是跨栏和跳远,而是诸如目标识别和阅读理解这样的任务。来自于大学、政府部门和业内的团队和个人相互角逐,比赛项目为谁设计的算法最优秀,斯坦福大学的研究员作为裁判。每个参赛的算法都必须满足基本的准确性标准(例如:在给定数据集中识别出 93% 的狗),评判标准包括训练算法的时间和训练成本。

斯坦福大学研究员 Matei Zaharia 和 Cody Coleman 解释称,这些评判标准可以反映 AI 领域的实际需求。Zaharia 告诉科技媒体《 The Verge 》,“如果你的团队较小,通过衡量成本,你就可以知道是否需要用 Google 级别的基础设施来与别人竞争。通过测定训练速度,你就可以知道部署某一 AI 解决方案需要多长时间。也就是说,这些衡量标准可以帮助我们判断小团队是否能与科技巨头一较高下”。

比赛的结果并不能给出直接的答案,但是却告诉我们:要在 AI 领域取得成功,计算能力并不是唯一要义,巧妙的算法设计至少一样重要。虽然 Google 和 Intel 这样的大型科技公司在很多任务中成绩突出,但是小型团队(甚至个人)通过使用鲜为人知的独特方法也可以名列前茅。

拿 DAWNBench 的目标识别挑战赛来说,这项比赛要求参赛团队训练出可以识别图片数据集 CIFAR-10 中的目标的算法。CIFAR-10 是一个相对较旧的数据集,但是它反映了企业在现实中可能要处理的各种数据。CIFAR-10 包含 6 万张尺寸为 32×32 的小图像,每张图像都归类在一个类别下,例如“狗”、“青蛙”、“船”或“卡车”,共有 10 个类别。

▌“用基础的资源实现世界级的结果”

在 DAWNBench 的榜单中,排名前三的获胜者都是 Fast.AI 的研究员,他们的算法训练时间最短而且训练成本最低。Fast.AI 并不是大型研究实验室,而是一个创造学习资源的非盈利组织,致力于让所有人都能学习深度学习。Fast.AI. 联合创始人、企业家兼数据科学家 Jeremy Howard 表示,他的学生的成功靠的是创新思考,这表示任何人都能“用基础的资源实现世界级的结果”。

Howard 解释称,为了设计出能解决 CIFAR 识别任务的算法,Fast.AI 团队选择了一种相对不知名的训练方法——超收敛(super convergence)。创建这种方法的不是资金雄厚的科技公司,而是美国海军研究实验室(Naval Research Laboratory)研究员 Leslie Smith。

超级收敛的基本原理是,缓慢增加用于训练算法的数据流。我们可以这么理解这种方法:如果你要教某人识别树木,你不会一开始就给他们一片森林。开始的时候你会教他们每一种树及其树叶的模样,慢慢地将信息灌输给他们。这样解释有点过分简化,但是 Fast.AI 使用超级收敛法训练的算法在训练速度上比竞争对手的算法快很多。Fast.AI 团队可以在三分钟内训练出一个能对 CIFAR 数据集进行分类的算法,而且准确度满足比赛要求。排名第二的团队没有使用超级收敛法,他们的训练时间超过半小时。

不过,Fast.AI 没有一路赢得所有比赛。在另一项挑战赛中,参赛者需要利用目标识别算法对 ImageNet 数据集进行分类,结果 Google 大获全胜,包揽了训练时间最短的前三名和训练成本最低的第一名和第二名( Fsat.AI 获得了成本最低的第三名和训练时间最短的第四名)。但是,Google 的算法都在自家定制的 AI 硬件上运行,芯片也是针对任务特别设计的,即张量处理器(TPU)。事实上,Google 在一些任务中使用的处理器是其自称的 TPU“pod”——串联运行的 64 枚 TPU 芯片。相比之下,Fast.AI 参赛团队使用的是普通电脑上用的英伟达 GPU,所有人都可以买到。

Google 的张量处理器(TPU)是 Google 特别定制的芯片

Howard 表示,“Google 自家的基础设备可以轻松地训练算法,但可能价值不大。但是只花 25 美元用同一机器在三小时内完成相同的训练任务,价值就很大”。

ImageNet 的结果特别明显,因为评判标准很模糊。Google 的硬件帮助它大获全胜,但是考虑到它是世界上最富有的科技公司,这个结果并不让人惊讶。虽然 Fast.Ai 的学生的确提出了一种创新的解决方案,但是 Google 的解决方案也很巧妙。Google 的一个参赛团队使用了一种名为 “AutoML” 的算法,这一系列的算法可以在没有人类指导的情况下搜索可以处理某一给定任务的最佳算法。也就是说,AI 设计 AI。

理解这些结果的困难在于,并不是只要找出哪个团队的结果最好就可以了,这些团队有着社会和政治上的影响。例如,思考一下谁控制着人工智能的未来,是利用 AI 增强自身势力和财富的 Amazon、Facebook 和 Google 等科技巨头吗?AI 带来的好处是否能平均、民主地分配给所有人?

对 Howard 而言,这些问题很重要。他表示,“我不希望深度学习被掌握在一小撮精英手中。每当我与年轻的从业者和学生对话时,越大越好这个观念真的很让我烦恼。对 Google 这样的公司而言,这样的观念很好,因为这能帮助它们吸引到人才,人们都认为除非你在 Google 工作,否则你干不出什么的。但是这种观念是错误的”。

▌AI 的力量会被大公司独占还是会被平均分配?

很遗憾,我们都不是 AI 预言家。没人可以通过观察 DAWNBench 挑战赛的结果来预测 AI 的未来。如果说这项比赛的结果有什么启示,那就是告诉我们 AI 行业还在不断变化中。决定 AI 未来的是小巧灵妙的算法还是硬件的计算能力?没人知道答案,且希望得到一个简单的答案是不合理的。

DAWNBench 组织者 Zaharia 和Coleman 表示,他们很高兴看到这项比赛引起了如此巨大的回应。Coleman 称:“比赛结果有很大的多样性。看到机器学习领域发生的事后,我并不是很担心(某一家公司)会主导整个行业。在我们现在所处的这个阶段,我们仍然能看到新框架的不断涌现,以及大量想法的分享。”

这两位组织者指出,大部分 DAWNBench 挑战赛的参赛作品都是开源的,但是这不是比赛的一个评判标准,这意味着这些作品的代码都发布在网上,任何人都可以获取。不管谁是比赛的获胜者,每个人都能从中受益。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41138

    浏览量

    302608
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59356
  • 识别系统
    +关注

    关注

    1

    文章

    160

    浏览量

    19504

原文标题:个人开发者也可以战胜Google等巨头?AI靠的不只是“蛮力”

文章出处:【微信号:AI_Thinker,微信公众号:人工智能头条】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Token烧了几十亿,代码还是一团乱!AI原生开发该怎么管理?

    和衡量研发效能的老办法也要升级。现在最让人头疼的问题是:人和 AI 一起干活,自由发挥靠“手感”,我们怎么知道 AI 用法好不好?效能发挥出来多少?不论从企业还是个人视角,这都是大家面临的一个棘手问题。
    发表于 04-14 19:50

    科瑞杰横河WT5000功率分析仪指数平均和移动平均功能的区别

    深圳市科瑞杰科技有限公司--横河WT5000功率分析仪都有一个平均功能,这个功能包含两种平均化方法,分别是指数平均和移动平均(也叫线性
    的头像 发表于 03-26 17:42 1242次阅读
    科瑞杰横河WT5000功率分析仪指数<b class='flag-5'>平均</b>和移动<b class='flag-5'>平均</b>功能的区别

    论马斯克的预言:AI使人类边缘化

    “电子躯体”实验,表明生物大脑的运作模式可被数字化拆解、模拟和移植,AI正从“辅助人类”走向“自我进化”,若照此趋势发展,人类在某些方面的作用可能会被弱化。 就业结构变化角度:AI正在替代一些重复性
    发表于 03-14 05:27

    T5260A-2KA矢量网络分析仪针对功分器测试的实例分享

    网络、变压器等,将输入信号平均分配到各个输出端。在信号处理过程中发挥着重要作用。 功率分配器的技术指标包括频率范围、承受功率、主路到支路的分配损耗、输入输出间的插入损耗、支路端口间的隔离度、每个端口的电压驻
    的头像 发表于 02-26 16:07 165次阅读
    T5260A-2KA矢量网络分析仪针对功分器测试的实例分享

    使用NORDIC AI的好处

    不依赖持续联网,整体系统可靠性更高。[Edge AI 概述; Nordic Edge AI 技术页] 覆盖从“小 MCU”到“高性能 SoC”的完整产品线 Neuton 模型 :超小模型(平均
    发表于 01-31 23:16

    基于慧能泰PD芯片HUSB362BF和HUSB392的100W 3C1A动态功率分配方案

    传统的多口充电器通常是每个端口分配一个固定的功率上限,即使实际端口的充电功率没有达到这个上限,多出来的预期功率部分仍然会被占用,导致资源浪费。这种固定的功率分配限制了充电器的灵活性和效率。
    的头像 发表于 12-16 15:14 5461次阅读
    基于慧能泰PD芯片HUSB362BF和HUSB392的100W 3C1A动态功率<b class='flag-5'>分配</b>方案

    华为发布AI容器技术Flex:ai,算力平均利用率提升30%

    决方案。   当前,AI产业正处于高速发展的黄金时期,海量算力需求如潮水般涌来。然而,算力资源利用率偏低的问题却成为了产业发展的关键桎梏。具体表现为,小模型任务常常独占整卡,导致大量资源闲置;大模型任务又因单机算力不足而难以支撑;更有大量缺乏GPU
    的头像 发表于 11-26 08:31 7790次阅读

    802-2-0.670功率分配器/合成器

    用于信号的分配与合成,适用于无线通信、广播电视、射频测试以及工业控制等多个领域。主要参数频率范围:0.38 – 0.96 GHz平均功率:40 W(作为分配器,负载 VSWR ≤1.20:1)理论插损
    发表于 11-17 09:48

    AI赋能6G与卫星通信:开启智能天网新时代

    需求?传统网络会因流量激增而拥堵,而AI赋能的6G网络则能提前预测流量模式,动态调整资源分配AI算法能够实时分析海量数据,包括用户位置、网络负载、历史流量模式等。在2025年上海世界移动通信大会
    发表于 10-11 16:01

    GCC编译器,怎么才能实现c文件中未被调用的函数,不会被编译呢?

    GCC编译器,怎么才能实现c文件中未被调用的函数,不会被编译?有什么编译选项可以设置吗? 移植代码,有些函数没被调用的函数想留在代码里,但不想被编译,编译的话报错报警告啥的太多了,而且编译起来也慢。 谢谢!
    发表于 09-28 12:25

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    、资源分配的最优策略建议,减少资源浪费,提升整体网络效率。 客户实证:AI推理引擎的精准力量某大型政务云平台遭遇核心业务运行缓慢问题,初步怀疑网络带宽不足。在利用信而泰xnSight网络应用性能管理系统
    发表于 07-16 15:29

    当系统切换到睡眠模式时,20735 的 BT_HOST_WAKE 引脚会被触发中断,怎么解决?

    我们发现,当系统切换到睡眠模式时,20735 的 BT_HOST_WAKE 引脚会被触发中断,因此我们需要禁用 BT_HOST_WAKE 引脚。 但是我们在 WICED Studio 工具中找不到关系 API。 谁知道禁用 pin BT_HOST_WAKE 的路径? 谢谢。
    发表于 07-03 08:17

    嵌入式AI技术漫谈:怎么为训练AI模型采集样本数据

    Q 需要为嵌入式AI模型提供多少样本数据? 我在向客户介绍如何使用AI方法设计一款客户产品时,客户理解,AI嵌入式项目的开发都是围绕数据展开的,如此,我经常会被问到这样的问题:客户的工
    的头像 发表于 06-11 16:30 1548次阅读

    平均故障间隔时间和预期寿命的区别

    在评估设备使用寿命和维护成本时,故障分析和预期寿命计算至关重要。用于此类评估的两个等级--平均故障间隔时间(MTBF)和预期寿命--有时会被混淆,因此让我们来探讨一下两者在含义上的区别。
    的头像 发表于 05-16 17:36 1203次阅读
    <b class='flag-5'>平均</b>故障间隔时间和预期寿命的区别

    AI玩具,还是AI工具?

    近年来,随着ChatGPT、DeepSeek等大模型的爆发,AI技术正以前所未有的速度渗透到消费电子市场。从2025年CES上AI玩具的火爆,龙年春节之后至今,众多国内的技术公司不断发布集成了豆包
    的头像 发表于 05-16 01:04 8768次阅读
    <b class='flag-5'>AI</b>玩具,<b class='flag-5'>还是</b><b class='flag-5'>AI</b>工具?