0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款基准测量工具的雏形——MLPerf

zhKF_jqr_AI 来源:未知 作者:李倩 2018-05-09 05:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI基准大战已经开始。

5月2日,由各大领先的科技公司和大学组成的团队发布了一款基准测量工具的雏形——MLPerf,其目的是测量各种AI框架和芯片中不同机器学习任务的训练速度和推理时间。

在这一任务的参与者中,有许多知名公司和大学,其中既有谷歌、英特尔、百度、AMD这样的巨头,也有一些AI硬件创企,例如SambaNova和Wave Computing。同时还有世界顶尖大学:斯坦福大学、哈佛大学、加州大学伯克利分校、明尼苏达大学和多伦多大学。

MLPerf的诞生是小部分公司自我组织进行产品对比的结果。上周,RiseML的博客对比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特尔发表博客,展示了为机器翻译所用的RNN的数据,题目称“英特尔Xeon大规模处理器表现出令人惊讶的推理性能”。这种对比会给人一些参考,但通常也会让人觉得供应商自认为比其他厂商优越。而一个标准化的基准可以让测试简单化,得到人们想要的结果。

除此之外,想要跟踪记录各大公司和创企的芯片制造以及软件更新是非常困难的,更不要说在市场的夸大作用下还能进行真实评估了。某些芯片厂商经常承诺达到了革命性的提速,但从来不透露产品规格(咳咳,英特尔注意)。

在很长一段时间内,人们都在讨论是否有必要设立一个有意义的AI基准。支持者认为,标准的缺失限制了AI的应用。MLPerf的推动者之一吴恩达表示:“AI正在改变多个行业,但是为了发挥它最大的潜能,我们仍需要更快的硬件和软件。”支持者们希望基准的确立能帮助AI开发者创造出更好的产品,让使用者充分了解所需产品。

MLPerf声明它的基础目标是:

用公平、有帮助的测量方法加速机器学习的发展

对各竞争系统进行公平对比,以鼓励机器学习的发展

保证让所有人都能参与基准评比

既服务于商业群体,也服务于研究领域

基准要可复制,确保结果的可靠

MLPerf是仿效过去其他的基准测试,例如SPEC(The Standard Performance Evaluation Corporation)。该基准于1988年由一家计算公司的财团提出,它有效提高了通用计算的速度。而MLPerf结合了此前许多基准的标准,例如SPEC的程序,SORT用于对比和培育新思想的方法,DeepBench对软件应用的评估,以及DAWNBench的精确度标准。

Intersect360的CEO Addison Snell注意到:“现在许多企业都想部署AI,所以推出一套中立的基准非常重要,尤其在多种技术争相竞争的时代。但是,AI领域多种多样,我不禁怀疑是否最后只剩一种标准。想想五年前人们对大数据和分析的热情,尽管人人都想定义它,但是至今也没有一个通用的衡量标准。我认为AI也会面临这种情况。”

Hyperion研究公司的高级研究副总裁Steve Conway认为:“MLPerf是一款有用、优秀的工具。因为近些年一直缺少针对买卖双方的真正标准。这个基准似乎是针对人工智能早期问题指定的,大多都是有边界问题。后来我们需要其他标准,因为人工智能开始出现了无边界的问题。有边界的问题比较简单,如语音、图像识别或游戏。而无界线问题包括癌症诊断和阅读磁核共振报告;现在,人工智能能为复杂问题提出推荐方案了。“

MLPerf现已在GitHub上发布,但仍处于初期阶段,为α版本,未来将在许多方面得到改进。目前,MLPerf套件上能进行测试的有七个方面:

每个参考都提供了以下内容:至少在一个框架中实现模型的代码;一个可在container中运行基准测试的Dockerfile;一个可下载适当数据集的脚本;一个可以运行并计时模型训练的脚本;数据集、模型和机器设置的文档记录。

根据GitHub上的记录,基准测试已经在以下配置中进行测试:

16个CPU,一个NVIDIA P100

Ubuntu 16.04,包括具有NVIDIA支持的docker

600GB的硬盘(尽管很多基准要求的硬盘更小)

在这样一个年轻的市场,如果有更多的AI基准出现,那将变得很有趣。例如,斯坦福大学是MLPerf的其中一个成员,他最近运行了第一个DAWNBenchv1深度学习结果。

斯坦福报道说:“2018年4月20日表示第一个衡量深度学习端到端性能的基准和竞争的开始:测量深度学习任务达到最佳精确度时所需要的时间和成本是多少,以及在这个最先进的精确度水平下进行推理的成本是多少。对端到端性能的关注提供了一种客观的方法,用于对计算框架、硬件、优化算法、超参数设置以及影响性能的其他因素进行标准化。”

DAWN的一个竞争对手——fast.ai(一家提供人工智能培训和开发人工智能软件工具的初创公司)在HPCwire上宣传它的产品性能。所以这些基准很重要,应该认真对待,像MLPerf这样的工具能帮助清除AI产品对比中的干扰因素。

“基准提高了产品可信度,并展示了更好的性能或能带来更多益处的地方。如果你正在考虑为一个数百万美元的项目使用硬件加速器或软件框架,那么你会不会更喜欢’榜上有名’的产品?”谷歌工程师Peter Mattson表示。

MLPerf希望用可复制的、公平可靠的基准测量方法来推动机器学习行业和研究的发展。产品之间的对比还应促进供应商和学者之间的竞争。同时还应该为没人提供做实验的条件,让更多人参与其中。

Mattson补充道:“基准在短期内很重要,因为不管是对研发公司还是想要购买产品的公司来说,硬件是一项巨大的投资。长期来看,基准有助于研究者和供应商将性能作为共同的发展目标,这样才能解锁更多机器学习的能量,造福更多人。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38217

    浏览量

    297067
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136242
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123923
  • MLPerf
    +关注

    关注

    0

    文章

    37

    浏览量

    941

原文标题:MLPerf——机器学习新基准能否驱动AI向前?

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Postman:一款被忽视的强大的API开发和测试工具

    Postman的发展史 Postman是一款强大的API开发和测试工具,它于2012年创建,最初是作为个Chrome浏览器插件推出的。由于其大受欢迎,随后推出了web网页版和桌面客户端。现在
    的头像 发表于 11-26 14:11 167次阅读

    灵动微电子最新最火热的一款芯片推荐

    希望找一款灵动微电子最新最火热的一款芯片,我们想做个图形化的界面配置,供大家以后直接创建工程,用国产工具McuStudio做,McuStudio支持任何内核任何厂家的芯片,希望大家有
    发表于 10-29 17:15

    关于“实时基准对比测量”与AI再探讨

    qqxjyxjy清风:关于“实时基准对比测量”我还想多问句。 AI: 已深度思考(用时 14 秒) AI: 好的,用户之前详细讨论了用实时基准对比
    的头像 发表于 10-14 17:39 372次阅读

    登顶!华为OceanStor A系列存储再登MLPerf全球性能之巅

    2025年8月5日,全球权威AI性能评测组织公布最新MLPerf® Storage v2.0基准测试结果,华为OceanStor A系列存储联合济南超级计算技术研究院(简称“JNIST”)斩获佳绩
    的头像 发表于 08-07 14:02 603次阅读

    如何在Visual Studio 2022中运行FX3吞吐量基准测试工具

    我正在尝试运行 John Hyde 的书“SuperSpeed by Design”中的 FX3 吞吐量基准测试工具。 但是,我面临些困难,希望得到任何指导。 具体来说,我正在使用 Visual
    发表于 05-13 08:05

    一款入耳式耳机的仿真与分析

    电子发烧友网站提供《一款入耳式耳机的仿真与分析.pdf》资料免费下载
    发表于 04-22 15:39 5次下载

    如何精准选取和校准量水堰计基准值?3步搞定测量误差!

    、为什么基准值校准如此重要?量水堰计通过测量水位变化值(△L)来推算流量,而△L的计算公式为:△L=K×(实时测量值F-基准值F₀)
    的头像 发表于 04-15 16:27 542次阅读
    如何精准选取和校准量水堰计<b class='flag-5'>基准</b>值?3步搞定<b class='flag-5'>测量</b>误差!

    1.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越

    与第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,英特尔® 至强® 6性能核处理器在本次测试的六个
    的头像 发表于 04-07 10:58 524次阅读

    告别复杂操作:一款在树莓派上测试操作系统的免费工具

    BalenaEtcher是一款有趣的免费工具,可用于创建可启动的SD卡和USB驱动器。我经常用它来在我的RaspberryPi上测试新的操作系统,但你也可以用它来安装新的Linux发行版。它通常比
    的头像 发表于 03-25 09:38 1013次阅读
    告别复杂操作:<b class='flag-5'>一款</b>在树莓派上测试操作系统的免费<b class='flag-5'>工具</b>!

    国产电压基准源替换RFE3012应用于测试测量设备

    国产电压基准源替换RFE3012应用于测试测量设备
    的头像 发表于 03-06 10:43 655次阅读
    国产电压<b class='flag-5'>基准</b>源替换RFE3012应用于测试<b class='flag-5'>测量</b>设备

    一款电容型高频介电常数测量、非接触式感知的低成本土壤温湿度传感器-MSE

    低成本土壤温湿度传感器 - MSE(Minyuan Soil Economical)是一款电容型高频介电常数测量、非接触式感知的智能传感器,适用于土壤含水率、温度的检测。
    的头像 发表于 02-14 09:41 727次阅读
    <b class='flag-5'>一款</b>电容型高频介电常数<b class='flag-5'>测量</b>、非接触式感知的低成本土壤温湿度传感器-MSE

    经久不衰的数据可视化工具

    、图形等形式展示,使数据更易于理解与分析。本文将深入探讨数据可视化工具的概念、种类及其应用,同时,我们将推荐一款高效好用的数据可视化工具——FineBI,帮助您在选择数据可视化工具时作
    发表于 01-19 15:24

    一款Cursor开源替代工具之Roo-Cline

    本文将介绍一款 Cursor 的开源替代工具。 Roo-Cline 是个在 IDE 中运行的自主编码 Agent,属于 Cline 的分支,针对速度和灵活性进行了优化,主要特点如下: 命令、写入
    的头像 发表于 01-09 10:27 5955次阅读
    <b class='flag-5'>一款</b>Cursor开源替代<b class='flag-5'>工具</b>之Roo-Cline

    使用ADS1220设计一款电路用来采集个电阻桥式传感器,使用内部的2.048V基准作为基准电压?

    请教个问题。我使用ADS1220设计一款电路用来采集个电阻桥式传感器。设计的时候我想使用内部的2.048V基准作为基准电压,以下为电路
    发表于 01-06 06:00

    MLCommons推出AI基准测试0.5版

    开放式机器学习工程联盟 MLCommons 在美国加州当地时间公布推出适用于消费类 PC 的 AI 性能的 MLPerf Client 基准测试的 0.5 版,这是该测试的第个公开版本
    的头像 发表于 12-12 16:47 1222次阅读