0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款基准测量工具的雏形——MLPerf

zhKF_jqr_AI 来源:未知 作者:李倩 2018-05-09 05:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI基准大战已经开始。

5月2日,由各大领先的科技公司和大学组成的团队发布了一款基准测量工具的雏形——MLPerf,其目的是测量各种AI框架和芯片中不同机器学习任务的训练速度和推理时间。

在这一任务的参与者中,有许多知名公司和大学,其中既有谷歌、英特尔、百度、AMD这样的巨头,也有一些AI硬件创企,例如SambaNova和Wave Computing。同时还有世界顶尖大学:斯坦福大学、哈佛大学、加州大学伯克利分校、明尼苏达大学和多伦多大学。

MLPerf的诞生是小部分公司自我组织进行产品对比的结果。上周,RiseML的博客对比了谷歌的TPUv2和NVIDIA V100的性能。5月4日,英特尔发表博客,展示了为机器翻译所用的RNN的数据,题目称“英特尔Xeon大规模处理器表现出令人惊讶的推理性能”。这种对比会给人一些参考,但通常也会让人觉得供应商自认为比其他厂商优越。而一个标准化的基准可以让测试简单化,得到人们想要的结果。

除此之外,想要跟踪记录各大公司和创企的芯片制造以及软件更新是非常困难的,更不要说在市场的夸大作用下还能进行真实评估了。某些芯片厂商经常承诺达到了革命性的提速,但从来不透露产品规格(咳咳,英特尔注意)。

在很长一段时间内,人们都在讨论是否有必要设立一个有意义的AI基准。支持者认为,标准的缺失限制了AI的应用。MLPerf的推动者之一吴恩达表示:“AI正在改变多个行业,但是为了发挥它最大的潜能,我们仍需要更快的硬件和软件。”支持者们希望基准的确立能帮助AI开发者创造出更好的产品,让使用者充分了解所需产品。

MLPerf声明它的基础目标是:

用公平、有帮助的测量方法加速机器学习的发展

对各竞争系统进行公平对比,以鼓励机器学习的发展

保证让所有人都能参与基准评比

既服务于商业群体,也服务于研究领域

基准要可复制,确保结果的可靠

MLPerf是仿效过去其他的基准测试,例如SPEC(The Standard Performance Evaluation Corporation)。该基准于1988年由一家计算公司的财团提出,它有效提高了通用计算的速度。而MLPerf结合了此前许多基准的标准,例如SPEC的程序,SORT用于对比和培育新思想的方法,DeepBench对软件应用的评估,以及DAWNBench的精确度标准。

Intersect360的CEO Addison Snell注意到:“现在许多企业都想部署AI,所以推出一套中立的基准非常重要,尤其在多种技术争相竞争的时代。但是,AI领域多种多样,我不禁怀疑是否最后只剩一种标准。想想五年前人们对大数据和分析的热情,尽管人人都想定义它,但是至今也没有一个通用的衡量标准。我认为AI也会面临这种情况。”

Hyperion研究公司的高级研究副总裁Steve Conway认为:“MLPerf是一款有用、优秀的工具。因为近些年一直缺少针对买卖双方的真正标准。这个基准似乎是针对人工智能早期问题指定的,大多都是有边界问题。后来我们需要其他标准,因为人工智能开始出现了无边界的问题。有边界的问题比较简单,如语音、图像识别或游戏。而无界线问题包括癌症诊断和阅读磁核共振报告;现在,人工智能能为复杂问题提出推荐方案了。“

MLPerf现已在GitHub上发布,但仍处于初期阶段,为α版本,未来将在许多方面得到改进。目前,MLPerf套件上能进行测试的有七个方面:

每个参考都提供了以下内容:至少在一个框架中实现模型的代码;一个可在container中运行基准测试的Dockerfile;一个可下载适当数据集的脚本;一个可以运行并计时模型训练的脚本;数据集、模型和机器设置的文档记录。

根据GitHub上的记录,基准测试已经在以下配置中进行测试:

16个CPU,一个NVIDIA P100

Ubuntu 16.04,包括具有NVIDIA支持的docker

600GB的硬盘(尽管很多基准要求的硬盘更小)

在这样一个年轻的市场,如果有更多的AI基准出现,那将变得很有趣。例如,斯坦福大学是MLPerf的其中一个成员,他最近运行了第一个DAWNBenchv1深度学习结果。

斯坦福报道说:“2018年4月20日表示第一个衡量深度学习端到端性能的基准和竞争的开始:测量深度学习任务达到最佳精确度时所需要的时间和成本是多少,以及在这个最先进的精确度水平下进行推理的成本是多少。对端到端性能的关注提供了一种客观的方法,用于对计算框架、硬件、优化算法、超参数设置以及影响性能的其他因素进行标准化。”

DAWN的一个竞争对手——fast.ai(一家提供人工智能培训和开发人工智能软件工具的初创公司)在HPCwire上宣传它的产品性能。所以这些基准很重要,应该认真对待,像MLPerf这样的工具能帮助清除AI产品对比中的干扰因素。

“基准提高了产品可信度,并展示了更好的性能或能带来更多益处的地方。如果你正在考虑为一个数百万美元的项目使用硬件加速器或软件框架,那么你会不会更喜欢’榜上有名’的产品?”谷歌工程师Peter Mattson表示。

MLPerf希望用可复制的、公平可靠的基准测量方法来推动机器学习行业和研究的发展。产品之间的对比还应促进供应商和学者之间的竞争。同时还应该为没人提供做实验的条件,让更多人参与其中。

Mattson补充道:“基准在短期内很重要,因为不管是对研发公司还是想要购买产品的公司来说,硬件是一项巨大的投资。长期来看,基准有助于研究者和供应商将性能作为共同的发展目标,这样才能解锁更多机器学习的能量,造福更多人。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303100
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137425
  • 深度学习
    +关注

    关注

    73

    文章

    5614

    浏览量

    124759
  • MLPerf
    +关注

    关注

    0

    文章

    37

    浏览量

    994

原文标题:MLPerf——机器学习新基准能否驱动AI向前?

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一款工具管理更自由的RFID智能工具

    CK-B1A是一款采用RFID技术的双肩工具背包,在设计上没有改变传统工具包的使用方式,但在内部增加了识别能力。在人员准备离开现场时,通过键锁定,
    的头像 发表于 05-21 16:15 574次阅读
    <b class='flag-5'>一款</b>让<b class='flag-5'>工具</b>管理更自由的RFID智能<b class='flag-5'>工具</b>包

    DLP-IO20-G:一款功能强大的USB数据采集模块

    DLP-IO20-G:一款功能强大的USB数据采集模块 在电子工程师的日常工作中,数据采集模块是不可或缺的工具。今天,我们要介绍一款名为DLP-IO20-G的USB数据采集模块,它具有众多实用的功能
    的头像 发表于 05-14 12:05 247次阅读

    ADAM - 4572:一款强大的1端口Modbus网关

    ADAM - 4572:一款强大的1端口Modbus网关 在工业自动化和通信领域,Modbus网关扮演着至关重要的角色,它能够实现不同设备之间的数据通信和协议转换。今天,我们就来详细介绍一款性能出色
    的头像 发表于 05-12 15:50 112次阅读

    解析AD8582:一款高性能双12位DAC的深度剖析

    解析AD8582:一款高性能双12位DAC的深度剖析 在电子设计领域,数模转换器(DAC)是连接数字世界和模拟世界的关键桥梁。今天,我们就来深入探讨一款由Analog Devices推出的双12位
    的头像 发表于 04-14 16:25 144次阅读

    AD7713:一款强大的信号调理 ADC 的深度剖析

    AD7713:一款强大的信号调理 ADC 的深度剖析 引言 在电子设计领域,对于低频率测量应用而言,一款性能卓越的模拟前端至关重要。AD7713 作为 Analog Devices 推出的一款
    的头像 发表于 04-03 10:35 216次阅读

    AD7607:一款高性能8通道DAS的深度解析

    : AD7607BSTZ.pdf 产品概述 AD7607是一款14位同步采样模数数据采集系统,它内置了模拟输入箝位保护、二阶抗混叠滤波器、跟踪保持放大器、14位电荷再分配逐次逼近型模数转换器(ADC)、灵活的数字滤波器、2.5 V基准电压源、
    的头像 发表于 03-30 10:05 332次阅读

    深度解析TMP401:一款强大的数字温度传感器

    Instruments),具备诸多出色的特性,广泛应用于多个领域。 文件下载: tmp401.pdf 、TMP401概述 TMP401是一款双通道数字温度传感器,它将本地裸片温度测量通道和远程结温度
    的头像 发表于 02-26 09:45 377次阅读

    TSM103W:一款多功能双运放与电压基准芯片的深度解析

    TSM103W:一款多功能双运放与电压基准芯片的深度解析 在电子设计领域,选择合适的运算放大器和电压基准芯片对于系统的性能和成本控制至关重要。今天,我们就来详细探讨
    的头像 发表于 01-27 14:25 644次阅读

    [工具讨论] 如果有一款国产图形化配置工具STM32Cube,支持所有内核和厂商MCU,你会用吗?

    涉及多家厂商芯片时,要在多个工具间切换 如果有一款这样的工具 我们想和大家讨论个假设性问题: 如果有一款国产的图形化配置
    发表于 01-26 10:30

    请问CW32系列MCU的调试工具是哪一款

    CW32系列MCU的调试工具是哪一款
    发表于 01-07 07:11

    Postman:一款被忽视的强大的API开发和测试工具

    Postman的发展史 Postman是一款强大的API开发和测试工具,它于2012年创建,最初是作为个Chrome浏览器插件推出的。由于其大受欢迎,随后推出了web网页版和桌面客户端。现在
    的头像 发表于 11-26 14:11 574次阅读

    灵动微电子最新最火热的一款芯片推荐

    希望找一款灵动微电子最新最火热的一款芯片,我们想做个图形化的界面配置,供大家以后直接创建工程,用国产工具McuStudio做,McuStudio支持任何内核任何厂家的芯片,希望大家有
    发表于 10-29 17:15

    关于“实时基准对比测量”与AI再探讨

    qqxjyxjy清风:关于“实时基准对比测量”我还想多问句。 AI: 已深度思考(用时 14 秒) AI: 好的,用户之前详细讨论了用实时基准对比
    的头像 发表于 10-14 17:39 700次阅读

    登顶!华为OceanStor A系列存储再登MLPerf全球性能之巅

    2025年8月5日,全球权威AI性能评测组织公布最新MLPerf® Storage v2.0基准测试结果,华为OceanStor A系列存储联合济南超级计算技术研究院(简称“JNIST”)斩获佳绩
    的头像 发表于 08-07 14:02 976次阅读

    如何正确使用是德示波器MSOX3054T进行高速信号测量

    是德示波器MSOX3054T是一款功能强大的电子测量工具,适用于高频、高速信号的精确分析与测量。在通信、电子工程、嵌入式系统调试等领域,正确使用该设备能够有效提升测试效率与准确性。本文
    的头像 发表于 07-02 14:24 986次阅读
    如何正确使用是德示波器MSOX3054T进行高速信号<b class='flag-5'>测量</b>