0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

不要相信报告的深度学习TOPS指标

萧蔼晨 来源:njlbdz 作者:njlbdz 2022-07-15 16:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能公司通常会关注一个标准:每秒更多 tera 操作 (TOPS)。不幸的是,当硅制造商宣传他们的 TOPS 指标时,他们并没有真正提供准确的指导。在大多数情况下,被炒作的数字并不是真正的 TOPS,而是峰值 TOPS。换句话说,你认为你在卡中获得的 TOPS 数字实际上是芯片在一个非常完美的世界中表现的最佳情况。

我将讨论行业因错误标记性能指标而造成的问题,并解释用户如何独立评估现实世界的 TOPS。

人造上衣与真上衣

AI 应用程序开发人员通常会通过衡量芯片制造商发布的 TOPS 性能数据是否足以支持他们的项目来开始进行尽职调查。

假设您尝试在 U-Net 神经网络上以 10 fps(每秒帧数)重新制作全高清图像。由于 U-Net 操作每张图像需要 3 TOPS,简单的数学表示您需要 30 TOPS 才能以所需的 FPS 完成项目。因此,在购买芯片时,您会假设声称运行 50、40 甚至 32 TOPS 的卡对项目来说是安全的。在一个完美的世界里,是的,但你很快就会发现这张卡很少能达到广告的数字。而且我们不是在谈论仅仅几滴TOPS;计算效率可低至 10%。

虽然调整神经网络以从卡中获得更好的性能当然是可能的,但您几乎不可能接近供应商列出的峰值 TOPS。试图获得 60% 或 70% 的计算效率将耗费大量时间。如果神经网络发生任何变化,您将不得不回到原点重新优化所有内容——但它甚至可能不适用于您的应用程序。这个问题对于小批量处理尤其明显;你会很幸运能获得超过 15% 的峰值 TOPS。

计算效率

此时,您可能想知道如何计算真正的 TOPS。这很简单!

要了解特定卡将提供多少真实 TOPS,您首先需要确定该卡的计算效率。理想情况下,这可以通过简单地在目标卡上运行所需的神经网络来完成。但是,您可能没有该卡。您仍然可以通过查看供应商的营销数据的详细信息来进行估算。通常可以获得像 ResNet50(或类似的)这样的神经网络的性能数据。假设这是一个典型的 ResNet50 实现,您可以找到计算单个图像的每秒千兆操作数(GOPS,而不是 TOPS)。然后,只需将其乘以供应商宣传的每秒图像数 (IPS),瞧!您就有了更真实的 TOPS 或“真实”TOPS。

效率只是 real 除以峰值 TOPS 的比率,或者:

峰值 TOPS x 计算效率 = 实际 TOPS

这个公式使用户能够在购买任何东西之前比较卡在运行神经网络时的真实效率。您可以使用所需的 TOPS 重用效率,看看它是否符合您的需求。虽然功率和批量大小等因素会影响结果,但如果您知道卡的效率,则此公式可以很好地估计其在实际用例中的实际性能。当然,供应商发布的神经网络的 IPS 仍然可以质疑,但至少估计比比较你真正需要的 TOPS 和一张卡的峰值 TOPS 更好。

还值得注意的是,这不仅仅是 GPU 问题。大多数专业 ASIC 的实际效率非常低,即使他们的营销促进了高效率。只需使用 IPS、已知的网络 GOPS 和简单的乘法运算,您就可以了解一个真实的数字。

高效的替代品

尽管 GPU 和 ASIC 都在效率和性能上苦苦挣扎,但有一种替代解决方案不涉及这些芯片中的任何一个。

2020 年 10 月的 MLPerf 结果表明,与推理加速相结合的 FPGA 比其他替代方案的效率要高得多,因此可以更接近其他芯片制造商宣传的最高 TOPS 数。

pYYBAGLO9LqAb-1dAACNdthL3nw757.jpg


比较不同架构下每个发布的 TOPS 数据的每秒帧数 (FPS)(来源:Mipsology)

FPGA 不仅在计算方面更高效,而且在计算硅片使用方面也更高效。从本质上讲,这些卡“事半功倍”,从而以一小部分成本获得更好的神经网络性能。

值得重复一遍:买家不应该因为 TOPS 营销炒作而堕落。这是一个夸大的性能数字,大多数神经网络在现实条件下永远不会看到。相反,利用这个公式:

峰值 TOPS x 计算效率 = 实际 TOPS

这样做将帮助您快速、轻松、准确地将您的性能需求与芯片的实际性能进行比较,而不是任何夸大的供应商声称。

——Ludovic Larzul 是 Mipsology 的创始人兼首席执行官。



审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106884
  • AI
    AI
    +关注

    关注

    90

    文章

    38296

    浏览量

    297352
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 74次阅读

    算力高达 275 TOPS!EC-AGXOrin 边缘计算主机

    采用NVIDIAJetsonAGXOrin(64GB)模组,算力可达275TOPS,支持多种AI大模型和深度学习框架。支持22路1080P视频解码。配置工业级全铝合金外壳、两个散热风扇设计,7×24
    的头像 发表于 10-21 16:33 1324次阅读
    算力高达 275 <b class='flag-5'>TOPS</b>!EC-AGXOrin 边缘计算主机

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概
    的头像 发表于 09-10 17:38 723次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    深度学习对工业物联网有哪些帮助

    深度学习作为人工智能的核心分支,通过模拟人脑神经网络的层级结构,能够自动从海量工业数据中提取复杂特征,为工业物联网(IIoT)提供了从数据感知到智能决策的全链路升级能力。以下从技术赋能、场景突破
    的头像 发表于 08-20 14:56 790次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 3950次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    嵌入式AI技术之深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做一次抽象,多层神经网络构成深度学习的框架,可以深度理解数据中所要表示的规律。从原理上看,使用
    的头像 发表于 04-02 18:21 1298次阅读

    用树莓派搞深度学习?TensorFlow启动!

    介绍本页面将指导您在搭载64位Bullseye操作系统的RaspberryPi4上安装TensorFlow。TensorFlow是一个专为深度学习开发的大型软件库,它消耗大量资源。您可以在
    的头像 发表于 03-25 09:33 986次阅读
    用树莓派搞<b class='flag-5'>深度</b><b class='flag-5'>学习</b>?TensorFlow启动!

    在OpenVINO™工具套件的深度学习工作台中无法导出INT8模型怎么解决?

    无法在 OpenVINO™ 工具套件的深度学习 (DL) 工作台中导出 INT8 模型
    发表于 03-06 07:54

    如何排除深度学习工作台上量化OpenVINO™的特定层?

    无法确定如何排除要在深度学习工作台上量化OpenVINO™特定层
    发表于 03-06 07:31

    SLAMTEC Aurora:把深度学习“卷”进机器人日常

    在人工智能和机器人技术飞速发展的今天,深度学习与SLAM(同步定位与地图构建)技术的结合,正引领着智能机器人行业迈向新的高度。最近科技圈顶流DeepSeek简直杀疯了!靠着逆天的深度学习
    的头像 发表于 02-19 15:49 736次阅读

    军事应用中深度学习的挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响了军事发展趋势,导致战争形式和模式发生重大变化。本文将概述
    的头像 发表于 02-14 11:15 835次阅读

    BP神经网络与深度学习的关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Backpropagation Neural Network
    的头像 发表于 02-12 15:15 1383次阅读

    AI自动化生产:深度学习在质量控制中的应用

    随着科技的飞速发展,人工智能(AI)与深度学习技术正逐步渗透到各个行业,特别是在自动化生产中,其潜力与价值愈发凸显。深度学习软件不仅使人工和基于规则的算法难以胜任的大量生产任务得以自动
    的头像 发表于 01-17 16:35 1236次阅读
    AI自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制中的应用

    百度深度学习专利申请量位列全球第一

    近日,全球领先的知识产权解决方案提供商Questel,发布全球深度学习专利全景报告
    的头像 发表于 01-15 09:29 830次阅读

    广电计量新年首篇深度研究报告出炉

    新年伊始,广电计量首篇深度研究报告出炉,公司凭借全面发展的企业实力和资本市场的优异表现在新的一年获得资本市场的认可。
    的头像 发表于 01-03 11:31 1071次阅读