0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD处理器和加速器全面助力人工智能 (AI) 训练与高性能计算

AMD中国 来源:AMD中国 作者:AMD中国 2022-07-03 15:46 次阅读

根据世界经济论坛2022年《全球风险报告》显示,“气候行动失败”是未来5-10年内全球最主要的长期风险之一。这不仅是未来的挑战,而且相关问题已经显现。作为微处理器设计厂商,在技术飞速发展的今天,我们有责任保护地球,也有机会帮助大家节约能源和减少温室气体排放。

AMD面向未来绘制了更加宏伟的蓝图,在25x20能效计划实施的基础上,制定了一项新的能效目标——30x25目标。从2020年到2025年,将AMD 处理器和加速器的能效提高 30 倍,全面助力人工智能 (AI) 训练与高性能计算。我们的目标相当于到 2025 年将计算的能耗减少97%。如果全球所有的人工智能和高性能计算服务器节点都能实现相似的提升,相对于行业基准趋势,从2021年到2025 年,最多可节省510亿千瓦时的电力,相当于62 亿美元的节电量和 6 亿棵生长 10 年的树木的碳减排量。

f12ccb34-ee2d-11ec-ba43-dac502259ad0.png

AMD EPYC(霄龙)处理器和AMD Instinct 加速器

AMD EPYC(霄龙) 7003系列产品是性能出类拔萃的x86服务器处理器,其不仅能带来出色的性能,而且能够充分降低数据中心运营对环境的影响,进一步降低能源成本,同时推动实现公司的可持续发展目标。

经过全新设计的AMD Instinct 加速器,可以轻松应对高性能计算和人工智能工作负载,无论是单服务器解决方案,还是世界先进的超级计算机,AMD Instinct 系列加速器可为各种规模的数据中心带来卓越性能。全新的AMD Instinct 加速器采用创新性 AMD CDNA 2 架构、AMD Infinity Fabric 技术以及先进的封装技术,助力百亿亿级计算系统加速探索发现,让科学家能够轻松应对各种紧迫的挑战。

基于AMD EPYC(霄龙)CPU和AMD Instinct加速器,AMD可以为AI训练和HPC应用程序中那些世界上增长最快的计算需求而服务。这些应用程序可用于:

-气候预测、基因组学和药物发现等方面的科学研究

-语音识别、语言翻译和AI神经网络训练等

我们相信通过架构创新,可以为这些及其他加速计算节点的应用程序优化能源。

接近2022年中期,AMD正朝着实现30x25的目标前进,仅通过使用基于一颗第三代AMD EPYC CPU和四个AMD Instinct MI250x GPU的加速节点,便可以在2020年的基准水平之上提高6.79倍能效。我们的进度报告采用的测量方法2经过著名的计算能效研究专家Jonathan Koomey博士的验证。

f1caeb2a-ee2d-11ec-ba43-dac502259ad0.png

保护地球人人有责,AMD将持续通过提高产品能效,助力可持续发展的低碳经济加速转型,实现节约能源和减少温室气体排放的目标,对全社会产生积极的作用。

1、该情景基于全球所有人工智能和高性能计算服务器节点实现 AMD 30 倍目标的提升,相对于 2020 年的基线趋势,从 2021 年到 2025 年,累计节省高达 514 亿千瓦时的电力。假设每千瓦时 0.12 美分 x 514 亿千瓦时 = 620 万美元。CO2e 排放量(公吨)以及植树当量的估算值来自 2021 年 12 月 1 日将节电量输入美国 EPA 温室气体计算器后得出的结果。https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator

2、 AMD 在四加速器 CPU 主机配置中对用于人工智能训练和高性能计算的高性能 AMD CPU 和 GPU 加速器进行计算节点效能功耗比测量。

- 高性能计算工作负载的性能基于具有 4k 矩阵大小的 Linpack DGEMM kernel FLOPS。人工智能训练的性能基于在 4k 矩阵上运行的低精度训练浮点数学 GEMM kernel,例如 FP16 或 BF16 FLOPS。

-功耗基于一个典型的加速计算节点(包括 CPU 主机 + 内存以及 4 个 GPU 加速器)的热设计功耗 (TDP)。

为了使该目标与全球能源使用量密切相关,AMD 与 Koomey Analytics 合作评估可用的研究和数据,其中包括 GPU 高性能计算 (HPC) 和机器学习 (ML) 等特定领域数据中心能源使用效率 (PUE)。AMD CPU 和 GPU 节点功耗包含特定领域使用(活动与空闲)百分比,并乘以 PUE 来确定实际总能耗,从而能够计算出效能功耗比。

能耗基准采用 2015-2020 年数据中观察到的行业单位作业能耗提升率,并根据这一变化率推测至 2025 年。AMD 目标趋势线(表 1)显示到 2025 年实现能效提升 30 倍目标所需的指数级提升。AMD 实际发布产品(表 2)是表 1 AMD 目标能效提升的来源。

2020 年到 2025 年各领域单位作业能耗提升值是由全球预计销量加权得出(根据 IDC - Q1 2021 TrackerHyperion- Q4 2020 Tracker,Hyperion 高性能计算市场分析,2021 年 4 月)。将这些销量换算到机器学习训练和高性能计算市场,会得出如下表 3 所示的节点量。然后将这些节点量乘以 2025 年各计算领域的典型能源消耗 (TEC)(表 4),得出一个有意义的全球实际能源使用提升的总体指标。

f1ed319e-ee2d-11ec-ba43-dac502259ad0.png



原文标题:AMD EPYC(霄龙) 处理器和AMD Instinct 加速器为高能效添能助力

文章出处:【微信公众号:AMD中国】欢迎添加关注!文章转载请注明出处。


审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    741

    浏览量

    36588
  • AMD处理器
    +关注

    关注

    2

    文章

    58

    浏览量

    12888
  • 人工智能
    +关注

    关注

    1776

    文章

    43764

    浏览量

    230551

原文标题:AMD EPYC(霄龙) 处理器和AMD Instinct 加速器为高能效添能助力

文章出处:【微信号:AMD中国,微信公众号:AMD中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Hailo获1.2亿美元新融资,首发AI加速器Hailo-10,助力边缘设备实现生成式人工智能

    技术引入边缘计算领域,为行业发展注入新动力。 边缘人工智能处理器的领先芯片制造商Hailo近日宣布C轮融资再获1.2亿美元投资。与此同时,Hailo还推出创新型Hailo-10高性能
    的头像 发表于 04-03 11:57 100次阅读

    瑞萨发布下一代动态可重构人工智能处理器加速器

    瑞萨最新发布的动态可重构人工智能处理器(DRP-AI加速器,在业界引起了广泛关注。这款加速器拥有卓越的10 TOPS/W高功率效率,相比传
    的头像 发表于 03-08 13:45 243次阅读

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器AI Accelerator),是一种专为执行机器学习和深度学习任务而设计
    的头像 发表于 02-23 00:18 4060次阅读

    英伟达、AMD在2024年继续全力冲刺人工智能加速器市场

    英伟达、AMD在2024年继续全力冲刺人工智能AI加速器市场。
    的头像 发表于 01-08 17:27 768次阅读
    英伟达、<b class='flag-5'>AMD</b>在2024年继续全力冲刺<b class='flag-5'>人工智能</b><b class='flag-5'>加速器</b>市场

    AMD Instinct加速器AMD EPYC处理器为Microsoft带来全新AI计算能力

    AMD Instinct加速器将为针对AI进行优化的全新Microsoft Azure虚拟机系列提供动力 — — 第四代AMD EPYC处理器
    的头像 发表于 12-04 13:54 364次阅读

    PCIe在AI加速器中的作用

    从线上购物时的“猜你喜欢”、到高等级自动驾驶汽车上的实时交通信息接收,再到在线视频游戏,所有的这些都离不开人工智能AI加速器AI加速器
    的头像 发表于 11-18 10:36 1214次阅读
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>中的作用

    Hailo拓展Hailo-8人工智能加速器产品阵列,助力边缘设备实现高性能人工智能

    摘要:新的Hailo-8 Century和Hailo-8L AI加速器通过广泛的人工智能平台扩展了Hailo-8产品阵列,可在入门级和高要求边缘设备中实现高性能人工智能。 边缘
    的头像 发表于 11-07 10:16 286次阅读

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-
    发表于 09-07 06:15

    人工智能中的处理器如何选择

    处理器助力打造高能效、高性能AI 推理应用,是其理想的替代方案,同时也是用于 AI 训练和大
    的头像 发表于 09-05 10:58 704次阅读
    <b class='flag-5'>人工智能</b>中的<b class='flag-5'>处理器</b>如何选择

    AI芯片和处理器的区别

      AI芯片是一种专门用于人工智能计算的集成电路。相较于传统的通用微处理器AI芯片具备更优秀的高性能
    的头像 发表于 08-08 16:43 1321次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展
    发表于 08-04 07:25

    GAUDIR HL-2000处理器介绍

    。HL-205符合oCP OAM(开放式计算加速器夹层)规范。 GAUDIR旨在加速各种AlTraining工作负载,如图像分类、对象检测、自然语言处理、文本到语音、情感分析、推荐系
    发表于 08-04 07:23

    HLS-1Hin人工智能训练系统

    卡,一个4.0代PCle交换机,由您选择的外部主机CPU管理。HL-205符合oCP OAM(开放式计算项目加速器模块)规范。Eachcard包含Gaudi HL-2000处理器,该处理器
    发表于 08-04 06:06

    智能网卡简介及其在高性能计算中的作用

    最先进的人工智能模型在不到五年的时间内经历了超过 5,000 倍的规模扩展。这些 AI 模型严重依赖复杂的计算和大量内存来实现高性能深度神经网络 (DNN)。只有使用 CPU、GPU
    发表于 07-28 10:10

    AI 人工智能的未来在哪?

    人工智能AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI
    发表于 06-27 10:48