0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔®Stratix®10NX FPGA为AI工作负载提供显著改进

英特尔FPGA 来源:英特尔FPGA 作者:英特尔FPGA 2021-05-18 10:19 次阅读

对许多 AI 工作负载而言,完全实现 GPU 厂商所宣称的计算容量并非易事。即使对一般矩阵乘法 (GEMM) 等高度并行计算而言,GPU 也只能在某些大矩阵条件下实现高利用率。FPGA 提供了不同的 AI 优化硬件方法。

不同于 GPU,FPGA 提供了独特的细粒度空间可重配置性,支持将每个功能的输出直接传送至相关功能的输入,以满足其需求。该方法可提升灵活性,支持特定的 AI 算法和应用特征,从而提高可用 FPGA 计算功能的利用率,进而提升性能。专用软核处理器(也称为叠加)支持与处理器类似的 FPGA 编程,即 FPGA 编程完全通过软件工具链进行。这种编程方法可消除 FPGA 特定的硬件复杂性问题。

我们对全新英特尔 Stratix 10 NX FPGA 进行了首次性能评估,并将其与 Nvidia T4 和 V100 GPU 进行了比较。此次性能评估采用了 2020 年 IEEE 国际现场可编程技术会议中一篇论文所公布的结果,考察了一系列实时推理工作负载的运行表现。我们使用被称为神经处理单元 (NPU) 的软核 AI 处理器叠加实现方案部署了支持 FPGA 的工作负载,工具链支持以软件为中心的 FPGA 编程,无需调用 FPGA 特定硬件 EDA 工具。

结果显示,相比于测试的 GPU,英特尔 Stratix 10 NX FPGA 能够为这些 AI 工作负载提供显著改进的利用率和性能。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18210

    浏览量

    221928
  • FPGA
    +关注

    关注

    1599

    文章

    21278

    浏览量

    592839
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4402

    浏览量

    126562
  • AI
    AI
    +关注

    关注

    87

    文章

    26352

    浏览量

    263945

原文标题:英特尔®Stratix®10 NX FPGA为AI工作负载提供显著改进的利用率和性能

文章出处:【微信号:英特尔FPGA,微信公众号:英特尔FPGA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔欲分离Altera,向FPGA市场投下“深水炸弹”?

    电子发烧友网报道(文/黄山明)近日,英特尔公开宣布,将剥离其可编程解决方案部门(PSG)。从明年1月1日起,PSG作为一个独立的实体机构运营。而PSG是英特尔旗下负责开发Agilex、Stratix
    的头像 发表于 10-09 00:21 1932次阅读

    为何高端FPGA都非常重视软件

    和实际工作负载调配变得更加简单和快捷。 英特尔通过OpenVINO工具包的英特尔发行版向AI开发人员的One API采用了类似的方法(实
    发表于 03-23 16:48

    借助英特尔® QAT从而显著提升网络和存储应用的性能

    全新第四代和第五代英特尔® 至强® 可扩展处理器内置英特尔® 数据保护与压缩加速技术(英特尔® QAT),可通过卸载计算密集型工作负载来降低
    的头像 发表于 03-18 16:25 215次阅读
    借助<b class='flag-5'>英特尔</b>® QAT从而<b class='flag-5'>显著</b>提升网络和存储应用的性能

    英特尔旗下FPGA公司Altera正式亮相

    日前,英特尔 FPGA Vision线上直播中发布,将英特尔编程解决方案事业部 (PSG) 作为独立的FPGA公司——Altera。
    的头像 发表于 03-18 14:11 152次阅读

    英特尔:2025年全球AIPC将超1亿台占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    第五代英特尔至强,以卓越性能为多元化工作负载“保驾护航”

    第五代英特尔至强铂金 8592+处理器凭借更优化的SoC,三倍更大缓存和更快内存,在运行诸多工作负载时具备与众不同的优势,尤其是AI工作
    的头像 发表于 02-28 09:50 196次阅读

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔酷睿14代处理器系列发布,Arrowlake/LunarLake24年问世

    处理器英特尔
    looger123
    发布于 :2024年01月10日 17:44:38

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    英特尔Agilex FPGA的优势和特性

    英特尔推出全新英特尔 Agilex 7 FPGA,以支持在英特尔 DevCloud 中运行 oneAPI 基础工具套件(基础套件)工作
    的头像 发表于 09-08 09:09 646次阅读

    英特尔SmartNIC助力加速通信与网络工作负载的方法介绍

    英特尔® FPGA SmartNIC N6000-PL 平台是第三代英特尔® SmartNIC,提供 2 个 100 GbE 端口。
    发表于 08-18 17:48 1194次阅读
    <b class='flag-5'>英特尔</b>SmartNIC助力加速通信与网络<b class='flag-5'>工作</b><b class='flag-5'>负载</b>的方法介绍

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用
    发表于 08-04 06:34

    英特尔® AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力

    达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图 英特尔
    的头像 发表于 07-08 14:15 321次阅读
    <b class='flag-5'>英特尔</b>® AMX 加速<b class='flag-5'>AI</b>推理性能,助阿里电商推荐系统成功应对峰值<b class='flag-5'>负载</b>压力