0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮宣布为可重构AI计算发展计划参与者提供最新FPGA加速卡支持

倩倩 来源:IT168 2020-07-25 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,浪潮宣布为可重构AI计算发展计划参与者提供最新FPGA加速卡支持。参与该计划的高校将FPGA开源AI框架TF2应用于AI科研或应用并取得创新成果,并承诺将优化后代码反馈回TF2开源社区,即可获赠最新FPGA加速卡。同时,参与该计划的商业用户也可获得较大程度的FPGA加速卡购买优惠。该计划可在TF2开源社区(网址:https://github.com/TF2-Engine/TF2)进行申请。目前南开大学等知名高校已加入该计划。

FPGA技术具有可定制性、低延迟和高性能功耗比等优势,已成为诸多AI用户部署推理应用的选择。但FPGA技术进入到大规模AI业务部署仍旧存在软件编写门槛高、性能优化受限、功耗难以控制等诸多挑战。为了应对这些挑战,浪潮推出了开源的TF2框架。

TF2是全球首个完整方案的FPGA高效AI计算开源框架,可对模型进行压缩、裁剪、量化等优化转换以减少模型计算量,将模型文件自动转化为FPGA目标运行文件,降低FPGA的AI软件实现门槛,通过创新的DNN移位计算技术大幅提升FPGA做推理计算的性能,并有效降低其实际运行功耗,帮助用户快速实现FPGA线上推理。在浪潮F10A FPGA卡上采用FaceNet模型对TF2进行的测试(BatchSize=1)表明,运行TF2后单张图片的计算耗时为0.612ms,提速12.8倍。目前,TF2开源社区已吸引第四范式、快手、上海大学、华大智造、远鉴科技、睿视智觉、华展汇元等多家领先公司或机构加入。

TF2计算加速流程

为了推动TF2社区建设,浪潮推出了可重构AI计算发展计划,为参与者提供F10A、F37X等最新FPGA加速卡支持,鼓励参与者将创新性成果反馈至社区,共同促进FPGA技术的开源开放合作发展,降低高性能AI计算技术门槛,加速AI应用落地。浪潮F10A是目前业界支持OpenCL的最高性能密度的FPGA加速卡,每瓦特性能达到42GFlops,已实现大规模应用部署,适用于数据中心AI推理、边缘高密计算及桌面端应用加速等多种计算环境;浪潮F37X是全球首款集成HBM2的FPGA加速卡,可在75W典型功耗条件下,提供28.1TOPS INT8计算性能。此外,浪潮还将提供针对性的技术培训和服务支持,并定期举行开发者会议和线上公开课,分享最新技术进展和经验成果。

浪潮AI&HPC总经理刘军表示:“视觉、语音识别以及文本、语义理解等人工智能技术正在与各行业融合,以FPGA为代表的可重构计算将在各类线上推理场景中得到更广泛的应用。浪潮希望通过可重构AI计算发展计划促进TF2开源社区发展,同时增进开发者对最新FPGA计算加速技术的熟悉和了解,最大化释放FPGA的计算潜力,加速产业AI化进程。”

浪潮是人工智能计算的领导品牌,AI服务器中国市场份额保持50%以上。并与人工智能领先科技公司保持在系统与应用方面的深入紧密合作,帮助AI客户在语音、语义、图像、视频、搜索、网络等方面取得数量级的应用性能提升。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1663

    文章

    22494

    浏览量

    638983
  • 浪潮
    +关注

    关注

    1

    文章

    490

    浏览量

    25479
  • AI
    AI
    +关注

    关注

    91

    文章

    40974

    浏览量

    302533
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瀚博半导体宣布深度参与百度飞桨黑客松生态活动

    近日,瀚博半导体正式宣布深度参与百度飞桨主办的黑客松生态活动。面向全球开发开放旗下载天系列加速卡开发环境,支持部署百度文心ERNIE-4.
    的头像 发表于 04-11 09:41 588次阅读

    选择AMD Alveo V80加速卡的五大理由

    AMD Alveo V80 加速卡专为需要实时加速的企业数据中心和云服务提供商而设计,它结合了可编程逻辑、片上高带宽内存( HBM )、高速网络核心以及网络直连接口,实现实时性能。A
    的头像 发表于 04-10 14:59 272次阅读

    FPGA硬件加速卡设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纤采集, 信号计算板, 硬件加速卡
    的头像 发表于 02-12 09:52 527次阅读
    <b class='flag-5'>FPGA</b>硬件<b class='flag-5'>加速卡</b>设计原理图:1-基于Xilinx XCKU115的半高PCIe x8 硬件<b class='flag-5'>加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E芯片

    新品 | LLM-8850 Kit,高性能AI加速卡套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    LLM-8850KitLLM-8850Kit是一款面向边缘AI与嵌入式计算场景的高性能AI加速卡套件,由LLM-8850CardAI加速卡
    的头像 发表于 01-30 16:11 1356次阅读
    新品 | LLM-8850 Kit,高性能<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>套件 DinMeter v1.1,1/32DIN标准嵌入式开发板

    昆仑芯R200 AI加速卡技术规格解析

    昆仑芯R200加速卡基于7nm XPU-R架构,在150W功耗下提供256 TOPS INT8算力,侧重高性能推理。配备最高32GB GDDR6内存(512GB/s带宽)及108路视频解码能力,支持
    的头像 发表于 12-14 13:12 1867次阅读
    昆仑芯R200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>技术规格解析

    迈向云端算力巅峰:昆仑芯K200 AI加速卡全面解读

    昆仑芯K200作为云端AI加速卡,在K100架构基础上全面升级。其INT8算力达256 TOPS,配备16GB HBM内存与512GB/s带宽,专为千亿参数大模型训练与高并发推理优化。采用全高全长双
    的头像 发表于 12-14 11:17 2267次阅读
    迈向云端算力巅峰:昆仑芯K200 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>全面解读

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致能效

    昆仑芯K100边缘AI加速卡以75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理能效标准。其半高半长设计搭载8GB HBM内存与256GB/s带宽,支持INT8至FP32多精度
    的头像 发表于 12-14 11:12 3153次阅读
    专为边缘而生:深度解析昆仑芯K100 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>,释放128 TOPS极致能效

    以龙企招例,浅谈鸿蒙应用开发激励计划 2025 参与心得

    2025 年,我们带着 “龙企招” 鸿蒙应用,报名参与了鸿蒙应用开发激励计划。原本满怀期待地提交上架申请,却收到了审核未通过的通知。这次经历虽有遗憾,却让我们深刻体会到鸿蒙生态对应用质量的严格要求
    发表于 12-12 10:17

    算力密度翻倍!江原D20加速卡发布,一双芯重构AI推理标杆

    电子发烧友网报道(文/莫婷婷)随着AI技术迅猛发展,大模型的参数规模已突破千亿级别,AI推理需求呈现出爆发式增长。然而,在大模型加速落地的浪潮
    的头像 发表于 11-14 08:21 1.1w次阅读
    算力密度翻倍!江原D20<b class='flag-5'>加速卡</b>发布,一<b class='flag-5'>卡</b>双芯<b class='flag-5'>重构</b><b class='flag-5'>AI</b>推理标杆

    此芯科技发布“合一”AI加速计划,赋能边缘与端侧AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和端侧AI场景提供高能效的全栈算力解决方案。
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>计划</b>,赋能边缘与端侧<b class='flag-5'>AI</b>创新

    AI 芯片浪潮下,职场晋升新契机?

    时可作为个人不断进取、紧跟行业发展步伐的有力佐证,职业晋升之路奠定坚实基础。 AI 芯片行业蓬勃发展从业者
    发表于 08-19 08:58

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的
    的头像 发表于 06-05 13:39 1871次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    度等性能表现。 通过结合 Orange Pi 5 Plus(Rockchip RK3588) 与 DeepX AI 加速卡,这套解决方案以极高性价比为基础,能够为工业电脑提供即插即用的便捷体验
    的头像 发表于 05-06 14:15 1249次阅读
    边缘<b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    ,强化与AI、5G等技术的融合,同时通过独立运营提升战略专注度。市场机遇:AI、边缘计算等领域的爆发式增长FPGA
    发表于 04-25 10:19

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡是全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 6058次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解