0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

稀疏化应对算力瓶颈,助力云服务商大幅降低成本

Carol Li 来源:电子发烧友网 作者:李弯弯 2022-09-02 08:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)AI5G等新兴产业的蓬勃发展催生了海量数据计算需求,同时AI算法模型持续迭代,复杂化日益凸显,数字经济时代下市场需要强大、普惠的算力引擎。而从供给端来看,先进制程的迭代周期变长,使得芯片能效比的提升并不显著。

针对AI应用特点实现硬件架构创新是必然趋势,墨芯人工智能CEO王维在某论坛上谈到,依托对AI的理解用软硬一体解决算力瓶颈问题是行业公认的发展方向。他认为,稀疏化能够有效应对算力瓶颈,实现原理是,不存储和不处理零值,从而得到更小且更快的模型。

软硬一体化稀疏路径符合AI计算核心诉求

软硬一体化稀疏路径符合AI计算高吞吐、低功耗、低延时的核心需求。AI稀疏产业化的成功要素包括:1、跨算法、软件、硬件领域的协同开发;2、拥有持续多层次优化稀疏运算的底层算法能力;3、架构需保证可编程性、高度可拓展属性及快速迭代能力。

稀疏化路径已具备批量化工程应用能力。英伟达在2020年推出的A100产品中,就率先引入稀疏Tensor Core实现4:2结构化稀疏,稀疏是神经网络轻量化的重要手段,英伟达稀疏化产品有效引领市场应用趋势。稀疏化架构可与现有AI软件生态深度适配,例如英伟达直接使用Tensor Core进行稀疏矩阵乘累加操作,无需进行底层编程。
图片1
墨芯人工智能CEO王维演讲(电子发烧友拍摄)

基于双稀疏特点,自研核心AI架构

墨芯是全球最早研发稀疏化算法及架构的企业,并在2018年开始稀疏化的全球专利布局,该公司也是最早商用稀疏化产品实现销售的,第一款FPGA产品在2019年Q4开始产生销售。

王维表示,现有芯片架构设计在稀疏化支持中面临较大局限,比如CPU架构,可支持跳点运算,但因其算力限制,仅能够支持边缘端应用,无法支持更大的模型,再比如GPU架构,只能进行并行计算,所有元素(包括0元素)均参与运算,无法实现高倍数加速。

基于双稀疏特点,墨芯自研核心AI架构。其双稀疏架构设计理念:平衡的权重和激活张量剪枝技术,可将精度损失降至最低的前提下保持对硬件的友好度;墨芯独有的剪枝和压缩技术可以再许多网络和应用中实现最多高到32倍的稀疏。

墨芯首款稀疏化云端AI芯片Antoum-1已经回片,实测性能ResNet 50超33000SPS;墨芯板卡S4(单颗Antoum-1)仅30W功耗,实测性能实现英伟达主流产品T4近16倍能效比;墨芯板卡S4对比英伟达主流产品Latency可以做到1/4-1/5。
图片2
墨芯人工智能CEO王维演讲(电子发烧友拍摄)

稀疏化计算产品商业落地,将赋能AI产业变革。一、助力云服务商降低单位算力拥有成本,2021年,Nvidia在中国营收超过38亿美金,其中阿里,腾讯等头部互联网公司采购金额基本超过1亿美金。随着AI持续发展,数据量的指数上升导致AI芯片的需求会持续上升,云服务商采购额将逐年增加,因此他们对降低成本的诉求非常强劲,基于Antoum-1的推理卡S4相较于英伟达对标推理卡T4,ResNest50及BERT每FPS/SPS成本降低约85%。

二、助力云服务商缩减能耗成本,电费支出是数据中心最大的营业成本,平均数据中心近60%的营业成本是电力成本,降低能耗是数据中心和云服务商的最大痛点,2021年全国数据中心的耗电量占社会总用电的近3%,且增长率已连续8年超过12%,基于Antoum-1的推理卡S4相较于Nvidia主力推理卡T4,ResNest50及BERT每FPS/SPS能耗成本降低约90%。

小结

目前基于稀疏化的AI架构主要面向云端训练场景,不过理论上来说,稀疏化训练由于能大幅降低对内存、带宽与计算的需求,十分适合训练,未来墨芯在满足推理市场的需求后,将切入训练市场,建立稀疏训练生态,产品在软件层面对训练做更多的开发,支持训练专用的算子,同时硬件上也会为训练定义架构。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16560
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    上海SD-WAN服务商怎么选?3步骤挑对服务商,附服务商排名!

    前言数字转型浪潮下,一条软件定义的网络高速公路正成为企业竞争的关键筹码,选对服务商能让网络成本降低60%,业务部署速度提升10倍。随着企业数字
    的头像 发表于 09-23 11:47 1479次阅读
    上海SD-WAN<b class='flag-5'>服务商</b>怎么选?3步骤挑对<b class='flag-5'>服务商</b>,附<b class='flag-5'>服务商</b>排名!

    睿海光电800G光模块助力全球AI基建升级

    测试。 四、合作案例:赋能全球头部客户AI与计算升级 睿海光电的解决方案已深入多个行业标杆场景: 数据中心互联:为东南亚某顶级IDC服务商部署800G SR8硅光模块,单机架带宽提升4倍,功耗降低
    发表于 08-13 19:05

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智时代——以创新实力助力全球客户构建高效底座

    计算巨头800G FR4项目 2024年第四季度,睿海光电与某头部服务商达成战略合作,为其新一代智中心定制800G FR4光模块。依托敏捷交付体系,睿海光电在合同签署后30天内完成设计验证并交付首批
    发表于 08-13 19:03

    迅为RK3576开发板高低成本工业级核心板卡开发平台

    迅为RK3576开发板高低成本工业级核心板卡开发平台
    的头像 发表于 06-09 15:13 1438次阅读
    迅为RK3576开发板高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>低成本</b>工业级核心板卡开发平台

    智能服务器应用领域

    加速金融模型训练与实时交易决策,头部机构平台规模超3.8万台服务器‌。 二、‌医疗健康‌ 药物研发与基因测序‌:AI
    的头像 发表于 04-21 09:09 1215次阅读
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务</b>器应用领域

    Arm架构将占据半数 2025年出货到头部服务提供

    Neoverse 技术的部署已达到了新的高度:2025 年出货到头部超大规模服务提供中,将有近 50% 是基于 Arm 架构。
    的头像 发表于 04-09 17:31 1062次阅读

    工业4.0革命利器!明远智睿SSD2351核心板:低成本+高,破解产线智能难题

    行业痛点:传统工业设备智能改造面临三大瓶颈——不足导致实时性差、接口资源有限难以扩展多设备、进口方案成本高昂且供货不稳定。 核心板方案
    发表于 03-21 14:22

    GPU 加速计算:突破传统瓶颈的利刃

    在数字化时代,数据呈爆炸式增长,传统的已难以满足复杂计算任务的需求。无论是人工智能的深度学习、大数据的分析处理,还是科学研究中的模拟计算,都对提出了极高的要求。而
    的头像 发表于 02-17 10:36 516次阅读

    租用站群服务器时如何降低成本?

    在租用站群服务器时,降低成本是许多站群管理者关注的重要问题。主机推荐小编为您整理发布租用站群服务器时如何降低成本,以下是一些实用的策略和建议,有助于在保持性能的同时
    的头像 发表于 01-22 10:45 566次阅读

    科技报到:要更要“利”,“精装”触发大模型产业新变局?

    科技报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 790次阅读

    家计算 开启贵州人工智能服务新篇章

    的贵州家计算服务有限公司(以下简称家计算)诞生,它依托其特有资源优势,提供专业AI计算服务,助力人工智能创新发展。   【贵州
    的头像 发表于 12-27 00:37 1011次阅读
    <b class='flag-5'>算</b>家计算 开启贵州人工智能<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>服务</b>新篇章

    Grab选定亚马逊科技为首选服务商

    近日,在亚马逊科技2024年re:Invent全球大会上,一项重大合作宣布出炉。东南亚领先的超级应用程序Grab与亚马逊科技携手,宣布Grab已正式选定亚马逊科技作为其首选的
    的头像 发表于 12-24 10:22 725次阅读

    超级应用程序Grab选择亚马逊科技为首选服务商

    亚马逊科技为首选服务商。借助亚马逊科技,Grab正在实施以技术为核心的发展战略,旨在推动其业务在出行、配送、以及包括新增的digibanks在内的金融
    的头像 发表于 12-19 15:31 842次阅读