0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

又一大厂发力RISC-V,Meta第一代自研AI加速器MTIA

E4Life 来源:电子发烧友网 作者:周凯扬 2023-05-23 01:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不久之前,Meta公开了他们在自研芯片上的进展,包括其第一代AI加速器MTIA,以及用于视频转码的MSVP。作为有些“下坡路”倾向的互联网大厂,Meta依然选择自研硬件和芯片,可见Meta对AI的重视。

自研AI加速器MTIA

Meta过去的服务器架构主要依靠CPU来运行AI负载,但随着AI模型对算力和内存的要求不断提高,致使其不得不开始转向特化的方案,比如GPU和NNPI之类的其他硬件加速器。可由于高性能GPU的成本持续走高,Meta很快就转向了自研ASIC方案。

其实早在2020年,他们就设计了第一代的MTIA ASIC,不过当时仅仅只是用于MTIA的部分内部工作负载,主要是为Pytorch和Meta的推荐模型联合设计出来的,用于推理加速。第一代MTIA基于台积电7nm工艺打造,性能达到了102.4TOPS@INT8和51.2 TFLOPS@FP16,功耗仅有25W。

MTIA v1裸片 / Meta

单个MTIA加速器集成了64个处理单元(PE),最高128GB的片外LPDDR5内存和128MB的片上SRAM。值得一提的是,每个处理单元都由两个RISC-V处理器核心构成,其中一个还配备了向量扩展。

从Meta公布的v1版系统设计上可以看出,MTIA加速器装在了一个小型的双M.2主板上,方便设计者轻松地集成在服务器中,通过PCIe 4.0 x8接口与主CPU相连,板卡功耗仅有35W。

当然了,作为OCP的创始者,Meta也在服务器的设计上采用了OCP的Yosemite V3规范,每个服务器包含12个加速器,并使用PCIe Switch相连,根据Meta的说法,加速器的数目和服务器的配置参数是为了优化目前及未来的负载而精心选择的。

自研视频转码芯片MSVP

值得注意的是,MTIA v1还只是他们在2020年开发的第一代AI加速器,Meta的目标是设计一系列推荐用MTIA ASIC。不过,MTIA v1在自研程度上或许没有我们想象得那么深入,比如其RISC-V核心很可能是来自第三方IP厂商的。

而与MTIA一并公开的MSVP,却是Meta首个真正意义上的内部自研ASIC方案,专为解决Meta的视频点播和直播负载而设计,甚至考虑到了其AR/VR业务。Meta认为,这类转码芯片的存在,会为Meta未来在元宇宙上布局的生成式AI短视频,提供更多支持。



MSVP / Meta


据Meta强调,Facebook网站上的视频流量每天就有40亿播放量,所以提升压缩效率,提供更高的稳定性、可靠性以及近乎无限的扩展性,就成了他们对自研视频转码芯片的要求。从MSVP的设计架构上来看,除了多处理器的CPU子系统外,芯片大部分由转码核心构成。

在解码性能上,MSVP支持主流的H.264、HEVC、VP9和AV1编码,最大支持10bit色深和YUV420色度采样。而在编码性能上,MSVP仅支持H.264和VP9编码,最大支持8bit色深。

Meta给出的数据中,每个MSVP可以在最高图像质量输出时实现4K 15FPS的峰值转码速度,在标准图像质量下实现4K 60FPS的转码速度,且单个PICe模块的功耗只有10W左右。由于采用了硬件转码加速,MSVP是ibx264软件编码速度的9倍,是libVPX软件编码速度的50倍。

写在最后

Meta最重要的一大营收来源就是广告业务,所以相对其他互联网公司,他们会将深度学习推荐模型(DLRM)放在第一位。随着模型大小和复杂程度不断增加,如何跟上这股趋势同时保证ROI,就成了他们的主要问题。MTIA代表了他们在自研AI基础设施上走出的重要一步。至于MSVP,则代表了Meta想要进一步发展短视频、AR/VR内容的同时,减少网络带宽提高传播力度的解决方案。未来Meta要想逆流而上,这些自研芯片无疑会提供不小的助力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Meta
    +关注

    关注

    0

    文章

    316

    浏览量

    12331
  • RISC-V
    +关注

    关注

    48

    文章

    2792

    浏览量

    51889
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索RISC-V在机器人领域的潜力

    的硬件配置给人留下了深刻的第一印象: • 核心处理: 搭载了进迭时空的K1系列高性能RISC-V处理,具备强大的通用计算能力和AI
    发表于 12-03 14:40

    Andes晶心科技推出新一代深度学习加速器

    高效能、低功耗 32/64 位 RISC-V 处理核与 AI 加速解决方案的领导供货商—Andes晶心科技(Andes Technology)今日正式发表最新深度学习
    的头像 发表于 08-20 17:43 1838次阅读

    借势 RISC-VAI 浪潮,元石智算打造算新范式

    RISC-V架构崛起的双重浪潮下,国产服务系统行业正迎来关键发展机遇。 武汉元石智算科技有限公司(下文简称“元石智算”)作为国产服务系统创新的佼佼者,敏锐洞察这趋势,凭借对
    的头像 发表于 07-25 14:51 441次阅读
    借势 <b class='flag-5'>RISC-V</b>与 <b class='flag-5'>AI</b> 浪潮,元石智算打造算<b class='flag-5'>力</b>新范式

    RISC-V芯片出货超百亿颗!四大厂商重磅产品来袭,加速边缘AI终端落地

    RISC-V基金会宣布,2024年基于RISC-V指令集的芯片出货量超过百亿颗,其中30%用于AI加速场景。本次盛会,知合计算、全志科技、博流智能、凌思微等厂商都携最新
    的头像 发表于 07-22 08:58 6096次阅读
    <b class='flag-5'>RISC-V</b>芯片出货超百亿颗!四<b class='flag-5'>大厂</b>商重磅产品来袭,<b class='flag-5'>加速</b>边缘<b class='flag-5'>AI</b>终端落地

    RISC-V 的平台思维和生态思维

    RISC-V 的平台思维时指出,平台思维指的是硬件(CPU、加速器、总线等)、固件和软件的整体集成。标准化 ISA 配置文件是必要的
    发表于 07-17 14:04 4086次阅读

    RISC-V架构下AI融合算及其软件栈实践

    面对未来大模型(LLM)、AIGC等智能化浪潮的挑战,进迭时空在RISC-V方向全面布局,通过精心设计的RISC-VDSA架构以及软硬体的优化策略,将全力为未来打造高效且易用的AI
    的头像 发表于 06-06 17:04 1155次阅读
    <b class='flag-5'>RISC-V</b>架构下<b class='flag-5'>AI</b>融合算<b class='flag-5'>力</b>及其软件栈实践

    第一代半导体被淘汰了吗

    在半导体产业的百年展历程中,“第一代半导体是否被淘汰”的争议从未停歇。从早期的锗晶体管到如今的硅基芯片,以硅为代表的第一代半导体材料,始终以不可替代的产业基石角色,支撑着全球95%以上的电子设备
    的头像 发表于 05-14 17:38 775次阅读
    <b class='flag-5'>第一代</b>半导体被淘汰了吗

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    识别联调。 进迭时空致力于为智能机器人提供完整全栈优化的RISC-V AI软硬件解决方案,第一代RISC-V AI CPU芯片K1已完成
    发表于 04-25 17:59

    大象机器人×进迭时空联合发布全球首款RISC-V全栈开源小六轴机械臂

        在全球AI与机器人技术高速发展的浪潮中,中国公司始终坚定走在创新的道路上。     4月25日,大象机器人与 国内RISC-V AI
    的头像 发表于 04-25 14:19 1454次阅读
    大象机器人×进迭时空联合发布全球首款<b class='flag-5'>RISC-V</b>全栈开源小六轴机械臂

    思尔芯与玄铁合作IP评测,加速RISC-V生态发展

    引言随着近来Deepseek的横空出世,降低算需求,为RISC-V带来了更多的创新机遇。RISC-V计算架构搭乘上AI时代的快车,成为新一代
    的头像 发表于 04-09 09:24 764次阅读
    思尔芯与玄铁合作IP评测,<b class='flag-5'>加速</b><b class='flag-5'>RISC-V</b>生态发展

    AI SoC# 奕斯伟EIC7700 全球首款基于RISC-V架构的边缘计算SoC芯片

    EIC7700X是款性能优异的边缘计算SoC芯片,搭载64位RISC-V处理神经网络计算单元,支持全栈浮点计算和生成式大语言模型。
    的头像 发表于 03-28 14:23 2967次阅读
    <b class='flag-5'>AI</b> SoC# 奕斯伟EIC7700 全球首款基于<b class='flag-5'>RISC-V</b>架构的边缘计算SoC芯片

    端侧AI、数据中心,RISC-V已“上桌”

    电子发烧友网报道(文/梁浩斌)从低功耗、低成本应用,迈向高性能、高算,是RISC-V发展过程中的必经之路。随着RISC-V生态的发展,包括工具链、IP核的进步完善,
    的头像 发表于 03-21 00:04 2267次阅读

    首款RISC-V架构服务,助力行业精准适配AI场景

    加速,支持多精度计算。可适用于大模型推理、深度学习、智算中心、科学计算、隐私计算等应用场景。RISC-V特性国产主控搭载国产处理,行
    的头像 发表于 02-28 16:34 1496次阅读
    首款<b class='flag-5'>RISC-V</b>架构服务<b class='flag-5'>器</b>,助力行业精准适配<b class='flag-5'>AI</b>场景

    关于RISC-V芯片的应用学习总结

    电子、医疗设备等领域,对处理的可靠性、实时性和低功耗有较高要求。RISC-V芯片通过提供丰富的外设接口和高效的指令集,满足了嵌入式系统的多样化需求。同时,其开源特性降低了开发成本,加速了产品上市时间
    发表于 01-29 08:38

    新的RISC-V前景如何呢?

    1 月 7 日消息,RISC-V 领军企业 SiFive 成立中国分公司,中文名称定为“芯伍科技”。 1 月 14 日消息,专注传统与 AI 业务,Imagination 放弃 RISC-V CPU 开发。 新的
    发表于 01-24 16:19