0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

又一大厂发力RISC-V,Meta第一代自研AI加速器MTIA

E4Life 来源:电子发烧友网 作者:周凯扬 2023-05-23 01:49 次阅读

不久之前,Meta公开了他们在自研芯片上的进展,包括其第一代AI加速器MTIA,以及用于视频转码的MSVP。作为有些“下坡路”倾向的互联网大厂,Meta依然选择自研硬件和芯片,可见Meta对AI的重视。

自研AI加速器MTIA

Meta过去的服务器架构主要依靠CPU来运行AI负载,但随着AI模型对算力和内存的要求不断提高,致使其不得不开始转向特化的方案,比如GPU和NNPI之类的其他硬件加速器。可由于高性能GPU的成本持续走高,Meta很快就转向了自研ASIC方案。

其实早在2020年,他们就设计了第一代的MTIA ASIC,不过当时仅仅只是用于MTIA的部分内部工作负载,主要是为Pytorch和Meta的推荐模型联合设计出来的,用于推理加速。第一代MTIA基于台积电7nm工艺打造,性能达到了102.4TOPS@INT8和51.2 TFLOPS@FP16,功耗仅有25W。

MTIA v1裸片 / Meta

单个MTIA加速器集成了64个处理单元(PE),最高128GB的片外LPDDR5内存和128MB的片上SRAM。值得一提的是,每个处理单元都由两个RISC-V处理器核心构成,其中一个还配备了向量扩展。

从Meta公布的v1版系统设计上可以看出,MTIA加速器装在了一个小型的双M.2主板上,方便设计者轻松地集成在服务器中,通过PCIe 4.0 x8接口与主CPU相连,板卡功耗仅有35W。

当然了,作为OCP的创始者,Meta也在服务器的设计上采用了OCP的Yosemite V3规范,每个服务器包含12个加速器,并使用PCIe Switch相连,根据Meta的说法,加速器的数目和服务器的配置参数是为了优化目前及未来的负载而精心选择的。

自研视频转码芯片MSVP

值得注意的是,MTIA v1还只是他们在2020年开发的第一代AI加速器,Meta的目标是设计一系列推荐用MTIA ASIC。不过,MTIA v1在自研程度上或许没有我们想象得那么深入,比如其RISC-V核心很可能是来自第三方IP厂商的。

而与MTIA一并公开的MSVP,却是Meta首个真正意义上的内部自研ASIC方案,专为解决Meta的视频点播和直播负载而设计,甚至考虑到了其AR/VR业务。Meta认为,这类转码芯片的存在,会为Meta未来在元宇宙上布局的生成式AI短视频,提供更多支持。



MSVP / Meta


据Meta强调,Facebook网站上的视频流量每天就有40亿播放量,所以提升压缩效率,提供更高的稳定性、可靠性以及近乎无限的扩展性,就成了他们对自研视频转码芯片的要求。从MSVP的设计架构上来看,除了多处理器的CPU子系统外,芯片大部分由转码核心构成。

在解码性能上,MSVP支持主流的H.264、HEVC、VP9和AV1编码,最大支持10bit色深和YUV420色度采样。而在编码性能上,MSVP仅支持H.264和VP9编码,最大支持8bit色深。

Meta给出的数据中,每个MSVP可以在最高图像质量输出时实现4K 15FPS的峰值转码速度,在标准图像质量下实现4K 60FPS的转码速度,且单个PICe模块的功耗只有10W左右。由于采用了硬件转码加速,MSVP是ibx264软件编码速度的9倍,是libVPX软件编码速度的50倍。

写在最后

Meta最重要的一大营收来源就是广告业务,所以相对其他互联网公司,他们会将深度学习推荐模型(DLRM)放在第一位。随着模型大小和复杂程度不断增加,如何跟上这股趋势同时保证ROI,就成了他们的主要问题。MTIA代表了他们在自研AI基础设施上走出的重要一步。至于MSVP,则代表了Meta想要进一步发展短视频、AR/VR内容的同时,减少网络带宽提高传播力度的解决方案。未来Meta要想逆流而上,这些自研芯片无疑会提供不小的助力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Meta
    +关注

    关注

    0

    文章

    164

    浏览量

    11180
  • RISC-V
    +关注

    关注

    41

    文章

    1906

    浏览量

    45056
收藏 人收藏

    评论

    相关推荐

    risc-v多核芯片在AI方面的应用

    RISC-V多核芯片能够更好地适应AI算法的不同需求,包括深度学习、神经网络等,从而提高芯片的性能和效率,降低成本,使AI边缘计算晶片更具竞争。 再者,
    发表于 04-28 09:20

    瑞萨电子推出采用RISC-V CPU内核的通用32位MCU

    2024 年 3 月 26 日,中国北京讯 - 全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布率先在业内推出基于内部CPU内核构建的通用32位RISC-V微控制(M
    发表于 03-30 22:08

    学习RISC-V单片机的感想

    RISC-V,以及国内开始的其它架构单片机。国内有些企业的架构,还没有机会学习和使用。期待有机会试试,比如华为的处理
    发表于 02-17 21:00

    RISC-V内核突破百亿颗 RVV1.0如何解锁端侧AI市场应用潜能

    ”(南湖)开源高性能RISC-V处理内核,其性能已超过ARM A76;阿里平头哥发布的首个RISC-V
    发表于 12-01 13:17

    256核!赛昉发布全新RISC-V众核子系统IP平台

    (Dubhe-90)的高性能RISC-V众核子系统IP平台。 StarLink-700是赛昉科技的支持缓存致性的Interconnect Fabric IP,是国内首款Mesh架
    发表于 11-29 13:37

    RISC-V mcu何时进军AI

    今天看了篇文章,讲述MCU界“六大天王”ST、NXP、Microchip、Renesas、TI、Infineon都在加大布局边缘AI,这也应该是RISC-V MCU 的次机遇啊!
    发表于 11-04 09:58

    青稞RISC-V通用系列MCU

    产品概述 CH32V、CH32X系列MCU采用的青稞RISC-V内核,基于蓬勃发展的RISC-V开源指令集架构,针对低功耗和高速响应等应
    发表于 10-11 09:56

    谈ARM上市与RISC-V

    ,中国还逐渐拥有了一大批从设计到系统,从工具到测试,最终到人才培养的全流程自主研发与发展能力。 今天Arm的对手是RISC-V,未来Arm面对的将是以庞大市场做背景,拥有全产业链的生态完全体。曾经
    发表于 09-30 12:22

    RISC-V强势崛起为芯片架构第三极

    出货量,显示出这个新出现的处理架构旺盛生命。 平头哥是国内RISC-V产业链的重要玩家之。在近日推出首个
    发表于 08-30 13:53

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    平台通过软硬件深度协同,较经典方案提升超 8 成性能,支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高性能 AI 应用时代。 平头哥表示,他们通过更新
    发表于 08-26 14:14

    RISC-V在快速发展的处理生态系统中找到立足点

    shipped. Most recently, Meta announced an AI inferencing chip built on RISC-V architecture.
    发表于 08-11 18:20

    国产第二“香山”RISC-V 开源处理计划 6 月流片:基于中芯国际 14nm 工艺,性能超 Arm A76

    中国工程院院士倪光南曾指出,目前 CPU 市场主要被 x86 和 ARM 架构所垄断,而中国想要打破这个局面,实现自主可控,开源的 RISC-V 架构将是一大机遇和发展方向。在最近举行
    发表于 06-05 11:51

    RISC-V软件生态计划“RISE”启动,平头哥成中国大陆唯董事会成员

    ,并不断完善丰富RISC-V扩展指令集的调试功能。此外,平头哥的集成开发环境CDK、AI部署工具HHB等系列基础软件,均已开源开放。“平头哥在R
    发表于 06-02 15:29

    RISC-V,正在摆脱低端

    达到1000亿美元,合计市场规模年复合增长率达45%,可见其市场前景广阔。 图源:i.ifeng MetaRISC-V AI芯片 近日
    发表于 05-30 14:11

    RISC-V架构的优势和特点

    RISC-V 联盟,这将加速RISC-V 芯片的研发。 可以看到RISC-V架构将成为芯片产业发展的重要组成部分,将为不同应用场景提供高性能、低功耗的处理
    发表于 05-14 09:05