0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook开源服务27亿用户的硬件3件套

DPVg_AI_era 来源:lp 2019-03-16 09:23 次阅读

面对每个月27亿活跃用户产生的数据量,Facebook将重心从通用硬件转向AI专用硬件。在今天的开放计算项目全球峰会上,发布并开源了3款AI硬件,分别是面向训练的Zion、面向推理的Kings Canyon及面向视频转码的Mount Shasta。

一个全家桶app,每个月要服务27亿人,不容易呐!不信你问Facebook。

为了应对大量的算力要求,这家位于Menlo Park的技术巨头,硬是从通用硬件转移到了专用加速器。这些加速器的作用,是保证其数据中心的性能,功耗和效率,特别是在AI领域。

今天,Facebook一口气推出了3款硬件产品,分别是用于AI模型培训的“下一代”硬件平台Zion;以及针对AI推理优化的定制专用集成电路Kings Canyon;以及视频转码Mount Shasta。并捐赠给旗下的开放计算项目使用。

Open Compute Project(OCP)是Facebook在2011年4月发起的一個数据中心开放架构技术发展组织,目前成员包括Intel、Red Hat、Facebook、Mozilla、Rackspace、NTT Data、百度、高盛以及Google等。https://benchlife.info/8597-2/

Facebook称这三款硬件产品将大大加速AI的训练和推理。“人工智能用于各种服务,以帮助人们进行日常互动,并为他们提供独特的个性化体验,” Facebook工程师Kevin Lee,Vijay Rao和William Christie Arnold在博客文章中写道,“在整个Facebook的基础设施中使用人工智能工作负载,能够增强各服务之间的相关性,并改善我们的用户体验。”

Zion

Zion为AI训练创建Block

和Block之间通信

Zion专为处理包括CNN,LSTM和SparseNN在内的神经网络架构的“频谱”而量身定制。包括三个部分:拥有8个NUMA CPU插槽的服务器;配备了8加速器芯片组,以及一个厂商中立(vendor-agnostic )的OCP加速器模块(OAM)。

Zion的高内存容量和高带宽,得益于两个高速fabric,一个用来连接所有的CPU,另一个用来连接所有的加速器。除此之外,还得益于其灵活的架构,可以使用顶部扩展到单个机架中的多个服务器机架式(TOR)网络交换机

“加速器内存带宽高但容量低,所以我们通过对模型进行分区来解决这个问题:将频繁访问的数据驻留在加速器上,而访问频率较低的数据驻留在带有CPU的DDR内存里,“Lee,Rao和Arnold解释道,“所有CPU和加速器的计算和通信都是平衡的,并通过高速和低速互连,极大地提高了效率。”

Kings Canyon

Zion为AI推理创建Block

和Block之间通信

至于专为推理任务而设计的Kings Canyon共分四个部分:Kings Canyon推理M.2模块;Twin Lakes单插槽服务器;Glacier Point v2载卡;以及Facebook的Yosemite v2机箱。Facebook表示正在与Esperanto、Habana,英特尔,Marvell和高通公司合作,开发能够同时支持INT8和高精度FP16工作负载的ASIC芯片。

ASIC不运行通用代码,需要专门的编译器将图形转换为在这些加速器上执行的指令。Glow编译器的目标是从更高级别的软件堆栈中抽象出特定于供应商的硬件,以使基础架构与供应商无关。它接受来自PyTorch 1.0等框架的计算图,并为这些ML加速器生成高度优化的代码。

Glow编译器

Kings Canyon中的每台服务器都结合了M.2 Kings Canyon加速器,以及一个连接Twin Lakes服务器的Glacier Point v2载卡。其中两个被安装到Yosemite v2 sled中,并通过NIC链接到TOR开关。Kings Canyon模块包括一个ASIC,一个内存及其他支持组件,比如通过PCIe通道与加速器模块通信的CPU。而Glacier Point v2包含一个集成的PCIe交换机,允许服务器同时访问所有模块。

“通过适当的将模型进行分割,我们得以运行非常大的深度学习模型。例如,对于SparseNN模型,如果单个节点的内存容量不够用,就在两个节点之间对模型进行分片,从而增加模型可用的内存量。“Lee,Rao和Arnold说过,“这两个节点通过多主机NIC连接,允许高速交换。”

Mount Shasta

Mount Shasta是与Broadcom和Verisilicon合作开发的ASIC,专为视频转码而开发。在Facebook的数据中心内,它将被安装在带有集成散热器的M.2模块上,位于可容纳多个M.2模块的Glacier Point v2(GPv2)载板中。

Facebook表示,平均而言,预计这些芯片的效率会比目前的服务器“高出许多倍”。它的目标是在10W功率范围内,以60fps速度输入流编码效率至少比4K高出一倍。

“我们希望Zion、Kings Canyon和Mount Shasta的设计,能够满足我们在AI训练、AI推理和视频转码方面不断增长的工作量。”Lee,Rao和Arnold写道,“我们将采取硬件和软件协同设计,不断改进硬件产品的效率。但一家厂商的能力终归有限,希望更多的厂商都能够进入Facebook的生态中,共同努力。“

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    736

    浏览量

    36546
  • Facebook
    +关注

    关注

    3

    文章

    1427

    浏览量

    54012
  • ai硬件
    +关注

    关注

    0

    文章

    8

    浏览量

    2337

原文标题:Facebook开源AI硬件,一口气推出“三件套”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Facebook开源StyleX如何在JavaScript中写CSS呢?

    Meta(原 Facebook开源了全新的 CSS-in-JS 库 StyleX。
    的头像 发表于 12-14 10:03 239次阅读

    爱立信推出全新软件套件以差异化5G连接实现卓越服务

    日前,爱立信推出一款全新软件套件,该套件能够加强5G独立组网的网络功能,通过差异化连接实现卓越服务
    的头像 发表于 11-01 10:04 1634次阅读

    Banana Pi BPI-M64开源硬件开发板用户使用手册

    Banana Pi BPI-M64开源硬件开发板用户使用手册
    发表于 09-04 17:05 1次下载

    开源图形驱动在OpenHarmony上的使用和落地

    FbDev 和DmaBuf-Heap、支持FbDev显示,不支持硬件离线合成。 针对上述OpenHarmony驱动框架的整体情况,开源GPU驱动的适配工作主要分为以下3个阶段进行:(1)验证内核
    发表于 08-31 18:07

    如何设置和使用ARM固件套件的指南

    本书提供了如何设置和使用ARM固件套件的指南。 它描述了它的主要组件和功能,以及如何使用它们为基于ARM的硬件平台开发应用程序
    发表于 08-21 06:46

    Emulex软件套件迁移用户指南 版本11.2

    电子发烧友网站提供《Emulex软件套件迁移用户指南 版本11.2.pdf》资料免费下载
    发表于 08-03 11:32 0次下载
    Emulex软<b class='flag-5'>件套</b>件迁移<b class='flag-5'>用户</b>指南 版本11.2

    开源】4G_Lora远程氨气监测器

    ) 支持 uA 级低功耗休眠(可选) 支持 GPS 定位及对时(可选) 支持二次开发 源代码+硬件开源 提供定制开发服务 应用领域: 智慧农业 智慧养殖 智慧气象/水文 工业物联网 智慧城市
    发表于 06-26 09:36

    开源】4G_Lora远程光照监测器

    (可选) 支持 uA 级低功耗休眠(可选) 支持 GPS 定位及对时(可选) 支持二次开发 源代码+硬件开源 提供定制开发服务 应用领域: 智慧农业 智慧养殖 智慧气象/水文 智慧城市 开源
    发表于 06-14 10:01

    开源】4G_Lora远程风速监测器

    ) 支持 uA 级低功耗休眠(可选) 支持 GPS 定位及对时(可选) 支持二次开发 源代码+硬件开源 提供定制开发服务 应用领域: 智慧农业 智慧气象/水文 智慧城市 开源资料地址:
    发表于 06-12 09:32

    开源】4G_Lora远程雨量监测器

    ) 支持 uA 级低功耗休眠(可选) 支持 GPS 定位及对时(可选) 支持二次开发 源代码+硬件开源 提供定制开发服务 应用领域: 智慧农业 智慧气象/水文 智慧城市 开源资料地址:
    发表于 06-09 10:13

    开源】智慧气象盒子(4G_GPS)

    开源 硬件电路开源 可二次开发 提供定制开发服务 开源资料地址: https://gitee.com/shine_blink/flex-lu
    发表于 06-05 09:36

    开源】智慧养殖盒子(4G_GPS)

    存储200万条excel记录 可微信小程序远程查看数据(调试用) 可手机蓝牙App实时查看数据(调试用) Lua源码开源 硬件电路开源 可二次开发 提供定制开发服务
    发表于 06-02 09:32

    开源】4G远程GPS定位器

    源代码+硬件开源 提供定制开发服务 应用领域: 货运物流 冷链运输 防盗追踪 开源资料地址: 详情见ShineBlink 的gitee开源
    发表于 05-30 11:54

    开源硬件大赛】基于V853的多功能串口服务器——成品成果展示

    开源硬件大赛】基于V853的多功能串口服务器——成品成果展示
    的头像 发表于 04-30 18:16 3763次阅读
    【<b class='flag-5'>开源硬件</b>大赛】基于V853的多功能串口<b class='flag-5'>服务</b>器——成品成果展示

    R8C/26、R8C/27硬件手册

    R8C/26、R8C/27硬件手册
    发表于 04-26 20:01 0次下载
    R8C/26、R8C/<b class='flag-5'>27</b>群<b class='flag-5'>硬件</b>手册