0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

史上最大芯片将用于这两个项目

汽车玩家 来源:今日头条 作者:今日头条 2019-11-25 16:09 次阅读

今年 8 月,集成 1.2 万亿个晶体管的“史上最大芯片”The Cerebras Wafer Scale Engine(以下简称 WSE)诞生,在 11 月 19 日召开的 Supercomputing 2019 大会上,该芯片制造公司 Cerebras Systems 推出了搭载该芯片的计算机系统————Cerebras CS-1,这也将是世界上最强大的 AI 计算系统。美国两家国家实验室是该公司的客户,其中,阿贡国家实验室已成功部署并宣布,将用这套系统来发现癌症疗法和理解黑洞碰撞。

图 | Cerebras CS-1(来源:Cerebras Systems)

CS-1 搭载的并不是一个芯片,而是一整个晶圆。通常,硅芯片是从 8、10 或 12 英寸等不同规格的晶圆上单独切下来的。而 Cerebras 把晶圆切割成一个很大的长方形,每个芯片都相互连接,可以使每个晶体管都能像整体一样高速运转。一个典型处理器可能在一个芯片上有 100 亿个晶体管,而 CS-1 搭载的整个晶片上所有核的晶体管总数超过 1.2 万亿个。

在 AI 计算中,芯片尺寸至关重要,但是高级处理器必须要有专用的硬件和软件系统相配合才能实现理想的性能。Cerebras 公司 CEO Andrew Feldman 在接受媒体采访时说:“你无法将法拉利发动机放入大众汽车中来获得法拉利性能。如果你想获得 1,000 倍的性能提升,你要做的就是消除瓶颈。”CS-1 系统设计和 Cerebras 软件平台相结合,可以充分用到从 WSE 上的 40 多万个计算内核和 18 GB 高性能片上存储器中提取的每一点的处理能力。

GIF 图 | Cerebras 晶片规模的引擎(来源:Cerebras Systems)

GPU 集群需要消耗数十个机架并且需要专有的 InfiniBand 进行集群不同,CS-1 不需要大量修改现有模型,并且用户只需将基于标准的 100Gb 以太网链路插入交换机就可以启动培训模型。

CS-1 有 15 个机架,大概是 26 英寸高(66.04 厘米)。Andrew Feldman 表示,CS-1 是“最快的 AI 计算机”。CS-1 计算机的机器学习能力相当于数百架基于 GPU 的计算机能力,这些计算会消耗数百千瓦。但 CS-1 仅消耗 17 千瓦,占标准机架能耗的三分之一。他把 CS-1 和谷歌的 TPU 计算集群相比,强调谷歌的 TPU2 机器学习集群需要 10 个机架和超过 100 千瓦的功耗,才能提供一个 CS-1 机箱三分之一的性能。

Feldman 说:“我们是由 40 万个专用 AI 处理器组成的 AI 机器。”CS-1 由 40 万核、1 万亿晶体管大小的处理器芯片驱动,可以将原本需要至少几周的大型神经网络训练任务缩短到几分钟甚至几秒钟。但是,Cerebras 并没有提供用标准 AI 基准(如新的 MLPeRF 标准)衡量性能的数据。相反,它通过让潜在客户在 Cerebras 的机器上训练他们自己的神经网络模型来吸引潜在客户。

另外,Cerebras 还公布了一些系统软件的细节,该软件允许用户使用 Pytorch 和 Tensorflow 之类的 ML 标准框架来编写他们的机器学习模型。强大的图形编译器可自动将这些模型转换为 CS-1 的优化可执行文件,而丰富的工具集可实现直观的模型调试和性能分析。

图 | Cerebras 软件系统允许用户使用 Pytorch 和 Tensorflow 之类的 ML 标准框架来编写他们的机器学习模型(来源:Cerebras Systems)

这是如何实现的呢?通过解决一个优化问题,确保所有层以大致相同的速度完成它们的任务处理,且与相邻层是连续的。这样信息就可以实现在网络中畅通无阻。该软件可以在多台计算机上执行这个优化问题,如果把 32 个 CS-1 连接在一起,那么这一组计算机所构成的大型计算机的性能可以提高约 32 倍。

Feldman 说:“GPU 集群无法实现相同的效果,你得到的不是一个大型计算机的算力,仍然是一堆小机器所能实现的算力。”他认为 CS-1 和 GPU 集群形成了鲜明的对比。

CS-1 的第一个应用是预测癌症药物反应,这是美国能源部和美国国家癌症研究所合作的一个项目。能源部负责人工智能与技术的副部长 Dimitri Kusnezov 在一份声明中说:“在能源部,我们相信公私合作是加速美国人工智能研究的重要组成部分。”“我们期待与 Cerebras 建立长期而富有成效的合作关系,这将有助于定义下一代人工智能技术,并改变能源部的运作、业务和使命。”或许这也是 Feldman 能筹集到数亿美元并雇用大量员工的原因。

图 | 阿贡实验室(Argonne National Laboratory)

阿贡实验室与 Cerebras 的合作已经有两年了。其计算总监 Rick Stevens 在新闻发布会上表示:“通过部署 CS-1,我们大大缩短了神经网络的训练时间,使我们的研究人员能够更高效地开展深度学习研究,在癌症、创伤性脑损伤以及当今和未来对社会有重要意义的其他领域取得重大进展。”

阿贡实验室是全球最大的超级计算机站点之一,而 CS-1 可以使这个站点比现有的 AI 加速器得到 100 到 1000 倍的提升,有望在 2021 年实现 Aurora 百万兆级超算的能力。一台百万兆级的计算机一瞬间进行的计算量,相当于地球上的所有人每天每秒都不停地计算四年。

除了用在研究抗癌药物之外,该系统还将被用来帮助理解黑洞碰撞行为及其引力波。此前做过类似研究的 Theta 超级计算机,在研究黑洞碰撞问题时需要调动超算所配置的 4392 个节点中的 1024 个节点,每个节点包含了一个 64 核处理器和 16 GB 的高带宽封装内存(MCDRAM),192 GB 的 DDR4 RAM 和 128 GB 的 SSD

Cerebras 的另一个客户劳伦斯·利弗莫尔国家实验室也来头不小,拥有世界排名第三的 Sequoia 超级计算机。CS-1 也有望进一步增强其模拟计算能力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18261

    浏览量

    222116
  • 晶体管
    +关注

    关注

    76

    文章

    9053

    浏览量

    135179
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264031
收藏 人收藏

    评论

    相关推荐

    关闭串口,LL_USART_DeInit和LL_USART_Disable这两个函数有什么区别呢?

    我写了一bootloader,使用串口中断接收数据,在跳转前需要关闭串口,请问这两个函数该用那一呢,这两个函数有什么区别呢
    发表于 04-07 06:11

    400MWh!金湾这两个储能项目开工!

    400MWh!金湾这两个储能项目开工! 珠海首个集中式储能电站 珠海最大的储能电站 珠海最大工商业储能项目之一 ... ... 近日,金湾集
    的头像 发表于 03-21 18:20 774次阅读
    400MWh!金湾<b class='flag-5'>这两个</b>储能<b class='flag-5'>项目</b>开工!

    stm32h750如何使用两个usb口?

    我现在在使用stm32h750芯片,想要使用两个usb口,一作为device连接电脑,一作为host连接u盘。spi之类的都有需要spi1 spi2这种,但是并不明白我这个usb怎
    发表于 02-26 06:51

    用CCU6捕获两个波形的上升沿,当这两个波形同时出现上升沿的时候,是怎么触发中断的啊?

    CCU6只有一中断函数,我用CCU6捕获两个波形的上升沿,当这两个波形同时出现上升沿的时候,是怎么触发中断的啊?是一前一后进入中断的吗,还是同时啊?求大神赐教啊!
    发表于 02-22 07:41

    小白请问电路里这两个半圆代表什么?

    请问电路里这两个半圆代表什么元件? 没有搜到呀。 另外,请问下图中的3.3v 电源是不是都要接到一起. 谢谢
    发表于 02-16 16:32

    ADXRS453能同时检测两个方向吗?

    ADXRS453的介绍中说可以检测两个方向X或Y,但是手册中只提供了一套速率寄存器RATE0和RATE1,只能用于方向。我的问题是ADXRS453能否同时检测两个方向的速率?如何读
    发表于 12-29 06:30

    请问AD7606的两个REGCAP引脚可以不接吗?

    从datasheet看AD7606的两个REGCAP引脚分别是两个2.5v LDO电源输出,这两个LDO输出是否是芯片内部需要使用的?如果不是是否可以电容不接,引脚悬空?
    发表于 12-21 06:20

    AD5235的RDY和SDO管脚,如果不使用这两个管脚对应的功能,是否可以将它们悬空?

    关于AD5235的RDY和SDO管脚,如果不使用这两个管脚对应的功能,是否可以将它们悬空。我看数据手册上说PR和WP两个管脚不用的话,要接到VDD,但是对于RDY和SDO没有明确的说,不用要怎样处理。
    发表于 12-20 08:11

    AD7793使用内部基准源,芯片的REF+、REF-这两个管脚怎么接,直接悬空吗?

    最近使用AD7793设计一款监测设备的采集电路,请问如果我使用内部基准源的话,那么芯片的REF+、REF-这两个管脚怎么接,直接悬空吗?在使用内部基准源的时候还有没有其他要注意的地方!谢谢!
    发表于 12-18 07:57

    AD9515的CLK与CLKB这两个引脚接差分时钟时哪个接CLK+,哪个接CLK-?

    时钟芯片AD9515的CLK与CLKB这两个引脚接差分时钟时哪个接CLK+,哪个接CLK-,还是两个怎样接都无所谓? 我看到AD9233的数据手册上是CLKB接的是CLK+,而CLK接的是CLK-
    发表于 12-12 07:23

    sigmastudio编译输出有”†“、”‡”这两个符号,会有什么隐患吗?

    请帮忙解答一下sigma studio编译输出如下提示信息是什么意思:出现了”†“、”‡”这两个符号,会有什么隐患吗?(† Call instruction present, actual cycle count may differ.) (当前跳跃指令,实际周期数可能有所不同。 )
    发表于 11-29 08:26

    电源这两个参数值,你有误读过吗?

    电源这两个参数值,你有误读过吗?
    的头像 发表于 11-27 16:33 196次阅读

    请问OP37S和AD574S这两个宇航级型号的结温(Junction Temperature)范围是多少?

    请问OP37S和AD574S这两个宇航级型号的结温(Junction Temperature)最大范围是多少?
    发表于 11-21 08:17

    什么是偏流?什么是偏流噪声?结合数据手册这两个指标在哪里可以查到呢?

    什么是偏流?什么是偏流噪声?结合数据手册这两个指标在哪里可以查到?
    发表于 11-13 10:48

    LPC55s69能否将USB1HS本身用于两个目的,即在ISP引导加载程序模式期间用作CDC_VCOM和ISP外设?

    LPC55s69 在我们的项目中用作主控制器。 我们能否将 USB1HS 本身用于两个目的,即在 ISP 引导加载程序模式期间用作 CDC_VCOM 和 ISP 外设?....因为这两个
    发表于 06-01 07:03