0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊再发两款自研芯片,训练芯片时隔三年迎来更新

E4Life 来源:电子发烧友网 作者:周凯扬 2023-11-30 00:09 次阅读

电子发烧友网报道(文/周凯扬)在今年的AWS re:Invent上,云服务巨头亚马逊公开了两款全新的自研芯片,一是基于Arm架构的新一代Gravition CPU,Gravition4,另一款则是时隔数年终于更新的Trainium2。

第四代自研Arm服务器CPU

从2018年11月,到今年的11月,Gravition这一亚马逊自研的服务器CPU已经迭代了数个版本,Gravition4作为该系列最新产品,自然也拥有最强大的性能表现。Gravition4集成了96个Arm Neoverse V2内核,每个内核配置了2MB的L2缓存,加上12个DDR5-5600通道。相比上一代,Gravition4的核心数多出了50%,计算性能提高了30%,L2缓存变为两倍,内存带宽也提高了75%,可以毫无疑问地说,Gravition4将成为AWS自研硬件服务器矩阵的新王牌。

不过AWS计算与网络服务副总裁David Brown表示,跑分与现实应用负载相去甚远,往往不能代表芯片的真实性能表现,所以亚马逊更愿意用实际应用的成绩来展示Gravition4的性能提升。在MySQL这样的数据库应用中,Gravition4展现出了高出Gravition3 40%的性能。在网页应用上,Gravition4比上一代快30%,在大型Java应用中快45%。

而且毫不夸张地说,Gravition4也是目前对 ML硬件支持最为完善的CPU了。除了自研的Inferentia和Trainium系列芯片以外,亚马逊也为Gravition4组合打造了支持英伟达A100、H100、英特尔Habana Gaudi、高通AI100的容器。

训练芯片终于迎来第二代

在去年的AWS re:Invent上,亚马逊公开了全新的Inferentia2芯片,这也是其自研AI芯片矩阵中的推理芯片,但其训练芯片Trainium却没有同步更新,直到今年的AWS re:Invent上Trainium2的发布,才终于为这个3年前开辟的产品线带来了新品。

如今爆发式的生成式AI应用需要利用庞大的数据集进行训练,比如最近兴起的静态图片生成视频应用。这些基础模型或大语言模型的参数从千亿到万亿不等,需要更高的算力才能支撑起来。

更高的性能也是Trainium2本次升级的重点,根据亚马逊提供的数据,相较于第一代Trainium芯片,Trainium2提供了4倍的训练性能和3倍的内存容量,与此同时还将能效比提高至上一代的两倍。在扩展性上,亚马逊最高可提供 10万颗Trainium2芯片互联,从而实现高达65 exaflops的算力,提供超算级的性能。在这样的规模下,训练一个3000亿参数的LLM只要数周时间。

不过,与已经进入预先使用阶段且未来几个月就将开放使用的Gravition4不同,Trainium2应该仍在量产过程中,亚马逊表示明年某个时间才会投入使用。

写在最后

从亚马逊雷打不动的发布频率来看,他们在自研服务器芯片的设计上相当积极,多次首发Arm Neoverse的最新核心。而且从服务器部署情况来看,他们也没有在量产上遇到太多的问题,几乎可以推测除了英伟达以外,亚马逊应该就是台积电先进封装的最大使用者了。此外,亚马逊对待第三方硬件的策略也相当聪明,亚马逊并没有选择去追求极致的性能,而是借助自研芯片打造更具性价比的方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2480

    浏览量

    82380
收藏 人收藏

    评论

    相关推荐

    芯片电子元件2024迎来增长反弹的一吗?

    芯片电子元件
    芯广场
    发布于 :2024年02月19日 11:18:54

    555芯片的引脚功能 555集成芯片的使用方法 使用555芯片时的注意事项

    555芯片的引脚功能 555集成芯片的使用方法 使用555芯片时的注意事项  555芯片是一种常用的集成电路芯片,常用于定时、脉冲信号产生和
    的头像 发表于 02-02 13:57 3387次阅读

    AD8368输出端出现激信号的原因?

    在使用ADI的AGC芯片时,发现在小信号或者无信号输入的时候,ad8368输出端出现激信号,激信号在1.6-1.8赫兹左右; 这个芯片我们分别用在发射和接收链路(发射使用频率31
    发表于 11-23 06:12

    AD620与AD627两款产品各自适合的信号输入的频率范围是多少?

    您好,我想询问一下AD620与AD627两款产品各自适合的信号输入的频率范围。
    发表于 11-14 06:08

    两款性能卓越的步进电机驱动控制芯片TMC5272、TMC5271

    芯片步进电机驱动
    卓联微科技
    发布于 :2023年11月04日 09:42:05

    控制多片PLL芯片时,串行控制线是否可以复用?

    控制多片PLL芯片时,串行控制线是否可以复用? 当需要控制多片PLL芯片时,使用复杂电路来进行控制并非理想方案,因为使用多个电路芯片会导致整个系统变得复杂且难以处理。因此,确定一个适当的解决方案
    的头像 发表于 10-30 10:16 173次阅读

    写flash芯片时为什么需要先擦除?

    写flash芯片时为什么需要先擦除? 在讲解为什么需要先擦除Flash芯片之前,先来了解一下Flash芯片的基本概念和组成部分。 Flash芯片是非易失性存储器,内部由多个块组成,每个
    的头像 发表于 10-29 17:24 2906次阅读

    芯片时钟不稳定会怎么样?芯片内部时钟紊乱的原因

    芯片时钟不稳定会怎么样?芯片内部时钟紊乱的原因  芯片是电子设备中最重要的组成部分之一,因为它们负责控制电子设备的整个操作,并保证设备的稳定运行。在芯片中,时钟是一个非常重要的元素,因
    的头像 发表于 10-25 15:07 1323次阅读

    华为麒麟9000S是三年芯片

    最近华为再度在其旗舰手机上使用了麒麟芯片,这一消息对许多网友来说相当振奋。然而,有些网友根据麒麟芯片上的丝印提出了一个猜测,即这批麒麟9000S可能是在三年前就开始储备的。
    的头像 发表于 09-03 15:34 4247次阅读

    RISC-V强势崛起为芯片架构第

    单元)类的SoC芯片(系统级芯片)采用RISC-V,包括蓝牙、Wi-Fi、智能语音芯片等。 最近两年,RISC-V在高性能AI、AP类的芯片
    发表于 08-30 13:53

    亚马逊,大力发展芯片

    亚马逊网络服务首席执行官 Adam Selipsky在 6 月份接受 CNBC 采访时表示:“全世界都希望有更多芯片用于生成人工智能,无论是 GPU 还是我们正在设计的亚马逊自己的芯片
    的头像 发表于 08-14 13:33 381次阅读

    华为麒麟芯片回归 麒麟芯片迎来新突破

    有博主爆料称华为麒麟芯片将在今年正式回归市场,并目前处于良率爬坡阶段。在2020年受到制裁后,上一代麒麟9000芯片被迫停产,而现在,经过三年的努力,华为麒麟芯片终于取得了一定的突破。
    的头像 发表于 07-25 16:54 4808次阅读

    NUC131 IO口直接PWM驱动步进电机,这两款芯片的PWM区别很大吗?

    用NUC131LD2AE 的PWM0 和PWM1直接驱动2个四线步进电机,用M0516的程序改了改总是不行,这两款芯片的PWM区别很大吗?请教大神有NUC131驱动步进电机的代码吗,
    发表于 06-13 07:30

    高通骁龙8 Gen4放弃公版:升级架构Oryon CPU

    ARM正酝酿对其IP授权模式进行大刀阔斧地改革。 对此,数码闲聊站分享称,ARM授权收紧,高通最快在SM8750也就是骁龙8 Gen4开始使用架构Nuvia,2+6 8核设计。 此前,虽然高通骁
    发表于 05-28 08:49

    请问一下使用can中继芯片时都该注意什么呢?

    请问一下使用can中继芯片时都该注意什么呢?
    发表于 05-09 10:42