0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊启动“登月”计划,目标部署10万颗自研AI芯片

Felix分析 来源:电子发烧友网 作者:吴子鹏 2024-12-02 00:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)日前,彭博社发文称,为减少对英伟达芯片的依赖,亚马逊已经秘密启动了“登月”(moonshot)的计划,目前正在其位于得克萨斯州奥斯汀的工程实验室加紧研发一款新的AI芯片:Trainium2,目标是在亚马逊自己的数据中心里部署10万颗Trainium2,以提高数据处理效率并降低AI芯片采购成本。

近几年,亚马逊一直都在致力于自研芯片以降低数据中心成本,根据云成本管理和优化平台Vantage此前的一项调查数据,在Amazon EC2 M7系列通用实例的成本支出方面,采用Amazon Graviton的M7g系列已经超过三分之一(34.5%)。

亚马逊自研芯片第一次亮相始于2016年,在当年的re:Invent大会上,亚马逊云传奇工程师James Hamilton展示了该公司第一颗自研芯片,这便是第一代Graviton芯片。和英特尔AMD的芯片不同,第一代Graviton芯片便是基于Arm架构的Neoverse内核打造,可以支持2x25G以太网的数据包处理。随后,亚马逊在2019年推出了Graviton2、2021年推出了Graviton3、2023年推出了Graviton4。

作为最新版本的Graviton芯片,Graviton4采用了最先进的Arm架构 Neoverse V2 核心,具有更高的计算核心数量和更快的内存带宽。7月15日,亚马逊发布了基于自研芯片Graviton4的Amazon EC2 R8g实例。根据phoronix测试的结果,和上一代芯片Graviton3相比,Graviton4性能提升达30%以上,内核数增加50%,内存带宽增加75%。

同时,根据测试结果,Graviton4处理器的性能略优于英特尔至强处理器约5%,但AMD的EPYC处理器在整体性能上仍领先约25%。有评测报告认为,Graviton4搭载的Neoverse-V2内核与英特尔Sapphire Rapids内核在性能上旗鼓相当,在某些工作负载下甚至优于AMD第四代EPYC。

Graviton4处理器发布于2023年11月28日,与其同时发布的还有升级款处理器Trainium2。AWS首席执行官Adam Selipsky在re:Invent主题演讲中透露,亚马逊已经购买了数百万个英伟达的A100和H100产品,在此方面投入了巨大的成本。而业界人士预测,Trainium2是一颗有望正面和英伟达H100芯片竞争的AI芯片。

Trainium2是多年磨一剑的产品,据悉在亚马逊2015年收购Annapurna Labs之后,这个项目就在秘密研发。根据亚马逊方面的数据,Trainium2相较于上一代产品,训练速度提升多达4倍,能效提升多达2倍,内存容量则达此前3倍,能在EC2 UltraClusters中扩展至多达10万个芯片,可以在极短的时间内训练基础模型和大语言模型。目前,该芯片已经在接受包括Anthropic、Databricks、Stockmark三家AI创企以及德国电信、日本理光在内的多个客户的测试。

同时,亚马逊方面表示,Trainium2芯片已在数据中心部署,预计将在俄亥俄州等多个核心数据中心推广,目标是形成多达100000个芯片的集群。而这正是亚马逊秘密计划——“登月”计划的一部分。按照规划,Trainium2芯片先期主要承担亚马逊内部的AI训练项目,并在初创企业客户方面得到测试,随着项目成熟将陆续有大客户导入到基于Trainium2芯片的算力平台上,一旦大客户有项目使用,亚马逊Trainium2芯片的任务便被视为取得成功。

不过,业内人士认为,亚马逊Trainium2芯片也面临诸多方面的挑战,其中最显著的两大挑战是自研芯片本身和软件生态。在自研芯片方面,由于英伟达在通用计算GPU领域已经积累了深厚的研发经验,单芯片的优化已经接近了极限,要想实现超越,尤其是在核心指标PPA方面实现超越,可能需要更加前沿的工艺平台进行芯片实现,或者在芯片设计过程中导入工程设计的“know how”,但无论怎样的技术路径,背后面临的挑战都是巨大的,且可能会由于先期用量低而导致高昂的成本,再加上本就客观存在的研发成本,这对公司内部推进自研芯片的决心会有挑战。

在软件方面的挑战就更大了,目前全球主要的GPGPU基本是依存于英伟达的CUDA生态生存,如果不兼容基本很难部署落地,这就导致英伟达在软硬件结合方面具有巨大的先发优势。重新部署软件生态当然也是有效的途径,一旦成功会获得巨大的商业回报。但分析人士认为,目前亚马逊提供的Neural SDK软件工具尚处于初期阶段,无法与英伟达的解决方案相匹敌。

结语

就像人类登月一样,亚马逊Trainium2芯片的野心是巨大的,一旦成功带来的商业回报也是非常可观的。但登月本就凶险万分,Trainium2芯片离成功替代英伟达H100还有很长很长的路要走。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2722

    浏览量

    85442
  • AI芯片
    +关注

    关注

    17

    文章

    2065

    浏览量

    36570
  • 登月
    +关注

    关注

    0

    文章

    5

    浏览量

    1999
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    宝马AI智能体平台“盖亚”正式投入运行

    近日,宝马AI智能体平台“盖亚”(GAIA,Group Artificial Intelligence Assistant)正式投入运行。作为国内首批自主研发并部署企业级
    的头像 发表于 11-21 11:06 517次阅读

    AI业界新闻:OpenAI官宣芯片 黄仁勋时隔9年再次给马斯克“送货”

    给大家带来一些AI业界新闻: OpenAI官宣芯片 OpenAI宣布与博通合作
    的头像 发表于 10-14 18:42 1652次阅读

    亚马逊云科技在中国区域推出Amazon Graviton4实例 以芯片驱动企业算力升级

    北京2025年9月10日 /美通社/ -- 亚马逊云科技宣布,通过与光环新网和西云数据的紧密合作,在亚马逊云科技(北京)区域和亚马逊云科技(宁夏)区域推出基于新一代
    的头像 发表于 09-10 20:51 550次阅读

    江波龙UFS4.1主控芯片,顺序读取速率高达4350MB/s,性能对标主流产品

    电子发烧友网报道(文/黄晶晶)近年来,江波龙主控芯片取得较大的进展。截止至2025年7月底,江波龙主控芯片全系列产品累计实现超过8000
    的头像 发表于 09-04 09:15 1w次阅读
    江波龙<b class='flag-5'>自</b><b class='flag-5'>研</b>UFS4.1主控<b class='flag-5'>芯片</b>,顺序读取速率高达4350MB/s,性能对标主流产品

    集创北方联合发布首RRAM AMOLED显示驱动芯片

    近日,集创北方携手清华大学集成电路学院团队与新忆科技共同推出首采用RRAM新型存储技术的AMOLED显示驱动芯片(DDIC)“集忆智显”系列首款
    的头像 发表于 08-30 11:50 1237次阅读
    集创北方联合发布首<b class='flag-5'>颗</b><b class='flag-5'>自</b><b class='flag-5'>研</b>RRAM AMOLED显示驱动<b class='flag-5'>芯片</b>

    Arm CEO:公司正在芯片

    据外媒路透社报道,Arm CEO Rene Haas透露,Arm正在投资开发自有芯片,并计划将部分利润投资于制造自己的芯片和其他组件。与之对应的是Arm预测的下一财季经营业绩也会因为
    的头像 发表于 07-31 11:49 466次阅读

    又一国产GPU芯片成功点亮!6nm制程,TrueGPU架构

    电子发烧友网综合报道 近日消息,砺算科技宣布其首架构全自主知识产权GPU芯片在封装回片后已成功点亮,结果符合预期。   砺算科技成立于2021年,是一家致力于研发高性能GPU的公
    发表于 05-29 00:48 2412次阅读

    今日看点丨小鹏芯片或5月上车;安森美将在重组期间裁员2400人

    车型,该车将是搭载芯片的首款车型,内部代号或为“F57”。   去年8月27日,小鹏汽车召开发布会,正式发布了其
    发表于 02-26 10:55 415次阅读

    传DeepSeek芯片,厂商们要把AI成本打下来

    电子发烧友网报道(文/黄晶晶)日前业界消息称,DeepSeek正广泛招募芯片设计人才,加速芯片布局,其芯片应用于端侧或云侧尚不明朗。不少
    的头像 发表于 02-16 00:09 3894次阅读
    传DeepSeek<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>芯片</b>,厂商们要把<b class='flag-5'>AI</b>成本打下来

    华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek R1模型的部署流程。该平台依托昇腾芯片
    的头像 发表于 02-14 16:08 2621次阅读
    <b class='flag-5'>研</b>华边缘<b class='flag-5'>AI</b> Box MIC-ATL3S<b class='flag-5'>部署</b>Deepseek R1模型

    OpenAIAI芯片即将面世

    OpenAI正加速推进其自主研发AI芯片计划,旨在减少对外部芯片供应商,尤其是英伟达的依赖。据消息人士透露,这家ChatGPT的开发者预计将在不久的将来完成其首款内部人工智能
    的头像 发表于 02-11 16:51 907次阅读

    OpenAIAI芯片即将进入试生产阶段

    据最新报道,OpenAI正加速推进其减少对英伟达芯片依赖的战略计划,并即将迎来重大突破——其首款人工智能芯片已完成设计工作,即将进入试生
    的头像 发表于 02-11 11:04 924次阅读

    苹果AI芯片,或终结与英伟达多年合作

    苹果公司正加速推进AI芯片的步伐,旨在减少对外部供应商的依赖,这一战略调整或将彻底改变其与英伟达长达数十年的合作关系。 尽管目前苹果仍在与英伟达合作,为Apple Intellig
    的头像 发表于 12-27 10:18 898次阅读

    苹果计划2025年起采用蓝牙Wi-Fi芯片

    近日,据最新报道,苹果公司为了减少对博通(Broadcom)的依赖,并进一步提升其设备的性能和能效,已经制定了一项重要的芯片计划。据悉,从2025年开始,苹果将正式启用
    的头像 发表于 12-18 14:22 1439次阅读

    亚马逊转向Trainium芯片,全力投入AI模型训练

    近日,亚马逊宣布了一项重大决策,决定停止Inferentia AI芯片的开发,转而将全部精力投入到Trainium芯片的研发上,以此作为与英伟达竞争的新策略。
    的头像 发表于 12-13 14:14 963次阅读