0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊发布新一代AI芯片Trainium3,性能提升4倍

Carol Li 来源:电子发烧友网 作者:李弯弯 2025-12-09 08:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)在拉斯维加斯举办的2025年亚马逊云科技re:Invent全球大会上,亚马逊云科技(AWS)推出新一代人工智能AI)训练芯片Trainium 3,预告了下一代产品Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。


作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、能效与扩展性的全面跃升。其计算性能较前代Trainium2提升4.4倍,内存带宽与能效分别增加4倍和40%,单芯片集成144GB高带宽内存(HBM3e),提供2.52FP8 PFLOPs算力。这一性能飞跃得益于三大技术创新:

3纳米制程工艺:晶体管密度提升70%以上,相同面积下集成更多计算单元,能效比提升40%,单位算力能耗降低40%。
Neuron Fabric互联技术:单台Trn3 UltraServer可集成144颗芯片,通过EC2 UltraClusters 3.0架构扩展至百万颗芯片集群,规模较上一代提升10倍,时延降低4倍。
智能功耗管理:动态调节供电频率,高负载时提升计算核心性能,空闲时降低功耗,平衡性能与能效。

实测数据显示,Trainium3在训练OpenAI GPT-OSS模型时,单芯片吞吐量提升3倍,推理响应速度提升4倍,训练成本降低50%。

Trainium3的登场并非孤立事件,其前代产品Trainium2已为亚马逊AI芯片生态奠定基础。作为AWS在2024年推出的第二代AI训练芯片,Trainium2采用多核架构设计,支持高并发计算,峰值性能达每秒数千亿次浮点运算,性价比较GPU实例提升30%-40%。

其核心优势包括,定制化硬件优化,针对Transformer架构设计注意力机制加速单元,大语言模型训练效率提升40%。NeuronLink超速互联,通过低延迟网络连接4个Trn2服务器,形成83.2Petaflops算力的UltraServer,支持超大规模模型训练。生态兼容性,支持TensorFlow、PyTorch等主流框架,无缝迁移现有模型,降低技术门槛。

Trainium2的商业化已取得实质进展。Adobe、Poolside等企业利用其训练和部署AI模型,Anthropic的“Project Rainier”项目更通过数十万颗Trainium2芯片构建超级集群,算力较前代提升5倍。

wKgZPGk2nJqAETwvAAJQOrEQAL4386.png


AWS在发布Trainium3的同时,预告了下一代芯片Trainium4的研发进展,其核心突破在于与英伟达生态的深度整合。支持英伟达GPU与Trainium芯片高速互联,形成机架级AI基础设施,兼顾性能与成本。FP8算力提升3倍,FP4算力提升6倍,内存带宽提升4倍,模型训练与推理吞吐量至少提升3倍。通过持续软硬件协同,实际性能提升将远超基准数值,降低客户迁移成本。

这一战略调整直指AI芯片市场的核心矛盾:性能竞争与生态壁垒。尽管Trainium3内存容量(144GB)较谷歌TPU(192GB)和英伟达Blackwell(288GB)存在差距,但通过与英伟达的合作,AWS试图在保持性价比优势的同时,吸引依赖英伟达生态的客户迁移至Trainium平台。

亚马逊的芯片战略已初见成效。截至2024年,Trainium系列在AWS数据中心部署速度超预期,Anthropic计划年底使用超百万颗Trainium2芯片。对于客户而言,Trainium3的性价比优势显著。其一成本降低,与GPU系统相比,训练和推理成本最高降低50%,碳排放减少40%。其二弹性扩展,支持从单芯片到百万芯片集群的无缝扩展,满足不同规模需求。其三行业适配,覆盖金融风控、医疗影像分析、自动驾驶等高并发场景,推动AI技术商业化落地。

然而,挑战依然存在。亚马逊需进一步丰富软件库生态,吸引更多第三方开发者采用Trainium平台。对此,AWS通过提供Neuron SDK开发套件、性能分析工具等,降低模型迁移门槛,同时以Trainium4的生态兼容性为长期竞争力铺路。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2746

    浏览量

    85950
  • AI芯片
    +关注

    关注

    17

    文章

    2187

    浏览量

    36890
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里平头哥发布真武M890:144GB显存,三性能

    近日,阿里云峰会上,平头哥正式发布新一代训推AI芯片真武M890,内置144GB HBM显存,片间互联带宽达800GB/s,整体
    的头像 发表于 05-27 10:17 362次阅读

    紫光展锐携手华阳通用共同发布新一代AI座舱平台

    2026年4月24日,以“领时代 智未来”为主题的2026北京国际汽车展览会盛大启幕。在这场全球汽车科技风向标盛会上,智能汽车芯片的主力军—紫光展锐携手ADAYO华阳通用联合发布搭载旗舰级芯片
    的头像 发表于 04-28 10:21 534次阅读

    海奇半导体重磅发布新一代投影芯片

    3月26日,国家级专精特新重点“小巨人”企业珠海海奇半导体有限公司新品发布会圆满举办,重磅推出新一代投影芯片及全系创新产品。
    的头像 发表于 03-26 16:47 1046次阅读

    从点云到图像级!华为新一代896线激光雷达来袭,分辨率提升4

    34日,华为举办鸿蒙智能技术焕新发布会,华为乾崑宣布正式发布全球量产最高规格的双光路图像级激光雷达。新一代896线激光雷达并非仅仅是线数的
    的头像 发表于 03-05 15:45 1.6w次阅读
    从点云到图像级!华为<b class='flag-5'>新一代</b>896线激光雷达来袭,分辨率<b class='flag-5'>提升</b><b class='flag-5'>4</b><b class='flag-5'>倍</b>

    进迭时空发布新一代RISC-V AI CPU芯片,满足端侧大模型算力需求

    电子发烧友网报道 1月29日,进迭时空线上发布新一代AI CPU芯片——K3。作为全球首颗符合RVA23规范的量产RISC-V
    的头像 发表于 01-30 14:06 9746次阅读

    曦望发布新一代推理GPU芯片,单位Token推理成本降低90%

    已突破万片。   启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10。在算力与存储设计
    的头像 发表于 01-28 17:38 9900次阅读

    今日看点:消息称 AMD、高通考虑导入 SOCAMM 内存;曦望发布新一代推理GPU芯片启望S3

    曦望发布新一代推理GPU芯片启望S3 近日,浙江杭州GPU创企曦望(Sunrise)发布新一代
    发表于 01-28 11:09 1451次阅读

    微软发布AI芯片Maia 200,性能超越谷歌TPU和亚马逊Trainium

    。   Maia 200采用台积电先进的3纳米工艺制造,现已开始部署至爱荷华州的数据中心,后续还将进驻凤凰城地区。微软云与AI业务负责人Scott Guthrie在博客文章中宣称,Maia 200是“微软有史以来部署的最高效推理系统”,每美元
    的头像 发表于 01-27 16:46 7640次阅读
    微软<b class='flag-5'>发布</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>Maia 200,<b class='flag-5'>性能</b>超越谷歌TPU和<b class='flag-5'>亚马逊</b><b class='flag-5'>Trainium</b>

    云巨头算力战升级!微软新一代3nm AI推理芯片性能提升30%,落地数据中心

    据外媒报道,微软发布新一代人工智能芯片Maia 200,这款芯片有望成为英伟达旗舰处理器以及云服务竞争对手亚马逊、谷歌同类产品的替代选择。微
    的头像 发表于 01-27 12:29 1.1w次阅读
    云巨头算力战升级!微软<b class='flag-5'>新一代</b><b class='flag-5'>3</b>nm <b class='flag-5'>AI</b>推理<b class='flag-5'>芯片</b><b class='flag-5'>性能</b><b class='flag-5'>提升</b>30%,落地数据中心

    今日看点:微软发布新定制 AI 芯片 Maia 200;国芯科技累计出货2500万颗创新高

    工艺制造,目前已开始部署于微软数据中心。   Maia 200 在特定性能指标上显著优于同类产品:其 FP4 性能达到了亚马逊第三
    发表于 01-27 10:23 1236次阅读

    亚马逊新一代自研服务器芯片Graviton5问世,性能提升25%

    ,基于Graviton5的全新EC2 M9g实例性能提升高达25%,其每个芯片配备192核及5扩容缓存,助力客户在扩展工作负载、提升应用
    的头像 发表于 12-09 08:33 5786次阅读

    耐能正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐能今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端到云端的完整
    的头像 发表于 11-28 15:01 918次阅读

    今日看点丨两家国产头部厂商发布新一代AI芯片 ;台积电在美先进封装布局启动

        H20重返中国在即,两家国产头部厂商发布新一代AI芯片   日前,燧原科技和沐曦这两家头部国产AI
    发表于 07-28 10:41 2701次阅读
    今日看点丨两家国产头部厂商<b class='flag-5'>发布</b><b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b> ;台积电在美先进封装布局启动

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1393次阅读

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为智能驾驶的“用车伙伴”和“出行伴侣”。通过创新AI大模型
    的头像 发表于 06-17 09:22 1519次阅读