在 2020 年度的 re:Invent 大会上,亚马逊云服务(AWS)推出了全新的机器学习定制训练芯片 Trainium 。通过对 TensorFlow、PyTorch 和 MXNet 提供支持,该公司希望带来比任何竞争对手都更高的性能表现。此外 Trainium 还可作为一个 EC2 实例,在 AWS 的 SageMaker 机器学习平台上使用,基于这些定制芯片的新实例将于 2021 上半年推出。
Trainium 具有相当显著的速度和成本优势,与标准的 AWS GPU 实例相比,AWS 承诺可带来 30% 的吞吐量提升、以及降低 45% 的单次引用成本。
此外 AWS 正与英特尔合作启动基于 Habana Gaudi 的 EC2 机器学习训练实例。与定于 2021 年推出的版本相比,未来版本有望带来高达 40% 的性价比提升。
需要指出的是,两款新产品都是去年 re:Invent 大会上推出的 AWS Inferentia 定制芯片方案的补充,且 Trainium 使用了与 Inferentia 相同的软件开发套件(SDK)。
据悉,在机器学习基础架构中,90% 的开销都用于解决推理成本。尽管 Inferentia 有着成本方面的优势,但开发团队也受到了固定 ML 训练的预算限制。
为了突破训练范围和频度的限制,AWS Trainium 通过以云为中心的 ML 训练,带来了最高性能和最低成本。结合两者,客户能够切实扩展 ML 训练的工作量、同时加速端到端的部署。
责编AJX
-
芯片
+关注
关注
463文章
54441浏览量
469424 -
机器学习
+关注
关注
67文章
8565浏览量
137228 -
AWS
+关注
关注
0文章
444浏览量
26634
发布评论请先 登录
Edge Impulse 唤醒词模型训练 | 技术集结
今日看点:微软发布新定制 AI 芯片 Maia 200;国芯科技累计出货2500万颗创新高
NVIDIA在CES 2026发布全新物理AI模型
机器学习和深度学习中需避免的 7 个常见错误与局限性
深度解析48V系统如何革新机器人技术
穿孔机顶头检测仪 机器视觉深度学习
NVIDIA和AWS扩展全栈合作伙伴关系
亚马逊发布新一代AI芯片Trainium3,性能提升4倍
NVIDIA Isaac Lab推动机器人技术突破
超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.
【Sipeed MaixCAM Pro开发板试用体验】 + 04 + 机器学习YOLO体验
NVIDIA Isaac Lab可用环境与强化学习脚本使用指南
NVIDIA推出适用于机器人的OpenUSD资产结构管线
AWS推全新机器学习定制训练芯片Trainium
评论