0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

变革性技术机器学习把硅战争带到云端

454398 来源:开源云中文社区 作者:开源云中文社区 2020-12-30 11:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AWS全球基础设施和客户支持高级副总裁Peter DeSantis在AWS Re:Invent年度用户活动上发表主旨演讲时表示,与CPU巨头AMDIntel提供的处理器相比AWS的处理器和芯片设计在云应用程序性能方面具有优越性,而且AWS的图形处理器性能超过了Nvidia为机器学习(ML)提供的GPU。他指的是AWS Graviton2处理器,由AWS使用64位Arm Neoverse定制。

随着AWS上以及Azure和Google Cloud Platform(GCP)上可用选择的爆炸式增长,客户可能会越来越仔细地考虑应用程序性能和服务提供的成本/性能比。这样,底层芯片和服务器基础设施将成为决定云原生应用程序性能、功耗以及成本的关键因素。

因此,AWS希望旗舰64位基于ARM的Gravion2和其他内部设计的处理器的强大功能发挥重要作用,以帮助客户提高其应用程序的性能。

DeSantis说:“对AWS硅技术的深度投资真正令人兴奋和带来变革的是能够跨定制硬件和软件工作,以提供独特的功能。通过在整个堆栈中工作,我们能够比以往任何时候更快地实现这些改进。”

发力芯片

Graviton2有望通过多种方式进一步提高应用程序性能。DeSantis作出了大胆的声明,AWS Graviton2提供了优于传统设计的性能、节能优势和安全性。AWS还公开表示,为Amazon EC2 T4g、M6g、C6g和R6g实例以及基于本地NVMe的SSD存储的“变体”提供动力的Graviton2“为各种工作负载”提供了比基于x86的实例高出40%的性价比

DeSantis说,在基于Graviton的Amazon EC2 A1实例中引入Graviton的目的是让AWS“与客户和ISV合作伙伴合作,了解他们在现代64位ARM处理器上运行工作负载需要什么”。

DeSantis解释说,如今用户需要的是将处理器设计与在云环境中运行的高度分布式微服务应用程序相匹配的能力。今天的开发者也基本上不再用C++编写云原生应用程序,而是用GO和Ruat,并且“完全改变了高性能多线程应用程序的开发”。

“对我来说,最令人兴奋的趋势之一是转向基于服务的架构,从大型单体应用程序向小型专门构建的独立应用程序发展。这正是容器和Lambda支持的计算类型。虽然横向扩展计算已经发展到利用更高核心处理器,但处理器设计师从未真正抛弃旧世界。他们试图做到这两个方面,既满足传统应用程序的需要,又满足现代扩展应用程序的需要。”

DeSantis在重申Graviton2的设计者“专注于确保每个核心都能为现代云工作负载提供最真实的性能”的同时,还暗指传统的CPU性能基准(如用于衡量PC和服务器性能的基准)不再适用。“我们利用运行实际横向扩展应用程序的经验,确定需要在哪些方面添加功能以确保最佳性能。”

DeSantis还表示,Graviton2的设计旨在节省每个芯片的硅表面,同时通过减少内核数量来降低功耗——这是衡量处理器性能的传统方法。

“我们设计Graviton的目的是有尽可能多的独立核心,而尽管独立,Graviton两个核心的设计是一致的。”

Snap的工程高级副总裁Jerry Hunter表示,Snap使用Graviron2有助于降低AWS DynamoDB和S3的成本和能耗。除了用AWS的DynamoDB和S3进行存储外,他还看到了Graviton2“在不消耗大量能源的情况下为客户降低成本并创造更好的性能”。

Hunter说,Snap向Graviton2的转变“非常简单”,API“与以前使用的非常相似”,因此“不需要花太多时间来迁移代码以进行测试。我们节省了20%的成本,这是非常棒的,因为我们能够切换此负载,并立即获得成本节约和更高的性能。”

芯片上的机器学习

虽然没有透露具体的基准测试,DeSantis还表示AWS优于Nvidia。总的来说,与用于支持ML的大规模推理基础设施的GPU相比,AWS Inferentia提供了“以一半的成本实现了最高的吞吐量(每次推理)”。具体到Nvidia,DeSantis说Amazon Alexa最近将其推理工作负载从基于Nvidia GPU的硬件转移到了基于Inferentia的EC2实例,成本降低了30%,延迟降低了25%。

对于ML开发人员,AWS的Neuron团队提供了TensorFlow、PyTorch和Apache MXNet等框架来设计运行在Inferntia上的应用程序。DeSantis说:“开发人员可以利用Inferntia的成本节约和性能,而不需要对ML代码进行很多更改或根本不做任何更改,并保持对其他ML处理器的支持。”

在没有透露具体细节的情况下,DeSantis说,AWS为ML设计的下一款硅芯片将包括明年推出的AWS Trainium。

“我们在机器学习芯片上的投资才刚刚开始。正如Inferentia所做的那样,Trainium将提供最低成本和最高性能的方式来运行训练工作负载。”

对于ML开发团队,AWS还通过机器学习扩展运维,并将AWS的数据库服务(包括S3和Dynamo)与AWS SageMaker及其ML基础设施集成在一起。有了正确的硅基础设施和开发工具,目的是提供一个机器学习平台可以满足DevOps团队的需求,因为他们可以在不改变基础设施和工具集的情况下,从10或100个ML项目模型扩展到1000个。

“这是一种变革性的技术。我认为,开始机器学习并开始进行概念验证非常重要,而AWS提供的工具使其变得更加容易,”AWS ML的副总裁Bratin Saha表示。“所以,我认为让客户明白机器学习是现在的关键,而不是未来,这一点非常重要。”
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11224

    浏览量

    223125
  • NVIDIA
    +关注

    关注

    14

    文章

    5511

    浏览量

    109159
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136285
  • AWS
    AWS
    +关注

    关注

    0

    文章

    444

    浏览量

    26330
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CES Asia 2025蓄势待发,聚焦低空经济与AI,引领未来产业新变革

    可能。智能无人机在物流配送、巡检监测等领域的应用愈发成熟,大大提高了工作效率和精准度。低空经济的发展,不仅带动了相关技术的进步,还创造了新的就业机会和经济增长点。 人工智能领域同样发展迅猛,深度学习
    发表于 07-09 10:29

    Arm技术赋能机器人行业变革

    机器人早已不再局限于工厂车间或科幻电影,它们已经融入人们的日常生活,或许是客厅里默默工作的扫地机器人,又或是在超市里引导顾客完成购物的自助收银机,这些早已不是新奇事物,而是广泛技术变革
    的头像 发表于 06-26 09:35 1013次阅读

    艾默生 SolaHD 通过 \"从地板到云端™\"解决方案和在线产品配置器推进电能质量管理

    代码:EMR)是一家全球技术与工程公司,通过创新解决方案推动世界向更健康、更安全、更智能、更可持续的方向发展。 艾默生旗下电能质量解决方案专家SolaHD正通过其\"从设备层到云端
    发表于 06-10 14:50

    边缘计算如何颠覆人工智能变革

    变革。然而,如何将这些强大的AI能力从云端成功迁移至实际应用,尤其是在资源受限的边缘环境中,已成为技术领袖们亟待攻克的战略要地。
    的头像 发表于 05-30 09:29 862次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    通过网络连接云端服务器进行快速检索和分析,然后利用语音合成技术将答案以自然流畅的语音反馈给用户。同时,借助开发板的网络连接功能,语音机器人还可以与后台管理系统进行数据交互,实时更新知识库和优化服务策略
    发表于 05-28 11:36

    未来战争的后勤革命:解码RFID技术如何用数据赋能军事物流规则

    在现代战争的硝烟中,后勤保障体系的每一次革新都在悄然改变着战争形态。当无人机在天空盘旋、智能算法在指挥系统流转时,另一场静默的变革正在军事仓储领域展开。通过射频识别技术(RFID)构建
    的头像 发表于 05-27 16:47 417次阅读

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的限制和调控) 本书还有很多前沿技术项目的扩展 比如神经网络识别例程,机器学习图像识别的原理,yolo图像追踪的原理 机器学习训练三大点:
    发表于 04-30 01:05

    **【技术干货】Nordic nRF54系列芯片:传感器数据采集与AI机器学习的完美结合**

    技术干货】nRF54系列芯片:传感器数据采集与AI机器学习的完美结合 近期收到不少伙伴咨询nRF54系列芯片的应用与技术细节,今天我们整理几个核心问题与解答,带你快速掌握如何在nRF
    发表于 04-01 00:00

    SLAMTEC Aurora:深度学习“卷”进机器人日常

    在人工智能和机器技术飞速发展的今天,深度学习与SLAM(同步定位与地图构建)技术的结合,正引领着智能机器人行业迈向新的高度。最近科技圈顶流
    的头像 发表于 02-19 15:49 737次阅读

    人工智能在未来战争中占主导地位?

          人工智能在未来战争中占主导地位,这一议题在当前军事理论和战略研究中愈发凸显其重要。随着科技的飞速发展,人工智能不仅改变了我们的日常生活,更在军事领域引发了深刻的变革。本文将从多个维度
    的头像 发表于 01-22 08:05 1009次阅读

    检测铝矾土铝钛的设备 测试铝土矿的机器

    检测铝矾土铝钛的设备 测试铝土矿的机器 检测铝矾土铝钛的设备 测试铝土矿的机器 主要技术指标: 测量范围:0~1.999A吸光度值 0~
    发表于 12-30 09:47

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    的局限性以及衡量大模型的关键指标。阅读了该部分后,我感受到了一种前所未有的震撼,这种震撼不仅来源于技术本身的先进,更来源于它对传统机器人控制方式的颠覆。 传统机器人的局限性与大模型的
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.全书概览与第一章学习

    非常感谢电子发烧友提供的这次书籍测评活动!最近,我一直在学习大模型和人工智能的相关知识,深刻体会到机器技术是一个极具潜力的未来方向,甚至可以说是推动时代变革的重要力量。能参与这次活动
    发表于 12-27 14:50

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 714次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主、处理复杂环境互动的能力及确保行为的伦理和安全。 未来的研究需要将视觉、语音和其他传感技术
    发表于 12-20 19:17