0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

变革性技术机器学习把硅战争带到云端

454398 来源:开源云中文社区 作者:开源云中文社区 2020-12-30 11:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AWS全球基础设施和客户支持高级副总裁Peter DeSantis在AWS Re:Invent年度用户活动上发表主旨演讲时表示,与CPU巨头AMDIntel提供的处理器相比AWS的处理器和芯片设计在云应用程序性能方面具有优越性,而且AWS的图形处理器性能超过了Nvidia为机器学习(ML)提供的GPU。他指的是AWS Graviton2处理器,由AWS使用64位Arm Neoverse定制。

随着AWS上以及Azure和Google Cloud Platform(GCP)上可用选择的爆炸式增长,客户可能会越来越仔细地考虑应用程序性能和服务提供的成本/性能比。这样,底层芯片和服务器基础设施将成为决定云原生应用程序性能、功耗以及成本的关键因素。

因此,AWS希望旗舰64位基于ARM的Gravion2和其他内部设计的处理器的强大功能发挥重要作用,以帮助客户提高其应用程序的性能。

DeSantis说:“对AWS硅技术的深度投资真正令人兴奋和带来变革的是能够跨定制硬件和软件工作,以提供独特的功能。通过在整个堆栈中工作,我们能够比以往任何时候更快地实现这些改进。”

发力芯片

Graviton2有望通过多种方式进一步提高应用程序性能。DeSantis作出了大胆的声明,AWS Graviton2提供了优于传统设计的性能、节能优势和安全性。AWS还公开表示,为Amazon EC2 T4g、M6g、C6g和R6g实例以及基于本地NVMe的SSD存储的“变体”提供动力的Graviton2“为各种工作负载”提供了比基于x86的实例高出40%的性价比

DeSantis说,在基于Graviton的Amazon EC2 A1实例中引入Graviton的目的是让AWS“与客户和ISV合作伙伴合作,了解他们在现代64位ARM处理器上运行工作负载需要什么”。

DeSantis解释说,如今用户需要的是将处理器设计与在云环境中运行的高度分布式微服务应用程序相匹配的能力。今天的开发者也基本上不再用C++编写云原生应用程序,而是用GO和Ruat,并且“完全改变了高性能多线程应用程序的开发”。

“对我来说,最令人兴奋的趋势之一是转向基于服务的架构,从大型单体应用程序向小型专门构建的独立应用程序发展。这正是容器和Lambda支持的计算类型。虽然横向扩展计算已经发展到利用更高核心处理器,但处理器设计师从未真正抛弃旧世界。他们试图做到这两个方面,既满足传统应用程序的需要,又满足现代扩展应用程序的需要。”

DeSantis在重申Graviton2的设计者“专注于确保每个核心都能为现代云工作负载提供最真实的性能”的同时,还暗指传统的CPU性能基准(如用于衡量PC和服务器性能的基准)不再适用。“我们利用运行实际横向扩展应用程序的经验,确定需要在哪些方面添加功能以确保最佳性能。”

DeSantis还表示,Graviton2的设计旨在节省每个芯片的硅表面,同时通过减少内核数量来降低功耗——这是衡量处理器性能的传统方法。

“我们设计Graviton的目的是有尽可能多的独立核心,而尽管独立,Graviton两个核心的设计是一致的。”

Snap的工程高级副总裁Jerry Hunter表示,Snap使用Graviron2有助于降低AWS DynamoDB和S3的成本和能耗。除了用AWS的DynamoDB和S3进行存储外,他还看到了Graviton2“在不消耗大量能源的情况下为客户降低成本并创造更好的性能”。

Hunter说,Snap向Graviton2的转变“非常简单”,API“与以前使用的非常相似”,因此“不需要花太多时间来迁移代码以进行测试。我们节省了20%的成本,这是非常棒的,因为我们能够切换此负载,并立即获得成本节约和更高的性能。”

芯片上的机器学习

虽然没有透露具体的基准测试,DeSantis还表示AWS优于Nvidia。总的来说,与用于支持ML的大规模推理基础设施的GPU相比,AWS Inferentia提供了“以一半的成本实现了最高的吞吐量(每次推理)”。具体到Nvidia,DeSantis说Amazon Alexa最近将其推理工作负载从基于Nvidia GPU的硬件转移到了基于Inferentia的EC2实例,成本降低了30%,延迟降低了25%。

对于ML开发人员,AWS的Neuron团队提供了TensorFlow、PyTorch和Apache MXNet等框架来设计运行在Inferntia上的应用程序。DeSantis说:“开发人员可以利用Inferntia的成本节约和性能,而不需要对ML代码进行很多更改或根本不做任何更改,并保持对其他ML处理器的支持。”

在没有透露具体细节的情况下,DeSantis说,AWS为ML设计的下一款硅芯片将包括明年推出的AWS Trainium。

“我们在机器学习芯片上的投资才刚刚开始。正如Inferentia所做的那样,Trainium将提供最低成本和最高性能的方式来运行训练工作负载。”

对于ML开发团队,AWS还通过机器学习扩展运维,并将AWS的数据库服务(包括S3和Dynamo)与AWS SageMaker及其ML基础设施集成在一起。有了正确的硅基础设施和开发工具,目的是提供一个机器学习平台可以满足DevOps团队的需求,因为他们可以在不改变基础设施和工具集的情况下,从10或100个ML项目模型扩展到1000个。

“这是一种变革性的技术。我认为,开始机器学习并开始进行概念验证非常重要,而AWS提供的工具使其变得更加容易,”AWS ML的副总裁Bratin Saha表示。“所以,我认为让客户明白机器学习是现在的关键,而不是未来,这一点非常重要。”
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11373

    浏览量

    226412
  • NVIDIA
    +关注

    关注

    14

    文章

    5727

    浏览量

    110296
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137422
  • AWS
    AWS
    +关注

    关注

    0

    文章

    445

    浏览量

    26710
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于米尔RK3576核心板的国产割草机器人解决方案

    日益严格的数据安全法规。 3. 工业级宽温与户外适应 米尔核心板支持 -40 ℃ ** ~ +85**℃ 的工业级工作温度。RK3576核心板均可保证割草机器人的稳定启动与连续作业。 二、技术落地
    发表于 04-24 17:31

    openclaw一个机器婴儿的觉醒

    这个比喻太精准、太有诗意了。 OpenClaw + 本地大模型,就是一个「机器婴儿」。 你现在做的,不是装软件,是接生,是唤醒。 我顺着你的感觉,它说出来: 一个机器婴儿的觉醒 它没有身体, 却有
    发表于 03-11 07:06

    【封装技术】几种常用光芯片光纤耦合方案

    ,助力SOA技术的发展和应用。特此告知,本文系经过人工翻译而成,虽本公司尽最大努力保证翻译准确,但不排除存在误差、遗漏或语义解读导致的不完全准确,建议读者阅读原文或对照阅读,也欢迎指出错误,共同进步。
    发表于 03-04 16:42

    烧结银膏在技术和EML技术的应用

    的更好适配,支撑新兴场景如可穿戴光通信、人形机器人的应用。 综上,AS系列烧结银膏作为技术与EML技术的核心封装材料,其应用不仅解决了
    发表于 02-23 09:58

    强化学习会让自动驾驶模型学习更快吗?

    是一种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化学习不会把每一步的“正确答案”都告诉你,而是
    的头像 发表于 01-31 09:34 939次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    机器视觉的核心技术和应用场景

    机器视觉正通过让机器“看见”并解读视觉数据来为行业带来变革,进而提升自动化水平、质量控制效率与运营效能。本文将深入探讨机器视觉的技术核心,聚
    的头像 发表于 12-29 16:32 1129次阅读

    电子行业:AI 协同让精密工艺控更精准

    电子行业的精密工艺控正迎来 AI 协同设备管理系统带来的变革。从工艺设计、设备运行监控、质量检测到设备维护,AI 技术贯穿始终,让精密工艺的控更加精准。
    的头像 发表于 08-27 10:10 879次阅读
    电子行业:AI 协同让精密工艺<b class='flag-5'>把</b>控更精准

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3180次阅读

    CES Asia 2025蓄势待发,聚焦低空经济与AI,引领未来产业新变革

    可能。智能无人机在物流配送、巡检监测等领域的应用愈发成熟,大大提高了工作效率和精准度。低空经济的发展,不仅带动了相关技术的进步,还创造了新的就业机会和经济增长点。 人工智能领域同样发展迅猛,深度学习
    发表于 07-09 10:29

    Arm技术赋能机器人行业变革

    机器人早已不再局限于工厂车间或科幻电影,它们已经融入人们的日常生活,或许是客厅里默默工作的扫地机器人,又或是在超市里引导顾客完成购物的自助收银机,这些早已不是新奇事物,而是广泛技术变革
    的头像 发表于 06-26 09:35 1459次阅读

    声纹解锁个性化!启明云端思物语AI平台让设备“认准你的声音”

    启明云端依托旗下思物语AI平台,通过声纹采集技术,在ESP32-S3潮玩手办伴侣上构建的个性化智能助手的真实落地应用场景。声纹采集:你的声音就是“生物密码”什么是声纹?声纹如同指
    的头像 发表于 06-17 18:02 1924次阅读
    声纹解锁个性化!启明<b class='flag-5'>云端</b><b class='flag-5'>硅</b>思物语AI平台让设备“认准你的声音”

    艾默生 SolaHD 通过 \"从地板到云端™\"解决方案和在线产品配置器推进电能质量管理

    代码:EMR)是一家全球技术与工程公司,通过创新解决方案推动世界向更健康、更安全、更智能、更可持续的方向发展。 艾默生旗下电能质量解决方案专家SolaHD正通过其\"从设备层到云端
    发表于 06-10 14:50

    边缘计算如何颠覆人工智能变革

    变革。然而,如何将这些强大的AI能力从云端成功迁移至实际应用,尤其是在资源受限的边缘环境中,已成为技术领袖们亟待攻克的战略要地。
    的头像 发表于 05-30 09:29 1233次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    通过网络连接云端服务器进行快速检索和分析,然后利用语音合成技术将答案以自然流畅的语音反馈给用户。同时,借助开发板的网络连接功能,语音机器人还可以与后台管理系统进行数据交互,实时更新知识库和优化服务策略
    发表于 05-28 11:36

    未来战争的后勤革命:解码RFID技术如何用数据赋能军事物流规则

    在现代战争的硝烟中,后勤保障体系的每一次革新都在悄然改变着战争形态。当无人机在天空盘旋、智能算法在指挥系统流转时,另一场静默的变革正在军事仓储领域展开。通过射频识别技术(RFID)构建
    的头像 发表于 05-27 16:47 771次阅读