0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为AI计算释放空间

安晟培半导体 来源:未知 2024-11-21 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

无论是移动应用程序或数字商务等可见应用程序,还是航空公司定价算法或每次刷卡时激活的欺诈检测系统等幕后流程,AI 都已成为我们日常生活中不可或缺的一部分。尤其是生成式 AI,预计未来十年将以两位数的速度持续增长,到 2032 年市场规模可能达到1 万亿美元以上。

AI 技术的发展推动了对更强大的处理器的需求,尤其是 GPU,是构建 AI 基础设施的重要组成部分。NVIDIA 在行业和市场占据着主导地位,AMD 也越来越受欢迎,但企业必须面对GPU 持续增加的功耗,部分型号甚至已经超过1kW,这一趋势也导致全球数据中心功耗大幅增加。预计在 2022 年至 2026 年间还将翻一番,容量已然成为公共事业提供商和企业面临的主要挑战。

目前,大约80% 的数据中心运营商面临功率限制,许多运营商对每机架功率限制在 10-20 kW的范围内。虽然传统方法证明,提高处理器性能和效率可以提高总功耗,但很多数据中心运营商已经达到功率上限,这也对企业的持续创新和增长造成了阻碍。此外,扩展机架空间或适应特殊的冷却方法通常成本高昂或受到空间和法规的限制;老化的服务器基础设施(许多服务器使用时间超过 5 年)也不断增加维护成本和安全风险。

对此,最实用的解决方案是升级现有的基础设施。及时的服务器更新能够大幅整合机架空间,从而降低运营成本,回收电力预算,并支持部署能够处理 AI 工作负载的现代服务器。在评估服务器更新时,运营商需要用新的方式来思考,只要新一代处理器的每瓦性能(即效率)提高,处理器功耗的增加就可以被接受,这意味着新服务器比旧服务器 “里程更长”。尽管最大机架功率预算有限并开始接近极限,通过专注于每机架的性能,企业可以优化现有的电力和空间,使他们能够从数据中心的局限性转为更加专注于业务的增长和创新。

Ampere 的云原生处理器旨在提供横向扩展性能和领先的效率。AmpereOne 自研核是替代老旧服务器的最佳 CPU 选择。在AmpereOne 效率白皮书中,详细阐述了 AmpereOne 的效率优势,相较 AMD EPYC 9004 系列处理器,如何使云原生和 AI 工作负载的每机架性能提高 67%。

以下是 7 个开源工作负载,从 Web 服务器和负载均衡器到数据库,再到缓存和内存中数据存储。它们在许多现代 Web 服务中颇受欢迎,因为它们通过缓存处理 web 流量管理、数据存储和性能优化。

91c9f60c-a7a4-11ef-93f3-92fbcf53809c.png

在AI 计算时代,通过将 AI 推理工作负载添加到上述通用工作负载中,可以增强各个行业的产品和服务。下表展示了 AmpereOne 在机架级别的性能和效率,适用于推理工作负载,如推荐引擎(DLRM)、图像处理(ResNet-50)以及以语言为中心的工作负载(Whisper和Llama3)。这些工作负载支持现代设施,例如聊天机器人、在电子商务网站上查看推荐的产品、在流媒体平台上呈现“您可能喜欢的节目”,或者为直播电视流提供实时隐藏字幕。

91d59e44-a7a4-11ef-93f3-92fbcf53809c.png

对于前面提到的每机架可用功率有限的企业和服务提供商来说,实现每机架的最大性能尤为重要。即使是中等规模的企业,由 AI 驱动的 web 服务也可以从 AmpereOne 中受益。与 AMD EPYC Genoa 8 个机架的输出相比,AmpereOne 可以在不牺牲性能水平的情况下,将机架空间减少 38%,将功率预算降低 37%,并将购置成本降低 49%。以下代理 web 服务包括作为前端 Web 服务器的 NGINX、作为键值存储的 Redis、作为内存数据库的 Memcached、作为关系数据库的 MySQL,以及分别作为推荐引擎和聊天机器人的 AI 组件 DLRM 和 Llama3。

91e45d12-a7a4-11ef-93f3-92fbcf53809c.png

AmpereOne 可以通过更新老化的服务器来重新利用预算、空间和功率。我们展示了如何节约资本支出,如何通过降低功耗和管理开销而实现运营支出的节省,在三年内为企业节省大量 TCO。相较 AMD EPYC Bergamo,运营商可以节省 33% 的成本;与 AMD EPYC Genoa 相比,可节省高达 41% 的成本,这都归功于AmpereOne。

91f8aeca-a7a4-11ef-93f3-92fbcf53809c.png

无论公司规模大小,“AI 海啸” 将继续降低企业大规模实施 AI 的准入门槛。即使没有资源去雇佣专门的 AI 团队,企业也可以通过服务提供商来开启 AI 之旅,并迅速投入生产。因此,整合传统基础设施为 AI 扩展释放空间尤其重要。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20160

    浏览量

    247728
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297387
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA技术助力光轮智能加速物理AI落地

    机器人正加速走向真实世界。从实验室到工业现场,从结构化环境到开放空间,物理 AI 对数据规模、物理准确性与训练效率提出了前所未有的要求。
    的头像 发表于 12-13 10:03 989次阅读

    叠层固态电容:小型化封装,释放PCB更多空间

    叠层固态电容通过小型化封装设计,显著释放PCB空间,同时保持高性能与可靠性,成为高密度电子系统的理想选择。
    的头像 发表于 12-05 16:15 253次阅读

    ALVA推出“ AI + 空间计算智能运维平台

    市场规模正以指数级速度扩张,中国以 38% 的全球占比成为最大需求国。 9 月 18 日,以 2025 华为 HC 大会为契机,ALVA 与华为智算服务团队进行了务实而高效的交流,深入探讨在空间智能领域的合作。 ALVA 作为 AI
    的头像 发表于 10-12 14:35 1766次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱
    发表于 09-17 11:45

    无人机飞控轻量化:合粤缩小体电容释放空间,适配紧凑模组设计

    控系统,通过创新性地缩小体电容释放空间,成功实现了飞控模块的紧凑化设计,无人机行业的轻量化发展提供了新的解决方案。 传统飞控系统在设计时往往面临一个矛盾:一方面需要足够大的电容来保证系统稳定运行,另一方面又
    的头像 发表于 09-16 15:57 459次阅读
    无人机飞控轻量化:合粤缩小体电容<b class='flag-5'>释放空间</b>,适配紧凑模组设计

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    新信息的情况下持续学习和改进的AI计算方式。 终身短发怎么保持已有知识和技能的有效性呢 ①知识蒸馏:将已有知识从一个模型转移到另一个模型 ②知识更新:根据新知识更新已有知识 ③知识重组:对已有知识进行重组
    发表于 09-14 14:04

    爱芯元智AI原生处理器释放智能生产力

    近年来,人工智能产业持续高速发展,大模型技术不断突破,各行各业带来广阔的应用想象空间。与此同时,AI算力部署正从云端加速向边缘和终端延伸,边缘AI凭借其低延迟、高隐私和性价比等优势,
    的头像 发表于 09-10 11:42 694次阅读
    爱芯元智<b class='flag-5'>AI</b>原生处理器<b class='flag-5'>释放</b>智能生产力

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    生物化学计算机,它通过离子、分子间的相互作用来进行复杂的并行计算。因而未来可期的前景是AI硬件将走向AI湿件。 根据研究,估算出大脑的功率是20W,在进行智力活动时,其功率会增大到25
    发表于 09-06 19:12

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型及 AI 计算基础设施,机器人领域开启新篇章   · 全新 NVIDIA Omniverse NuRec
    的头像 发表于 08-12 11:29 1390次阅读
    NVIDIA通过全新 Omniverse库、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b><b class='flag-5'>计算</b>基础设施,<b class='flag-5'>为</b>机器人领域开启新篇章

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    ,这一过程常受网络延迟和不稳定的困扰。如今,借助 AI 边缘计算网关,数据处理任务下沉至网络边缘,在本地即可快速完成。以智能安防监控例,在大型商场中,众多监控摄像头采集的视频数据,通过 AI
    发表于 08-09 16:40

    空间计算是如何运作的?它有哪些优势?

    空间计算将数字数据与物理世界实时融合,通过增强现实和虚拟现实头显或智能眼镜等设备、增强混合现实交互。
    的头像 发表于 07-02 09:14 952次阅读

    DDN携手NVIDIA释放非结构化数据的AI价值

    DDN 通过与 NVIDIA AI 数据平台的合作,推出联合解决方案,简化了企业对非结构化数据的存储、访问和激活方式,助力客户释放生成式 AI 的巨大商业潜能。DDN 全球合作伙伴负责人
    的头像 发表于 06-10 10:31 803次阅读

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放式AI训练产品工具包,解决客户低成本AI系统,针对差异化AI 应用场景,自己采集样本数据,进
    发表于 04-28 11:05

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布, AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、低功耗和灵活扩展的需求。 [](
    发表于 03-19 17:54

    AI赋能边缘网关:开启智能时代的新蓝海

    。这一变革不仅带来了技术架构的革新,更为产业发展开辟了新的增长空间。 传统边缘网关受限于计算能力和算法支持,往往只能完成数据采集和简单处理,大量原始数据需要回传云端处理,导致响应延迟和带宽压力。AI技术
    发表于 02-15 11:41