0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器“掘金潮”:面向人工智能时代扩展基础设施

时光流逝最终成了回忆 来源:电子发烧友网 作者:是德科技Jenn Mull 2025-04-30 11:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在淘金热时期,怀揣着致富梦想的探矿者们纷纷涌入美国西部,希望通过淘金发家致富。如今,科技领域的开拓者也同样跃跃欲试,希望在人工智能AI)领域大展拳脚。普华永道(PWC)估计,到2030年,全球经济总收益的45%将由人工智能驱动,越来越多的行业将受益于人工智能带来的生产力和产品性能提升。普华永道的研究进一步指出,人工智能有望为全球GDP额外贡献15.7万亿美元,增幅约为14%。然而,这一具有划时代意义的经济机遇,对计算能力和功率密度的需求已经远远超过了当前的承载能力。

无论是为淘金者提供商品、服务和安全保障,还是为企业提供服务器、存储系统、网络设施和数据存储,基础设施始终是推动发展的重要驱动力。随着人工智能应用的增加,对人工智能就绪的计算、存储和网络容量的需求早已超过了其可用性。这一划时代的经济机遇推动了对计算能力和功率密度的需求,使其超出了现有能力所能处理的范围。


全球政府和商界领袖都将目光投向了人工智能(AI)所带来的无限可能。政府的政策框架和投资计划,为各方在人工智能“淘金热”中抢占一席之地提供了政策框架和资金支持。

企业和产业界也在大力投资基础设施建设,以支持未来的创新发展。据《福布斯》11月估计,2025年,大型科技公司在人工智能方面的支出将超过2500亿美元,其中大部分投入将用于基础设施建设。仅微软一家公司今年就将投资800亿美元用于建设具备训练强大人工智能模型所需能力和速度的数据中心。这些数字看似惊人,但为了满足对计算能力的需求,确保人工智能创新不会停滞不前,这些投资是必不可少的。

计算能力:当今世界最宝贵的资源

人工智能数据中心提供人工智能工作负载所需的海量数据存储空间、闪电般快速的网络连接,以及高性能计算(HPC)能力,并以此推动人工智能的创新。人工智能数据中心还拥有精密的冷却和功率管理系统,能够应对人工智能硬件因高密度功率需求而带来的相关挑战。如果没有这些独特的功能,如今推动人工智能突破极限的开拓性创新就不可能实现。然而,随着越来越多的企业希望利用人工智能的潜力,人工智能数据中心的设计及其采用的系统也必须不断发展。

人工智能系统扎根于机器学习(ML)和深度学习技术,这两种技术都以计算强度大而“声名在外”。人工智能模型在训练过程中会处理大量数据。它们会在整个训练过程中调整和完善参数,以优化性能。即使对于基本模型而言,这也是一个计算密集型过程。

短短几年间,基于人工智能的应用已经发展到了收益递减的阶段。业界需要越来越复杂的模型来增强现有用例,并推动生成式人工智能(gen AI)等新兴用例的发展。然而,随着模型越来越先进,其对计算能力的要求也与日俱增,训练高级人工智能和机器学习算法所需的计算能力也会呈指数级攀升。OpenAI早期的生成式人工智能机器模型就是这种庞大计算能力需求的典型展示。在六年时间里,该公司的机器学习模型运行所需的计算能力增长了惊人的30万倍。

六年前,在获取训练模型(这些模型后来发展成为ChatGPT)的资源方面,OpenAI几乎不会遇到什么竞争对手。然而如今训练生成式人工智能模型的“参与者”大幅增加,所有人都在争夺那增长幅度极为有限的资源。生产下一个ChatGPT所需的大规模计算能力变得珍贵而有限。扩大这种资源的使用范围是一件成本高昂的事情,这一点从为构建这些资源而进行的投资规模就可见一斑。随着人工智能的飞速发展,人工智能数据中心开发人员正在寻找解决方案,以确保这些关键的创新驱动因素能够适应和扩展,从而满足未来的需求。

为不可预测的情况制定应对之策

在人工智能时代构筑数据中心意味着要确保这些设施能够适应大规模GPU集群的功耗,适应云计算和边缘计算之间动态变化的平衡,并提高容量以跟上不断增长的需求,避免出现中断或停机的情况。除了通过建设新数据中心来扩充容量外,确保数据中心的可靠性和安全性也至关重要。目前,传统的数据中心测试解决方案用于设计和测试构成人工智能数据中心的各类组件和系统。但这种方法已经难以为继,人们亟需一种全新途径。

人工智能数据中心由错综复杂的系统组成,而这些系统又是由一个个独立组件组成的复杂网络。其中任何一个环节出现问题,这些支撑创新和市场资本支出的基础设施就会受到影响。因此,人工智能数据中心的可靠性取决于其最薄弱的环节。在追求高性能的前沿领域,每一块芯片、每一根电缆、每一次互连、每一台交换机、每一台服务器和每一块GPU都蕴含着巨大的潜力,也都伴随着同等程度的风险。为了降低这种风险,每个组件都必须能作为一个系统,在日益增长的需求下独立、协调地工作。

构建能够应对人工智能工作负载巨大需求的网络,意味着要对每个组件、连接和配置进行验证。由于其所涉及的巨大风险和规模,即使是最小的效率提升、运营改进或性能增强,都会抵消创新的收益递减。因此,要想在这场现代“淘金热”中获得成功和利润,就必须采用能够承受未来各种挑战的新技术堆栈。

面向未来的人工智能创新

为满足未来对人工智能就绪型网络、半导体和数据中心设备的需求,就必须具备人工智能就绪型测试和仿真工具的技术堆栈。在这场“淘金热”中,无数数字勘探者会竞相角逐,争抢先机,而具备人工智能就绪的测试和仿真工具将帮助参与者脱颖而出。是德科技正在帮助人工智能数据中心设计人员进行面向未来的设计,并针对此类复杂环境的动态需求量身打造强大的工具技术堆栈。凭借涵盖仿真器模拟器和测试硬件的全栈产品组合,是德科技解决方案可轻松模拟真实世界中的人工智能工作负载,对网络组件进行验证,并优化从物理硬件到应用层行为等各个层面的系统级性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50524

    浏览量

    267792
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm推进代理式AI时代基础设施演进

    随着人工智能 (AI) 系统从单纯运行模型逐步演进为编排自主的代理式工作流,基础设施的需求正在发生根本性变革。工作负载不再局限于孤立的推理任务,而是由模型、工具和服务之间的成千上万次协同交互构成
    的头像 发表于 05-19 17:16 1276次阅读

    超集信息入选江苏省 "人工智能 + 制造" 诊断服务商

    近日,江苏省工业和信息化厅正式公布 江苏省 "人工智能 + 制造" 诊断服务商 入围名单。苏州超集信息科技有限公司凭借在 智能制造、人工智能算力基础设施、AI 融合应用 等领域的深厚积
    的头像 发表于 05-15 13:51 188次阅读
    超集信息入选江苏省 &quot;<b class='flag-5'>人工智能</b> + 制造&quot; 诊断服务商

    Arm AGI CPU加速新一代基础设施建设

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主设计、面向人工智能 (AI) 数据中心的 CPU,旨在满足日益增长的代理式 AI (Agentic AI) 工作负载需求。这标志着 Arm 计算平台进入新的发展阶段,首次将产品矩阵延伸至量产芯片产品领域。
    的头像 发表于 04-09 15:55 441次阅读

    为何CPU是AI基础设施的核心

    人工智能 (AI) 并非一种具有单一理想基础设施的单一工作负载。AI 涵盖了多样化的工作负载,需要系统层面的协同策略,才能高效且可扩展地提供性能。而在这一策略中,CPU 扮演着核心角色,它作为系统的
    的头像 发表于 03-11 10:35 1468次阅读

    利用高密度内存显著优化人工智能欺诈检测的基础设施成本

    人工智能欺诈检测是金融科技公司的一项关键工作。欺诈监控涉及多种机制,例如采用自然语言处理技术筛选通信中的可疑内容、利用机器学习区分欺诈交易和合法交易,以及运用分析技术区分正常用户行为和异常行为,并基于历史数据预测未来趋势。
    的头像 发表于 03-10 09:47 754次阅读

    人工智能时代的精密脉搏

    当今时代,全球工业格局在科技浪潮的持续涤荡下加速重塑,工业革命作为重塑进程中的关键“催化剂”,已然历经数次迭代。聚焦于数据中心领域,自OpenAI发布后,AI智能训练需求呈指数级攀升,推动基础设施
    的头像 发表于 01-19 09:12 649次阅读
    <b class='flag-5'>人工智能</b><b class='flag-5'>时代</b>的精密脉搏

    Lambda采用Supermicro NVIDIA Blackwell GPU服务器集群构建人工智能工厂

    大批量 Supermicro GPU 优化服务器(包括基于 NVIDIA Blackwell 的系统),以扩展人工智能基础设施并向客户交付高性能计算系统。此次合作于今年 6 月率先在俄亥俄州哥伦布市的 Cologix COL4
    的头像 发表于 08-30 16:55 1000次阅读

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一次对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第三波创业
    的头像 发表于 08-27 13:21 954次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    ,技术自主可控 在如今这个科技竞争激烈的时代,国产化硬件的重要性不言而喻。比邻星人工智能综合实验箱就做到了这一点,采用国产化硬件,积极推进全行业产业链上下游环节的国产化进程,把国产自主可控的软硬件平台
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    Arm如何助力AI基础设施变革

    众所周知,人工智能 (AI) 有望革新人类活动的方方面面。然而,要充分释放这一潜力,就必须面对一个基本事实:支撑传统计算的基础设施已无法满足未来 AI 发展的需求。
    的头像 发表于 07-03 14:29 1209次阅读

    中科曙光亮相2025全球人工智能技术大会

    此前,6月7日-8日,2025全球人工智能技术大会(GAITC 2025)在杭州举办。中科曙光携全栈AI基础设施多项核心成果深度参与本次大会,并携手中国人工智能学会成功举办“大模型时代
    的头像 发表于 06-10 16:19 1438次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础设施密集且高功耗的领域。然而,随着
    的头像 发表于 06-09 09:48 1289次阅读