0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋

全球TMT 来源:全球TMT 作者:全球TMT 2024-09-05 16:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2024年9月5日/美通社/ -- 近年来随着云计算、大数据特别是大模型的快速发展,数据中心规模不断扩张,产生了更多的服务器管理需求。传统BMC虽然可以实现部分管理,但是在快速迭代的当今尤其是在AI技术的驱动下,存在开发周期长、交付困难、应用单一等难题,并且由于其代码闭源也会导致隐藏的安全漏洞无法及时识别,限制了用户定制开发。OpenBMC凭借领先的开源理念、可扩展的软件架构,被大型互联网厂商广泛应用,并带动了产业连上下游共同探索,逐步成为服务器固件发展的"事实标准"。

在日前召开的2024开放计算中国峰会上,来自阿里云、字节跳动、浪潮信息、英特尔以及电子标准院的专家,从自身探索和实践的角度,现身说法各家在OpenBMC方面的最新进展及未来规划。

OpenBMC大幅降低采购成本 阿里云新增修改10万+行自研代码库

随着云计算、大数据、AI等技术的发展,阿里云服务器规模已经达到数百万台,如何有效管理是摆在阿里云面前的现实问题。

而传统的BMC无法满足新兴运维需求,首先是庞大的服务器数量涵盖了多个品牌不同厂家,各厂家都基于某个IBV建立基础BMC能力再在上层定制开发,因此日常问题的解决需要拉通多方BMC软件规格和能力,带来时间和资源的大量浪费,效率低下;其次,不同品牌的服务器BMC代码也不尽相同,存在巨大的适配成本;第三是应用成本问题,传统BMC基础软件源代码和授权license都需要购买,后续还需要软件维护升级费用,成本较高。

OpenBMC迎合了当下软件质量发展和行业趋势,2020年左右OpenBMC软件逐步走向成熟,在北美一些CSP率先采用。阿里云服务器研发固件团队负责人李羿介绍,阿里云自2020年逐步采用OpenBMC产品,经过4年时间的探索与实践,已经形成行业一支领先的专业OpenBMC技术开发和交付团队,不仅可以在完成交付任务的同时结合云业务自身特点,还不断的回馈社区、贡献伙伴,在多个层面实现了行业领先。

如今,阿里云已经成功在x86、ARM等主流平台中实现了OpenBMC的替代,未来也将探索基于RISC-V等多元芯片平台的可能性。得益于OpenBMC的平台化优势,不同架构下的代码绝大部分都是相同的,只是针对不同平台略有微调。李羿表示,阿里云已经在实现代码的归一化,目前已经提交超过10万行代码,未来有望针对不同产品形态实现全面支持。

字节跳动打造OpenBMC应用新范式 问题分析定位效率大幅提升

从抖音到新晋AI工具"豆包",随着应用覆盖范围的进一步扩大、用户群体的持续增多,字节跳动需要维护的服务器数量已达百万级别,并且仍有不断增长的态势。如何高效、稳定且安全的管理服务器,成为运维团队面临的首要问题。

字节跳动固件架构师郏春辉介绍,传统BMC在解决固件运维难题上存在局限性,难以在服务器需求多样化的情况下满足快速交付的需求。开源OpenBMC能够吸纳先进理念和应用,提供了架构灵活、兼容性强的新选择,非常适合当下互联网与数字化的应用需求。

为了更好地解决固件运维的问题,字节跳动在OpenBMC固件运维能力基础上,不断进行技术创新,致力于提升OpenBMC固件的可观测性,对固件的运行状态、性能表现及内部各种活动进行全方位的监控和解析。通过加强对固件运行时软硬件状态的深入观察和理解,能够更快速地捕捉问题发生时的细节,从而实现高效精准的问题定位和处理。这种深入的可观测性不仅有助于提升系统的稳定性与可靠性,也为业务优化提供了宝贵的数据支持。

事实证明,这种方法非常有效。在引入了Perfetto和Kernel trace以后,问题定位分析时间,由原有的数小时乃至数天,降低至平均1小时以下;问题一次定位分析准确率,由40%提升至80%以上,效率提升非常明显。未来字节还计划在问题分析定位层面更进一步,借助AI技术和大数据分析,细化不同场景下的问题定位,充分发挥自动化优势,让故障无处遁形。

浪潮信息提供差异化方案满足不同需求下一代产品全面切换OpenBMC

当然,并非所有的企业都有阿里云、字节这样的技术积淀,对于中国市场来说,绝大部分企业用户并没有自研的能力,更倾向于选择表现稳定、安全的商业版本。对于这些企业来说,浪潮信息就是不错的合作伙伴。

去年,浪潮信息就发布了基于OpenBMC的InBry管理固件平台,采用更先进、更高效、更开放的创新架构和开发模式,快速适配各种算力场景,为用户提供开放、稳定、可靠的BMC管理固件,支撑多元算力时代的各类创新应用。"如果说前两年OpenBMC还只是一个趋势,现在则已经是大行其道了",浪潮信息服务器固件研发负责人王兴隆表示。

除了功能更丰富、应用更高效之外,开源版本的优势还在于开放性以及由此产生的安全性,后者也是当下企业关注的重点。对此,王兴隆表示,首先,开源社区采用的是最先进的Linux版本,相比传统BMC应用来说在代码上更完善,成熟性更高。其次,开源社区的代码上传需要多为行业专家的联合评审,接受更多社区参与者随时的监督与审查,所以质量更高。第三,基于开源和可扩展的软件架构,用户也可以将自身使用的安全模型、软件库移植到OpenBMC,这样就能打造符合自身需求的业务安全模型,所以更安全。

如今,浪潮信息更提出了"分层解耦"的理念,在技术上通过硬件层、中间层、应用层的划分实现自动适配、自动识别,达到技术赋能的多元化。此外,浪潮信息也正在与英特尔、英伟达AMD等业界领军企业合作,实现多元化平台的适配,为产业界提供更低成本、更高效的选择。

"在技术上,我们要基于OpenBMC实现创新,让更多企业享受开源应用的技术红利;产品上,我们将逐步在下一代平台全面切换到OpenBMC,打造更好的商业化版本;社区层面,我们也要建设更好的生态环境,让更多伙伴参与其中达成贡献,打造多元化的服务",王兴隆表示。

英特尔社区贡献名列前茅 持续推动OpenBMC技术创新

作为平台公司,英特尔也在推动OpenBMC发展中扮演了重要角色。每一代英特尔处理器平台的升级对于BMC固件适配来说都是不小的变革,而这些变革都朝着更便捷、更优化的方向来发展。从最初创立OpenBMC到今天,英特尔对于组织的贡献一直排在前列,每一代产品都会经历一年甚至更长时间的测试,以保证在性能、可靠性、稳定性等多方面的品质。

针对不同的应用场景,英特尔也会为客户提供接口实现功能上的定制化需求,这样可以通过代码或者软件的微调更适配于客户业务。同时,英特尔也提供了PFR固件保护功能(Platform Firmware Resilience),为保护企业服务器固件提供了一种全新的方法,可全面防止对服务器所有固件的攻击。

除了安全性的优化之外,如何有效降低服务器能耗也是OpenBMC固件优化的重点。从传统BMC到OpenBMC,其实服务器节能会变得更精准、更低碳。对此,英特尔在节点管理中就提供了能耗管理,并可以根据不同部件进行精细化运维。

从OpenBMC的投入上可以看出,这不仅仅是硬件层面的创新,更多需要融合软件、AI、生态等多个维度,而英特尔也需要扮演行业引领者的角色,为更多生态伙伴提供平台化、系统化的支持。

AI为OpenBMC发展注入活力 正在成为服务器固件"事实标准"

AI技术的出现带来了计算架构的变化,而BMC就势必需要针对这些多元异构的应用变化进行调整。与此同时,AI技术的出现也让大量传统的数据监测、分析变得更加高效,配合数据模型的构建,可以为未来的智能化管理提供技术支持,这也是AI对于OpenBMC带来的全新改变。

"事实上,OpenBMC正在解决传统BMC的瓶颈问题,包括兼容性问题、存在隐藏的代码故障、定制化需求等,已逐步成为了服务器固件的'事实标准'。" 中国电子技术标准化研究院技术总监、固件产业技术创新联盟标测组组长钟伟军表示。

如今,OpenBMC在国内的应用生产已经初具雏形。在相关社区中,已经形成了比较完备和稳定的基础代码,包括阿里云、浪潮信息等30多家公司也在不断提交代码贡献。

未来,希望能够有更多的产业界的伙伴参与到社区建设当中,把自身的优势、经验贡献到社区,让社区拥有更加完备的基础代码,让产业界上下游共享社区成果,有助于产业链生态的繁荣,形成合作共赢的局面。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179344
  • 服务器
    +关注

    关注

    13

    文章

    10096

    浏览量

    90902
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25308
  • 字节
    +关注

    关注

    0

    文章

    43

    浏览量

    14330
  • 阿里云
    +关注

    关注

    3

    文章

    1028

    浏览量

    45506
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超越台积英特尔首个18A工艺芯片迈向大规模量产

    Lake作为英特尔首款基于Intel 18A制程工艺打造的产品,意义非凡。这一制程是英特尔研发并制造的最先进半导体工艺,标志着英特尔在技术领域迈出了关键一步。   英特尔还预览了
    的头像 发表于 10-11 08:14 8552次阅读
    超越台积<b class='flag-5'>电</b>?<b class='flag-5'>英特尔</b>首个18A工艺芯片迈向大规模量产

    全球首款落地!英特尔携手新华三等合作伙伴,重磅推出全域液冷服务器

    11月19日,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔至强6900系列性能核处理的双路冷板式全域液冷服务器H3C UniServer R49
    的头像 发表于 11-25 09:17 9956次阅读
    全球首款落地!<b class='flag-5'>英特尔</b>携手新华三等合作伙伴,重磅推出全域液冷<b class='flag-5'>服务器</b>

    打造智算基石:英特尔携手本土生态发布全域液冷服务器

    路冷板式全域液冷服务器。该创新方案由全本地生态赋能,实现了关键热源的高比例液冷覆盖,在提升可靠性与能效的同时,显著降低能耗与运维成本,为数据中心散热与能效树立全新标杆。 英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示:“
    的头像 发表于 11-20 14:31 172次阅读
    打造智算基石:<b class='flag-5'>英特尔</b>携手本土生态发布全域液冷<b class='flag-5'>服务器</b>

    英特尔携本地生态伙伴发布双路冷板式全域液冷服务器,引领数据中心散热与能效革新

    1月19日,在重庆举办的2025英特尔技术创新与产业生态大会上,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔®至强®6900系列性能核处理的双路
    发表于 11-19 21:21 1183次阅读
    <b class='flag-5'>英特尔</b>携本地生态伙伴发布双路冷板式全域液冷<b class='flag-5'>服务器</b>,引领数据中心散热与能效革新

    英特尔助力阿里推出多款实例和存储方案

    实例解决方案。 u2i实例作为普惠算力的理想入门之选,其出色的成本效益,让中小企业客户得以用更低的投入,充分激发业务增长潜力。相较阿里上一代通用算力型实例U1,u2i
    的头像 发表于 10-16 10:22 335次阅读

    到端:英特尔展示全栈AI能力,覆盖、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔阿里带来了多项基础设施创新成果,包括兼容多代际服务器(支持第五代
    的头像 发表于 09-26 17:27 1281次阅读
    从<b class='flag-5'>云</b>到端:<b class='flag-5'>英特尔</b>展示全栈AI能力,覆盖<b class='flag-5'>云</b>、边、PC多场景

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU 市场取得重大进展,市占率首次达到50%,与竞争对手
    的头像 发表于 07-25 14:41 819次阅读
    看点:AMD<b class='flag-5'>服务器</b>CPU市场份额追上<b class='flag-5'>英特尔</b> 华为Mate80主动散热专利曝光

    英特尔服务器CPU市场失守:从99.9%到50%以下

    服务器将同比增长 63.7%,达到 820 亿美元。   随后,有分析师汇总 IDC 和 Mercury Research 的调研数据指出,2024 年英特尔服务器处理市场的份额
    的头像 发表于 07-01 01:19 4039次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>服务器</b>CPU市场失守:从99.9%到50%以下

    HPE携手英特尔至强6,打造新一代服务器性能巅峰

    近日,慧与科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服务器,标志着新一代企业级服务器领域的新标杆正式诞生。这一系列服务器全面搭载了英特尔至强6处理
    的头像 发表于 02-18 10:38 705次阅读

    浪潮信息发布元脑R1推理服务器

    近日,浪潮信息正式推出了其创新的元脑R1推理服务器。这款服务器通过系统的创新与软硬件的协同优化,实现了对DeepSeek R1 671B模型的单机部署与运行,为客户在智能应用部署方面带来了显著的突破
    的头像 发表于 02-17 10:32 1042次阅读

    英特尔至强6助力HPE,打造性能与能效新“巅峰”

    系搭载英特尔至强6处理,能够轻松应对日益增长的数据密集型工作负载挑战,特别满足数据中心和边缘环境设计的需求。此外,该系列服务器还引入了创新的控制功能,将为企业在混合时代的蓬勃发展提
    发表于 02-14 10:40 279次阅读
    <b class='flag-5'>英特尔</b>至强6助力HPE,打造性能与能效新“巅峰”

    浪潮信息升级数据中心服务器故障智能诊断AIOps技术

    近日,浪潮信息对其数据中心服务器故障智能诊断AIOps技术进行了全面升级。该技术旨在解决数据中心服务器日常巡检中故障人工识别效率低、难以精准定位的问题。 基于数百万台服务器的运维管理经
    的头像 发表于 12-31 13:38 967次阅读

    浪潮信息与智源研究携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 877次阅读

    浪潮信息与智源研究达成战略合作协议

    近日,浪潮信息与智源研究达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。目前,智源Triton算子库FlagGems已
    的头像 发表于 12-26 10:25 903次阅读

    英特尔带您解锁上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,
    的头像 发表于 12-23 14:05 1235次阅读