0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OrionX AI芯片计算资源池化技术

智能计算芯世界 来源:智能计算芯世界 2023-07-10 14:48 次阅读

作为 AI 市场中的重要组成,以 GPUFPGA 等为主的 AI 加速器市场发展也随之水涨船高。GPU 资源池化技术从初期的简单虚拟化,到资源池化,经历了四个技术演进阶段。

简单虚拟化。将物理 GPU 按照 2 的 N 次方,切分成多个固定大小的 vGPU(Virtual GPU,虚拟 GPU),每个 vGPU 的算力和显存相等。实践证明,不同的 AI 模型对于算力、显存资源的需求是不同的。所以,这样的切分方式,并不能满足 AI 模型多样化的需求。

任意虚拟化。将物理 GPU 按照算力和显存两个维度,自定义切分,获得满足 AI 应用个性化需求的 vGPU。

远程调用。AI 应用与物理 GPU 服务器分离部署,允许通过高性能网络远程调用 GPU资源。这样可以实现 AI 应用与物理 GPU 资源剥离,AI 应用可以部署在私有云的任意位置,只需要网络可达,即可调用 GPU 资源。

资源池化。形成 GPU 资源池后,需要统一的管理面来实现管理、监控、资源调度和资源回收等功能。同时,也需要提供北向 API,与数据中心级的资源调度平台对接,让用户在单一界面,就可以调度包括 vGPU 在内的数据中心内的各类资源。

OrionX 通过软件定义 AI 算力,颠覆了原有的 AI 应用直接调用物理 GPU 的架构,增加软件层,将 AI 应用与物理 GPU 解耦合。AI 应用调用逻辑的 vGPU,再由 OrionX 将 vGPU需求匹配到具体的物理 GPU。OrionX 架构实现了 GPU 资源池化,让用户高效、智能、灵活地使用 GPU 资源,达到了降本增效的目的。

b492344e-1ec8-11ee-962d-dac502259ad0.png

一个典型的 OrionX GPU 资源池的逻辑架构中包含了 OrionX Controller(OC)、OrionX Server Service(OSS)、OrionX Client Runtime(OCRT)、和 OrionX GUI(OG)等功能组件。

OrionX 的各功能组件可以根据用户环境需求被部署在单服务器上,也可以被分布式地部署在数据中心的多个物理机、虚拟机或者容器环境中。在分布式的部署环境中,各功能组件可以通过多种类型的网络建立连接,从而把数据中心的 GPU 资源管理起来,形成一种可以被全局共享的计算资源,对 AI 应用提供可远程访问的、可灵活切分的、可聚合的弹性 GPU算力。OrionX 的逻辑架构如下图所示。

b4ec7800-1ec8-11ee-962d-dac502259ad0.png

CUDA是由 Nvidia 公司定义且公开推广、维护的一种 GPU 编程接口。从 2007 年推出之后,经过十几年生态培育,已经成为 GPU 编程的一个事实标准。大部分流行的 AI 框架,例如 TensorFlow、PyTorch、MXNet 和 PaddlePaddle都是基于 CUDA 编程接口开发。

OrionX 在管理物理 GPU 之后,通过模拟 CUDA 标准接口,为各种 AI 应用提供一个与 Nvidia CUDA SDK 接口功能一致的运行环境,从而使得 AI 应用透明无感知地运行在 OrionX GPU资源池之上。OrionX 不仅在单服务器上模拟了 CUDA 标准接口,并且通过分布式部署各功能组件,能够提供分布式的 CUDA 运行环境。

OrionX 的各个功能组件通过管理平面网络和数据平面网络进行通信,共同完成 GPU 资源池的管理以及 GPU 资源的调度等功能。

在部署 OrionX 时,使用基于 TCP/IP 网络的管理平面,来承载整个系统的管理工作。通过管理网络,分布在各个节点的功能组件都保持和 OrionX Controller 同步。管理平面逻辑结构如下图所示。

b51a473a-1ec8-11ee-962d-dac502259ad0.png

在应用运行的过程中,应用所在环境和 GPU 物理节点之间的数据传输使用的是 OrionX 的数据面。该数据面支持多种后端数据传输载体,包括 TCP/IP 以太网络、RoCE RDMA、Infiniband RDMA、Share Memory 等。具备高带宽、低延迟。同时支持多种传输协议,根据优先级自动使用高性能的传输方式。支持虚拟机、容器和宿主机之间的 TCP/IP 网络隔离。

b5432fb0-1ec8-11ee-962d-dac502259ad0.png

OrionX 的各个组件,支持直接部署在裸金属服务器上,即安装操作系统后,直接以 Binary形式部署,也支持容器化部署。OrionX 具备适配多种 Linux 操作系统和云平台的能力,因此,OrionX 具有多样化的部署形式。

OrionX 支持 CentOS、Ubuntu、Debian 等 Linux 发行版本,同时支持基于 KVM 的虚拟机云平台和基于 Docker 的容器云平台。尤其是支持原生容器,并实现了和 Kubernetes 的平滑对接。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21320

    浏览量

    593199
  • 服务器
    +关注

    关注

    12

    文章

    8116

    浏览量

    82509
  • AI芯片
    +关注

    关注

    17

    文章

    1652

    浏览量

    34380

原文标题:OrionX AI芯片计算资源池化技术

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NanoEdge AI技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传
    发表于 03-12 08:09

    手把手教你设计人工智能芯片及系统--(全阶设计教程+AI芯片FPGA实现+开发板)

    的、低于市场同行价格的工业级、具有丰富接口,同时兼容各种应用的定制FPGA开发板;师生互动:讲师将和大家一起畅聊在开发AI芯片过程中各类设计方法、设计哲学、前沿AI
    发表于 07-19 11:54

    AI发展对芯片技术有什么影响?

    现在说AI是未来人类技术进步的一大方向,相信大家都不会反对。说到AI芯片技术的关系,我觉得主要体现在两个方面:第一,
    发表于 08-12 06:38

    【免费直播】让AI芯片拥有最强大脑—AI芯片的操作系统设计介绍.

    智慧进程。人工智能芯片是人工智能发展的基石,是数据、算法和算力在各类场景应用落地的基础依托。“无芯片AI”已经深入人心,成为业界共识。本次直播将述说
    发表于 11-07 14:18

    EdgeBoard FZ5 边缘AI计算盒及计算

    ` 随着应用场景的多样,利用人工智能技术在边缘侧部署一系列创新应用解决方案,对企业传统的业务形态进行升级,加速业务增长,增强竞争优势,起着至关重要的作用。 在市场需求和产业趋势的推动下,米尔
    发表于 08-31 14:12

    深度学习推理和计算-通用AI核心

    商业发行之前就已经过时了。算法明天需要对架构、内存/数据进行彻底改革资源和能力。推理的梦幻建筑重新定义重写在计算和交付突破性的人工智能加速和灵活的计算能力超越了服务器级CPU和比GPU/ASIC通用
    发表于 11-01 09:28

    清华出品:最易懂的AI芯片报告!人才技术趋势都在这里 精选资料分享

    , 数据量呈现爆炸性增长态势,而传统的计算架构又无法支撑深度学习的大规模并行计算需求, 于是研究界对 AI 芯片进行了新一轮的技术研发与应用
    发表于 07-23 09:19

    ai加速芯片

    ai加速芯片,申耀的科技观察读懂科技,赢取未来!毫无疑问,以大数据分析、云计算、人工智能等新技术所推动的数字转型正迅速的改变着我们所处的时
    发表于 07-28 07:53

    平头哥剑CDK 更新重磅来袭!三大亮点速看!

    芯片的开发。剑CDK概览一、剑CDK基本介绍剑CDK在产品设计中,分为四个部分:Packages:组件模块;用于支撑剑
    发表于 09-01 15:00

    什么是计算机虚拟

    计算机虚拟是一种型的计算模式, 能够动态组织多种计算资源, 隔离硬件体系结构和软件系统之间的依赖关系, 实现透明
    发表于 12-21 06:42

    关于RT-Thread内存管理的内存简析

    的内存 。该函数从系统中申请一个内存对象,自动分配内存控制块,然后从内存堆中分配一个内存缓冲,该缓冲区大小由内存块数目与块大小计算得到的。申请的
    发表于 04-06 17:02

    OpenHarmony3.1 Release版本特性解析——OpenHarmony硬件资源架构介绍

    ,实现硬件互助、资源共享,为用户提供流畅的全场景体验。本期,我们通过介绍 OpenHarmony 的硬件资源框架,为大家揭晓 OpenHarmony 是如何实现多设备协同的。一、硬
    发表于 05-23 16:42

    一文详解复杂系统和复杂计算

    系统的算力又严重浪费,那就没有充分利用这些算力资源。有过统计,云计算,算力利用率通常在6%左右,要是有办法,把算力资源利用率提升到90%以上,这将是非常巨大的价值。要提升利用率,在芯片
    发表于 11-24 16:37

    分布式系统硬件资源原理和接入实践

    把各个设备的硬件外设抽象为外设信息单元,外设信息在各个可信设备之间自动同步,如此,实现了外设信息的全局可见;结合分布式硬件虚拟技术,实现任意设备之间的硬件外设能力跨设备调用;分布式硬件资源
    发表于 12-06 10:02

    浪潮AIStation助力企业AI计算资源使用大幅提升

    对于AI企业来说,GPU等计算资源昂贵,如何提高资源利用率,保护计算力投资?如何解决资源抢占,保
    的头像 发表于 03-20 16:48 2117次阅读