0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NIM助力企业高效部署生成式AI模型

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-10-10 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Canonical、Nutanix 和 Red Hat 等厂商的开源 Kubernetes 平台集成了 NVIDIA NIM,将允许用户通过 API 调用来大规模地部署大语言模型。

在企业中部署生成式 AI 将变得空前简单。

NVIDIA NIM是一套生成式 AI 推理微服务,将支持 KServe 开源软件,可以自动将 AI 模型以云计算应用的规模运行。

NVIDIA NIM 与 KServe 的组合确保了生成式 AI 可以像任何其他大型企业级应用一样进行部署,还让用户能够通过 Canonical、Nutanix 和 Red Hat 等数十家公司的平台广泛使用 NIM。

NIM 在 KServe 上的集成将使 NVIDIA 的技术扩展到开源社区、生态系统合作伙伴和客户。借助 NIM,他们可以通过 API 调用(即现代编程的一键式操作)来获得NVIDIA AI Enterprise软件平台的性能、支持和安全性。

在 Kubernetes 上提供 AI

KServe 最初是基于 Kubernetes 的机器学习工具包 Kubeflow 的一部分。Kubernete 是一个开源系统,用于部署和管理包含大型分布式应用组件的软件容器。

随着 Kubeflow 在 AI 推理方面的不断扩展,KServe 诞生了,并最终演变成为独立的开源项目。

许多公司都为 KServe 软件做出了贡献并采用了该软件。目前,运行 KServe 软件的公司包括亚马逊云科技、彭博、Canonical、思科、慧与、IBM、Red Hat、Zillow 和 NVIDIA 等。

深入解析 KServe

KServe 本质上是 Kubernetes 的扩展,它像一个强大的云应用一样运行 AI 推理。它使用标准协议,以经过优化的性能运行,并支持 PyTorch、Scikit-learn、TensorFlow 和 XGBoost,而用户无需了解这些 AI 框架的细节。

在新的大语言模型(LLM)层出不穷的情况下,该软件尤其有用。

KServe 让用户可以轻松地在模型之间来回切换,测试哪一个最符合他们的需求。当模型的新版本发布时,KServe 的 “金丝雀发布(canary rollouts)” 功能会自动执行详细验证,并逐步将其部署到生产系统中。

其另一项功能 “GPU 自动缩放” 可以随着服务需求的起伏来高效地管理模型的部署方式,从而使客户和服务提供商获得最佳体验。

生成式 AI 的 API 调用

KServe 的优势现在将通过 NVIDIA NIM 的便捷性提供。

使用 NIM ,只需一个简单的 API 调用即可应对所有的复杂性。企业 IT 管理员能够获得确保应用以最佳性能和效率运行所需的指标,无论应用是在他们的数据中心还是在远程云服务上,即使是在更改了 AI 模型的情况下。

NIM 让 IT 专家成为生成式 AI 专家,变革了公司的运营。这就是为什么 Foxconn 和 ServiceNow 等众多企业都正在部署 NIM 微服务的原因。

NIM 支持数十个 Kubernetes 平台

由于 NIM 与 KServe 的集成,用户将能够在数十个企业平台上访问 NIM,比如 Canonical 的 Charmed KubeFlow 和 Charmed Kubernetes、Nutanix GPT-in-a-Box 2.0、Red Hat 的 OpenShift AI 等等。

KServe 贡献者、Red Hat 首席软件工程师 Yuan Tang 表示:“Red Hat 一直在与 NVIDIA 合作,以便让企业更轻松地使用开源技术来部署 AI。通过增强 KServe 并在 Red Hat OpenShift AI 中增加对 NIM 的支持,我们能够让 Red Hat 的客户更方便地访问 NVIDIA 的生成式 AI 平台。”

“通过将 NVIDIA NIM 推理微服务与 Nutanix GPT-in-a-Box 2.0 集成,客户将能够从云端到边缘以一致的方式去构建可扩展、安全、高性能的生成式 AI 应用。” Nutanix 工程副总裁 Debojyoti Dutta 表示,其团队为 KServe 和 Kubeflow 做出了贡献。

Canonical 的 MLOps 产品经理 Andreea Munteanu 表示:“作为一家对 KServe 做出重大贡献的公司,我们很高兴通过 Charmed Kubernetes 和 Charmed Kubeflow 提供 NIM。在我们的共同努力下,用户将能够轻松地使用生成式 AI 的全部功能,并使其保持最高的性能和效率。”

数十家其他软件提供商都能感受到 NIM 的好处,因为他们的产品中也包含了 KServe。

服务开源社区

NVIDIA 一直积极地参与 KServe 项目。正如最近的一篇技术博客中所提到的,KServe 的开放推理协议已经被用于NVIDIA Triton 推理服务器,可以帮助用户跨多个 GPU、框架和操作模式同时运行许多 AI 模型。

基于 KServe,NVIDIA 专注于在多个 GPU 上一次运行一个 AI 模型的用例。

作为 NIM 集成的一部分,NVIDIA 计划在其开源软件(包括 Triton 和TensorRT-LLM)的基础上,成为 KServe 的积极贡献者。NVIDIA 还是云原生计算基金会(CNCF)的活跃成员,该基金会支持生成式 AI 和其他项目的开源代码。

立即通过 NVIDIA API 目录试用 Llama 3 8B 或 Llama 3 70B 大语言模型的 NIM API。全球数百家 NVIDIA 合作伙伴也正在使用 NIM 来部署生成式 AI。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5758

    浏览量

    110445
  • 数据中心
    +关注

    关注

    18

    文章

    5882

    浏览量

    75287
  • AI
    AI
    +关注

    关注

    91

    文章

    42458

    浏览量

    303413

原文标题:COMPUTEX 2024 | KServe 提供商在云和数据中心提供由 NIM 赋能的推理

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奎景运算科技借助NVIDIA DGX Spark优化生成AI平台

    随着生成 AI 浪潮席卷全球,奎景运算科技不仅展现加速计算领域的深厚实力,更藉由导入 NVIDIA DGX Spark,成功优化核心产品脱机生成
    的头像 发表于 06-03 10:05 285次阅读

    AI模型微调企业项目实战课

    自主可控大模型企业微调实战课,筑牢未来 AI 底座 在人工智能席卷全球商业版图的今天,企业对大模型(LLM)的态度已经从“新奇观望”转变
    发表于 04-16 18:48

    嵌入AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    ”与“工业安全”的对立,为嵌入开发提供“高效+可靠”的全新路径,推动AI技术从实验室走向工业产线,加速企业数字化转型与智能化升级。 ▌降低技术门槛与适配成本:依托图形化低代码开发与一
    发表于 03-18 13:49

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正
    的头像 发表于 03-16 16:27 828次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    技嘉与趋境科技联合部署AMaaS平台 推动本地大模型应用加速落地

    生成AI加速走向实际应用的当下,大模型部署正从“可体验”迈向“可落地、可管理、可应用”。作为技嘉面向本地
    的头像 发表于 03-12 15:11 263次阅读
    技嘉与趋境科技联合<b class='flag-5'>部署</b>AMaaS平台 推动本地大<b class='flag-5'>模型</b>应用加速落地

    AI基础设施中部署大语言模型的三大举措

    文:Gartner研究副总裁周玲中国企业机构已逐步在生产环境中运行或者计划运行大语言模型,但在AI基础设施的生产部署高效运营方面仍面临诸多
    的头像 发表于 02-09 16:28 620次阅读
    在<b class='flag-5'>AI</b>基础设施中<b class='flag-5'>部署</b>大语言<b class='flag-5'>模型</b>的三大举措

    行业特定的生成 AI 能力如何形成:面向中国企业的场景化解决方案模型

    随着生成 AI 在国内加速落地,越来越多企业意识到:单靠通用大模型,并不能覆盖行业中的复杂流程与专业需求。金融、制造、能源、零售、医疗等行
    的头像 发表于 12-02 09:33 618次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据
    的头像 发表于 12-01 09:25 1658次阅读

    新唐科技推出高效AI MCU部署工具NuML Toolkit

    随着 AI 技术加速导入各类嵌入系统,如何将训练完成的 AI 模型顺利部署至资源有限的微控制器成为工程师面对的重大挑战。为协助开发者快速落
    的头像 发表于 08-01 17:21 2580次阅读

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7B。
    的头像 发表于 07-09 10:17 1129次阅读

    谷歌新一代生成AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1404次阅读

    NVIDIA技术助力企业创建主权AI智能体

    AI Factory 的经验证设计将加速基础设施与软件(包括全新 NVIDIA NIM 微服务和经扩展的 NVIDIA Blueprint)相结合,为各国和
    的头像 发表于 06-16 14:28 1647次阅读

    使用NVIDIA Earth-2生成AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)为这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成 AI 基础
    的头像 发表于 06-12 15:54 1556次阅读

    Dify携手亚马逊云科技加速全球企业生成AI应用规模化落地

    简单易用的AI应用开发平台Dify通过深度集成亚马逊云科技的生成AI技术与云服务,在保障性能、合规与全球交付的基础上,显著降低企业
    的头像 发表于 06-07 16:00 1091次阅读

    企业部署AI模型怎么做

    当下,AI模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高
    的头像 发表于 06-04 09:26 1076次阅读