0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

NVIDIA英伟达企业解决方案 来源:未知 2023-11-17 21:30 次阅读
wKgaomVXbAeAcNF2AADs9hQoRuI274.jpg

在生成式 AI 领域,构建企业级大语言模型(LLM)需要具备采集高质量数据、设置加速基础设施和优化模型方面的专业知识。

开发者可以从预训练模型开始,根据自己的用例对模型进行微调,从而节省时间并使其解决方案更快地投入市场。开发者需要一种简单的方法来试用模型,并通过 API 集成这些模型来评估其能力。这有助于他们确定哪种模型最适合其应用。

NVIDIA AI Foundation Models

NVIDIA AI Foundation Models是由精心挑选的社区模型和 NVIDIA 构建的模型组成,并针对峰值性能进行了优化。开发者可以通过 API 或图形用户界面直接在浏览器中快速使用这些模型,无需进行任何设置。这些模型通过NVIDIA TensorRT-LLM和激活感知权重量化(AWQ)技术进行优化,以便确定最高吞吐量和最低延迟的配置,并且在 NVIDIA 加速计算堆栈上大规模运行。

NVIDIA Nemotron-3 8B 系列 LLM 介绍

NVIDIA Nemotron-3 8B系列模型为想要构建生产就绪生成式 AI 应用的客户提供了基础。这些模型是基于可靠的数据集构建,其运行性能可媲美规模远超它们的模型,因此非常适合企业部署。

NVIDIA Nemotron-3 8B 系列模型的一大关键优势在于其具有多语言功能,这使其成为全球企业的理想选择。这些模型精通 53 种语言,包括英语、德语、俄语、西班牙语、法语、日语、中文、意大利语和荷兰语。

该系列模型还采用了一系列对齐技术,包括监督微调(SFT)、人类反馈强化学习(RLHF)以及全新的NVIDIA SteerLM定制化技术,使客户可以在推理时调整模型。无论是自定义模型还是从头开始运行模型,这些变体为支持各种不同的用例打下了基础。

Nemotron-3 8B 系列模型包含:

  • Nemotron-3-8B-Chat-SteerLM:一个基于 NV-Nemotron-3-8B 基本模型的生成式语言模型,专为在推理过程中使用户能够采用 SteerLM 技术控制模型输出而定制。

  • Nemotron-3-8B-QA:一个基于 NV-Nemotron-3-8B 基础模型的生成式语言模型,可针对问题回答指令进行进一步微调。

经过 NVIDIA 优化的社区模型

此外,NVIDIA 还提供领先的社区模型,这些模型均经过 NVIDIA TensorRT-LLM 的优化,具有最高的性价比,企业机构可根据企业应用对它们进行自定义。这些模型包括:

  • Llama 2:最流行的 LLM 之一,能够根据提示生成文本。

  • Stable Diffusion XL:一种热门的生成式 AI 模型,可使用文本创建富有表现力的图像。

  • Code Llama:Llama 2 模型的微调版本,可使用 JavaC++Python 等多种流行语言生成代码。

  • Mistral 7B:一种能遵循指令、完成请求并生成有创意的文本格式的 LLM。

  • Contrastive Language-Image Pre-Training (CLIP):一种流行的开源模型,能同时理解图像和文本,从而完成图像分类、物体检测等任务。

当开发者确定了合适的基础模型后,就可以轻松地对这些模型进行微调和部署,无论是在自己的基础设施上,还是通过NVIDIA DGX Cloud在 NVIDIA 维护的基础设施上。

下面让我们一起体验、定制和部署微调后的 Llama 2 模型。

体验 Llama 2

NVIDIA 提供了一个易于使用的界面,使开发者能够直接在浏览器上与 Llama 2 模型进行交互。只需在提示字段中输入文本并点击生成,模型就会立即开始生成信息回复。

在图 1 中,用户要求模型进行 SQL 查询,检索 2021 年第一季度至少消费 50,000 美元的客户名单。模型不但正确理解了用户的查询,并提供了答案和详细解释。

wKgaomVXbAeASNiOAAHfhVJza_w002.png

图 1. Llama 2 模型对 SQL 查询“获取 2021 年第一季度

至少消费 50,000 美元的客户名单”所做出的响应

而开发者通常对代码更感兴趣。因此,NVIDIA 也直接在浏览器中提供了一个 API 小工具,让用户可以通过 API 无缝体验这些模型。

如要试用这个浏览器内置的 API,请单击 API 模式,然后从下拉菜单中选择您倾向的语言。图 2 显示了通过 cURL 调用该 API 的 API 指令。

wKgaomVXbAeAfx5VAAJT5xM-gms898.png

图 2. 用于体验 Llama 2 模型的

浏览器内置 API 小工具(cURL 语言)

自定义模型

通常情况下,一般模型无法满足开发者的需求,必须使用专有数据进行微调。因此,NVIDIA 提供了多种自定义可用模型的途径。

NVIDIA NeMo是一个端到端企业级云原生框架,开发者可用它来构建、定制和部署具有数十亿参数的生成式 AI 模型。此外,NeMo 还提供用于微调 LLM(如 Llama)的 API。

为了快速上手,我们也提供了一个 NVIDIA LaunchPad 实验室。这个通用的试验场可对最新的 NVIDIA 企业级软硬件进行全方位测试。

该 LaunchPad 实验室体验中的以下示例使用自定义数据集对 Llama 2 7B 文本-文本模型进行了微调,以更好地执行问答任务。

  1. 如要开始使用,请单击“Llama 2 微调实验室(https://www.nvidia.com/en-us/launchpad/ai/customize-llama-2-with-enterprise-data/)并申请访问。在 Launchpad 上工作时,Llama 2 模型文件会以 .nemo 检查点的形式预先下载,从而实现与 NVIDIA NeMo Framework 的微调兼容性。

  2. 模型准备就绪后,我们从 Hugging Face 加载 Dolly 数据集(https://huggingface.co/datasets/databricks/databricks-dolly-15k)并对其进行预处理,删除不必要的字段、重命名某些字段,以更好地适应提示调整任务,并将数据集分割成训练文件和测试文件。

    dataset=load_dataset("aisquared/databricks-dolly-15k")

    面所示的是一个数据样本。为了适应特定的用例,数据集可以互换。

    {
    "question": "When did Virgin Australia start operating?", 
    "context": "Virgin Australia, the trading name of Virgin Australia Airlines Pty Ltd, is an Australian-based airline. It is the largest airline by fleet size to use the Virgin brand. It commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.[3] It suddenly found itself as a major airline in Australia's domestic market after the collapse of Ansett Australia in September 2001. The airline has since grown to directly serve 32 cities in Australia, from hubs in Brisbane, Melbourne and Sydney.[4]", 
    "answer": "Virgin Australia commenced services on 31 August 2000 as Virgin Blue, with two aircraft on a single route.", 
    "taskname": "genqa"
    }

  3. 然后,通过更新默认 NeMo 配置文件的某些字段来设置微调作业,以适应当前的训练任务。接着,使用 NeMo 训练脚本启动作业,运行微调并在过程中生成模型检查点。

  4. 微调任务完成后,我们就可以运行笔记本内推理,生成一些示例输出,并评估微调后模型的性能。

  5. 接着让我们来看看这样一个示例输出。我们在上下文中提供了两种产品的描述:割草机和厨房机器人,并询问模型割草机是否由太阳能供电

    该模型准确地把握了上下文,并给出了“是”的回答。在对该模型进行微调后,它就能够根据所提供的上下文准确回答我们的问题了。

    {
    "input": "Context: The Auto Chef Master is a personal kitchen robot that effortlessly turns raw ingredients into gourmet meals with the precision of a Michelin-star chef. The Eco Lawn Mower is a solar powered high-tech lawn mower that provides an eco-friendly and efficient way to maintain your lawn. Question: Is the lawn mower product solar powered? 
    Answer:", 
    "pred": "Yes", 
    "label": "Yes, the Eco Lawn Mower is solar powered.", 
    "taskname": "genqa"
    }

部署模型

NVIDIA AI FoundationEndpoints提供完全无服务器和可扩展的 API,这些 API 可部署在您自己的云或NVIDIA DGX Cloud上。填写此表(https://developer.nvidia.com/login)即可开始使用 AI Foundation Endpoints。

您还可以使用NVIDIA AI Enterprise在自己的云或数据中心基础设施上进行部署。这一端到端的云原生软件平台凭借其企业级的安全性、稳定性、可管理性和支持,能够加速生产级生成式 AI 的开发和部署。当您准备从实验转向生产阶段时,就可以使用 NVIDIA AI Enterprise 的企业级运行时来微调和部署这些模型。

更多信息

通过这篇文章,我们了解了 NVIDIA AI Foundation 模型是如何通过提供易于使用的模型体验界面,以及简化的模型微调和部署路径,从而帮助企业开发者找到适合各种用例的模型。

欢迎探索NVIDIA NGC 目录中提供的不同AI Foundation 模型(https://catalog.ngc.nvidia.com/ai-foundation-models),找到适合您的模型。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击“阅读原文”扫描下方海报二维码,立即注册 GTC 大会


原文标题:利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87770

原文标题:利用 NVIDIA AI Foundation Models 构建自定义企业级生成式 AI

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA 通过企业级生成AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

    微服务,支持企业自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。 NVIDIA NeMo Retriever
    的头像 发表于 11-29 21:05 380次阅读

    NVIDIA 通过企业级生成AI 微服务 为聊天机器人、AI 助手和摘要工具带来商业智能

    。   NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建自定义和部署生成
    发表于 11-29 14:37 131次阅读
    <b class='flag-5'>NVIDIA</b> 通过<b class='flag-5'>企业级</b><b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 微服务 为聊天机器人、<b class='flag-5'>AI</b> 助手和摘要工具带来商业智能

    Dropbox 与 NVIDIA 携手为数百万客户带来个性化的生成AI

    Dropbox 计划使用 NVIDIAAI Foundry 构建自定义模型,并通过 Dropbox Dash 通用搜索工具和 Dropbox
    的头像 发表于 11-20 20:55 327次阅读
    Dropbox 与 <b class='flag-5'>NVIDIA</b> 携手为数百万客户带来个性化的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    NVIDIA AI Foundation Models:使用生产就绪型 LLM 构建自定义企业聊天机器人和智能副驾

      系列基础模型是一套功能强大的全新工具,可用于为企业构建生产就绪生成AI 应用,从而推动从客服 AI 聊天机器人到尖端
    的头像 发表于 11-17 21:35 519次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> <b class='flag-5'>Foundation</b> <b class='flag-5'>Models</b>:使用生产就绪型 LLM <b class='flag-5'>构建</b><b class='flag-5'>自定义</b><b class='flag-5'>企业</b>聊天机器人和智能副驾

    NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的生成AI Foundry 服务

    应用。 这项 NVIDIA AI foundry 服务整合了  NVIDIA AI Foundation
    的头像 发表于 11-16 21:15 297次阅读

    NVIDIA 加快企业自定义生成AI 模型开发

    的业务数据进行自定义。 如今,免费、开源的大语言模型对企业来说就像是一顿“自助餐”。但对于构建自定义生成AI 应用的开发者来说,这顿“大
    的头像 发表于 11-16 21:15 344次阅读
    <b class='flag-5'>NVIDIA</b> 加快<b class='flag-5'>企业</b><b class='flag-5'>自定义生成</b>式 <b class='flag-5'>AI</b> 模型开发

    共筑电信行业未来:NVIDIA 与 Amdocs 为全球电信行业带来自定义生成AI

    Amdocs 计划在 Microsoft Azure 上使用 NVIDIA AI foundry 服务,为价值 1.7 万亿美元的全球电信行业构建自定义 LLM。 据 IDC 称, 作
    的头像 发表于 11-16 21:10 363次阅读
    共筑电信行业未来:<b class='flag-5'>NVIDIA</b> 与 Amdocs 为全球电信行业带来<b class='flag-5'>自定义生成</b>式 <b class='flag-5'>AI</b>

    NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的 生成AI Foundry 服务

    SAP、Amdocs、Getty Images 率先使用 NVIDIA AI Foundation Models 构建
    发表于 11-16 14:13 142次阅读
    <b class='flag-5'>NVIDIA</b> 在 Microsoft Azure 上推出面向全球<b class='flag-5'>企业</b>和初创公司的 <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> Foundry 服务

    企业级生成AI应用,如何克服“幻觉”问题

    然而,企业级 AI 应用与个人 AI 应用需求之间存在巨大差异,对技术本身的要求也不在一个量级。仅拿当下生成AI 应用最让人诟病的“
    的头像 发表于 09-21 16:00 449次阅读

    NVIDIA AI Enterprise 4.0 推出,助力企业构建生产就绪的生成AI 为业务赋能

    时。NVIDIA 正在将专业知识投入到解决方案的开发过程中,助力企业实现这样的飞跃。 推出 NVIDIA AI Enterprise 4.0 最新版 
    的头像 发表于 09-19 20:20 391次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise 4.0 推出,助力<b class='flag-5'>企业</b><b class='flag-5'>构建</b>生产就绪的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 为业务赋能

    全球领先系统制造商推出 NVIDIA AI 就绪型服务器,为企业大幅提升生成AI 性能

    Private AI Foundation with NVIDIA ,帮助企业使用自有业务数据来定制和部署生成
    的头像 发表于 08-23 19:10 378次阅读

    VMware 与 NVIDIA企业开启生成AI 时代

    关系,帮助数十万家使用 VMware 云基础架构的企业做好准备,迎接AI时代的到来。 VMware Private AI Foundation with
    的头像 发表于 08-23 19:10 471次阅读
    VMware 与 <b class='flag-5'>NVIDIA</b> 为<b class='flag-5'>企业</b>开启<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 时代

    SIGGRAPH 2023 | NVIDIA AI Workbench 助力全球企业加速采用自定义生成AI

    2023 年 8 月 8 日 — NVIDIA 发布 NVIDIA AI Workbench 。这个统一、易于使用的工具套件使开发者能够在 PC 或工作站上快速创建、测试和自定义预训
    的头像 发表于 08-09 19:10 285次阅读

    教程 3:构建自定义配置文件

    教程 3:构建自定义配置文件
    发表于 07-06 18:49 0次下载
    教程 3:<b class='flag-5'>构建</b><b class='flag-5'>自定义</b>配置文件

    ServiceNow 与 NVIDIA 宣布联合打造面向企业 IT 的生成AI

    基于 ServiceNow 平台并采用 NVIDIA AI 软件和 DGX 基础设施构建自定义大型语言模型将为企业带来更智能的工作流自动化
    的头像 发表于 05-19 00:50 366次阅读
    ServiceNow 与 <b class='flag-5'>NVIDIA</b> 宣布联合打造面向<b class='flag-5'>企业</b> IT 的<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>