借助NVIDIA Nemo开拓生成式AI广阔“疆域”-电子发烧友网

“Writer”利用 NVIDIA AI 软件构建的大语言模型（LLM）帮助数百家公司创建内容。

机器学习帮助 Waseem Alshikh 在大学里读完了课本。如今，他正在利用生成式 AI 为数百家公司创建内容。

在叙利亚出生和长大的 Alshikh 不会说英语，但他精通软件。他在黎巴嫩上大学期间，将这一天赋发挥得淋漓尽致。

他回忆道：“第一天他们就给了我一摞课本，每本都有上千页厚，而且全是用英语写的。”

于是，他编写了一个粗糙但有效的统计分类器程序来生成这些课本的内容摘要，然后进行学习。

从提出概念到创业

2014 年，他向在迪拜工作时结识的企业家 May Habib 分享了自己的故事。他们一拍即合，决定创办一家初创企业，帮助总是要求“事半功倍”的营销部门利用机器学习快速创建网页、博客、广告等内容。

Alshikh 在该初创企业担任首席技术官。他表示：“最初我们无法实现这种技术。直到 Transformer 模型发布后，我们才基于此构建了这种技术。”

“我们找了几位工程师，花了近六个月的时间建立了我们的第一个模型。这是一个几乎无法运行的神经网络，拥有约 1.28 亿个参数。”参数数量是衡量 AI 模型能力的常用指标。

一路走来，这家年轻的公司逐渐赢得了一些业务，更名为 Writer，并与 NVIDIA 建立了联系。

驶入快车道

他表示：“在开始使用NVIDIA NeMo后，我们就能够建立行业级模型了，参数量从 30 亿个增加到 200 亿个，再到现在的 400 亿个，而且还在不断扩大。”

NeMo 是一个可以帮助企业整理其训练数据集、构建和定制大语言模型（LLM），并在生产中大规模运行这些模型的应用框架。从韩国到瑞典，世界各地的企业都在使用它来定制本地语言和行业的大语言模型（LLM）。

Alshikh 表示：“在使用 NeMo 之前，我们需要四个半月的时间来构建一个新的十亿级参数模型。而现在我们只需要 16 天就能完成，这真令人难以置信。”

模型带来机遇

今年上半年，这家初创企业不到 20 名的 AI 工程师团队利用 NeMo 开发了 10 个模型，每个模型都有超过 300 亿个或更多的参数。

这带来了巨大的机遇。现在，已经有数百家企业在使用 NeMo 为金融、医疗、零售和其他垂直市场定制的 Writer 模型。

▲ Writer 的 Recap 工具可根据采访或活动录音制作书面摘要

这家初创企业的客户包括德勤、欧莱雅、财捷、优步等家喻户晓的 500 强企业。

Writer 使用 NeMo 取得的成功仅仅是故事的开始。目前，已经有数十家其他公司下载了 NeMo。

这款包含在NVIDIA AI Enterprise中的软件将很快可供使用。NVIDIA AI Enterprise 是一套专为加速生成式 AI 工作负载而优化，并以企业级支持、安全性和应用编程接口稳定性为保障的全栈式软件。

▲ Writer 为企业用户提供全栈式平台

每月一万亿次 API 调用

一些客户在自己的系统或云服务上运行 Writer 的模型，另一些客户则要求 Writer 托管模型或者使用 Writer 的 API。

Alshikh 表示：“我们的云基础设施基本上由两个人管理，每月托管的 API 调用达万亿次，每秒生成 90,000 个单词。我们提供的高质量模型可以与团队规模更大、预算更多的公司所提供的产品相媲美。”

▲NVIDIA NeMo 支持从数据整理一直到推理的整个端到端生成式 AI 流程

Writer 使用与 NeMo 打包在一起的 Triton 推理服务器为其客户在生产中运行模型。Alshikh 表示，许多运行 LLM 的公司都在使用 Triton。与其他程序相比，Triton 可实现更低的延迟和更高的吞吐量。

“这意味着你可以将运行一些服务的成本从 10 万美元减少到 2 万美元，这样就能够投入更多资金构建有意义的功能。” Alshikh 说道。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4597

浏览量
101756
AI

AI

+关注

关注
87

文章
26471

浏览量
264098
语言模型

语言模型

+关注

关注
0

文章
436

浏览量
10057
生成式AI

生成式AI

+关注

关注
0

文章
355

浏览量
224

原文标题：借助 NVIDIA Nemo 开拓生成式 AI 广阔“疆域”

文章出处：【微信号：Leadtek，微信公众号：丽台科技】欢迎添加关注！文章转载请注明出处。

NVIDIA数字人技术加速部署生成式AI驱动的游戏角色

NVIDIA 在 GDC 2024 大会上宣布，Inworld AI 等领先的 AI 应用程序开发者，正在使用 NVIDIA 数字人技术加速部署生成

发表于 04-09 10:08 •219次阅读

NVIDIA生成式AI研究实现在1秒内生成3D形状

NVIDIA 研究人员使 LATTE3D （一款最新文本转 3D 生成式 AI 模型）实现双倍加速。

发表于 03-27 10:28 •163次阅读

NVIDIA Isaac将生成式AI应用于制造业和物流业

NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术，加速 AI 机器人技术的发展。

发表于 03-22 10:06 •179次阅读

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索，实现准确的 AI 推理 NVIDIA 今日宣布推出一项

发表于 11-29 21:05 •381次阅读

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

。 NVIDIA NeMo™ Retriever 是 NVIDIA NeMo（一个用于构建、自定义和部署生成式

发表于 11-29 14:37 •131次阅读

NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的生成式 AI Foundry 服务

应用。这项 NVIDIA AI foundry 服务整合了 NVIDIA AI Foundation Models 、 NVIDIA

发表于 11-16 21:15 •298次阅读

NVIDIA 在 Microsoft Azure 上推出面向全球企业和初创公司的生成式 AI Foundry 服务

Models、NVIDIA NeMo™ 框架和工具，以及 NVIDIA DGX™ 云 AI 超算服务三大要素，为企业提供创建自定义生成式

发表于 11-16 14:13 •142次阅读

利用 NVIDIA Jetson 实现生成式 AI

近日，NVIDIA 发布了 Jetson 生成式 AI 实验室（Jetson Generative AI Lab），使开发者能够通过 NVIDIA

发表于 11-07 21:25 •491次阅读

硅谷：设计师利用生成式 AI 辅助芯片设计

芯片工程师展示了一个高度专业化的行业如何使用 NVIDIA NeMo 来定制大语言模型，以获得竞争优势。 10 月 31 日，NVIDIA 发布的一篇研究论文描述了生成

发表于 11-01 14:45 •171次阅读

NVIDIA AI Enterprise 4.0 推出，助力企业构建生产就绪的生成式 AI 为业务赋能

时。NVIDIA 正在将专业知识投入到解决方案的开发过程中，助力企业实现这样的飞跃。推出 NVIDIA AI Enterprise 4.0 最新版 NVIDIA

发表于 09-19 20:20 •395次阅读

VMware 与 NVIDIA 为企业开启生成式 AI 时代

全新 VMware Private AI Foundation With NVIDIA 帮助企业为生成式 AI 在业务中的应用做好准备；该平台将在数据隐私性、安全性和可控性方面提供进一

发表于 08-23 19:10 •475次阅读

SIGGRAPH 2023 | 初创企业借助 NVIDIA NeMo 撰写生成式 AI 的成功案例

“Writer”利用 NVIDIA AI 软件构建的大语言模型（LLM）帮助数百家公司创建内容。机器学习帮助 Waseem Alshikh 在大学里读完了课本。如今，他正在利用生成式 AI

发表于 08-10 20:15 •236次阅读

Snowflake 携手 NVIDIA 助力企业在数据云端利用数据实现生成式 AI

式 AI 应用，而这一切都可以在 Snowflake 数据云中安全地实现。凭借用于开发大语言模型（LLM）的 NVIDIA NeMo 平台以及 NVIDIA GPU 加速计算，S

发表于 06-27 21:10 •270次阅读

NVIDIA 为 1 亿台 Windows RTX PC 和工作站提供全新生成式 AI 功能与突破性性能

搭载 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的开发与部署；即将推出的 Max-Q 低功耗 AI 推理将提高能效比。

发表于 05-31 03:50 •365次阅读

NVIDIA NeMo 如何支持对话式 AI 任务的训练与推理？

，开发和运行可落地的语音人工智能服务仍然是一项复杂而艰巨的任务，通常需要面临实时性、可理解性、自然性、低资源、鲁棒性等挑战。本期分享我们邀请到了 NVIDIA 的解决方案架构师丁文，分享如何使用 NVIDIA NeMo 进

发表于 05-11 20:16 •628次阅读