0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助NVIDIA Nemo开拓生成式AI广阔“疆域”

丽台科技 来源:NVIDIA英伟达企业解决方案 2023-08-14 11:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“Writer”利用 NVIDIA AI 软件构建的大语言模型(LLM)帮助数百家公司创建内容。

机器学习帮助 Waseem Alshikh 在大学里读完了课本。如今,他正在利用生成式 AI 为数百家公司创建内容。

在叙利亚出生和长大的 Alshikh 不会说英语,但他精通软件。他在黎巴嫩上大学期间,将这一天赋发挥得淋漓尽致。

他回忆道:“第一天他们就给了我一摞课本,每本都有上千页厚,而且全是用英语写的。”

于是,他编写了一个粗糙但有效的统计分类器程序来生成这些课本的内容摘要,然后进行学习。

从提出概念到创业

2014 年,他向在迪拜工作时结识的企业家 May Habib 分享了自己的故事。他们一拍即合,决定创办一家初创企业,帮助总是要求“事半功倍”的营销部门利用机器学习快速创建网页、博客、广告等内容。

Alshikh 在该初创企业担任首席技术官。他表示:“最初我们无法实现这种技术。直到 Transformer 模型发布后,我们才基于此构建了这种技术。”

“我们找了几位工程师,花了近六个月的时间建立了我们的第一个模型。这是一个几乎无法运行的神经网络,拥有约 1.28 亿个参数。”参数数量是衡量 AI 模型能力的常用指标。

一路走来,这家年轻的公司逐渐赢得了一些业务,更名为 Writer,并与 NVIDIA 建立了联系。

驶入快车道

他表示:“在开始使用NVIDIA NeMo后,我们就能够建立行业级模型了,参数量从 30 亿个增加到 200 亿个,再到现在的 400 亿个,而且还在不断扩大。”

NeMo 是一个可以帮助企业整理其训练数据集、构建和定制大语言模型(LLM),并在生产中大规模运行这些模型的应用框架。从韩国到瑞典,世界各地的企业都在使用它来定制本地语言和行业的大语言模型(LLM)。

Alshikh 表示:“在使用 NeMo 之前,我们需要四个半月的时间来构建一个新的十亿级参数模型。而现在我们只需要 16 天就能完成,这真令人难以置信。”

模型带来机遇

今年上半年,这家初创企业不到 20 名的 AI 工程师团队利用 NeMo 开发了 10 个模型,每个模型都有超过 300 亿个或更多的参数。

这带来了巨大的机遇。现在,已经有数百家企业在使用 NeMo 为金融、医疗、零售和其他垂直市场定制的 Writer 模型。

dbbe55b2-3a47-11ee-9e74-dac502259ad0.jpg

▲ Writer 的 Recap 工具可根据采访或活动录音制作书面摘要

这家初创企业的客户包括德勤、欧莱雅、财捷、优步等家喻户晓的 500 强企业。

Writer 使用 NeMo 取得的成功仅仅是故事的开始。目前,已经有数十家其他公司下载了 NeMo。

这款包含在NVIDIA AI Enterprise中的软件将很快可供使用。NVIDIA AI Enterprise 是一套专为加速生成式 AI 工作负载而优化,并以企业级支持、安全性和应用编程接口稳定性为保障的全栈式软件。

dbd5d930-3a47-11ee-9e74-dac502259ad0.jpg

▲ Writer 为企业用户提供全栈式平台

每月一万亿次 API 调用

一些客户在自己的系统或云服务上运行 Writer 的模型,另一些客户则要求 Writer 托管模型或者使用 Writer 的 API。

Alshikh 表示:“我们的云基础设施基本上由两个人管理,每月托管的 API 调用达万亿次,每秒生成 90,000 个单词。我们提供的高质量模型可以与团队规模更大、预算更多的公司所提供的产品相媲美。”

dbf5bf16-3a47-11ee-9e74-dac502259ad0.png

▲NVIDIA NeMo 支持从数据整理一直到推理的整个端到端生成式 AI 流程

Writer 使用与 NeMo 打包在一起的 Triton 推理服务器为其客户在生产中运行模型。Alshikh 表示,许多运行 LLM 的公司都在使用 Triton。与其他程序相比,Triton 可实现更低的延迟和更高的吞吐量。

“这意味着你可以将运行一些服务的成本从 10 万美元减少到 2 万美元,这样就能够投入更多资金构建有意义的功能。” Alshikh 说道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5694

    浏览量

    110118
  • AI
    AI
    +关注

    关注

    91

    文章

    41147

    浏览量

    302609
  • 语言模型
    +关注

    关注

    0

    文章

    575

    浏览量

    11343
  • 生成式AI
    +关注

    关注

    0

    文章

    538

    浏览量

    1133

原文标题:借助 NVIDIA Nemo 开拓生成式 AI 广阔“疆域”

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与Google Cloud携手推进代理式与物理AI发展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 A
    的头像 发表于 04-27 15:35 12次阅读

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行
    的头像 发表于 03-16 16:27 645次阅读
    <b class='flag-5'>NVIDIA</b> Jetson模型赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2508次阅读
    <b class='flag-5'>NVIDIA</b>和ComfyUI携手简化本地<b class='flag-5'>AI</b>视频<b class='flag-5'>生成</b>工作流

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成借助
    的头像 发表于 12-01 09:25 1442次阅读

    通过NVIDIA Jetson AGX Thor实现7倍生成AI性能

    Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为在边缘端加速生成
    的头像 发表于 10-29 16:53 1642次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 1117次阅读
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion技术提升<b class='flag-5'>AI</b>推理性能

    智能体化AI生成AI的区别

    生成 AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic
    的头像 发表于 08-25 17:24 1902次阅读

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 数据处理软件、NeMo Framework 模型训练框架及 Auto Configurator 优化工
    的头像 发表于 08-20 14:21 1029次阅读

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和
    的头像 发表于 07-16 09:16 2185次阅读

    制作团队如何借助NVIDIA RTX AI让创意成真

    艺术家和开发者已经在利用生成 AI 简化工作、突破创意边界,无论是探索概念、设计虚拟世界还是构建智能应用。借助 RTX AI PC,用户能
    的头像 发表于 07-09 16:28 937次阅读

    NVIDIA推出全新智慧城市AI Blueprint

    面向智慧城市 AINVIDIA Omniverse Blueprint 集成了 NVIDIA Omniverse、Cosmos、NeMo 和 Metropolis,已被多家领先的
    的头像 发表于 06-16 14:21 1354次阅读

    使用NVIDIA Earth-2生成AI基础模型革新气候建模

    NVIDIA 正通过 cBottle(Climate in a Bottle 的简称)为这项工作带来新的突破,这是全球首个专为以公里尺度分辨率模拟全球气候而设计的生成 AI 基础模型
    的头像 发表于 06-12 15:54 1454次阅读

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion
    的头像 发表于 06-12 15:49 1490次阅读

    Wandercraft借助NVIDIA技术开发个人外骨骼设备

    初创公司 Wandercraft 正借助 NVIDIA AINVIDIA Omniverse 仿真技术,开发个人外骨骼设备。这些外骨骼设备能够帮助脊髓损伤、中风以及其他严重行动能
    的头像 发表于 05-15 10:43 966次阅读

    企业使用NVIDIA NeMo微服务构建AI智能体平台

    已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。
    的头像 发表于 04-27 15:05 1489次阅读