0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

NVIDIA英伟达企业解决方案 来源:未知 2023-03-25 09:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA NeMo 服务帮助企业将大型语言模型与其专有数据相结合,赋能智能聊天机器人、客户服务等更多应用。

如今的大型语言模型知识渊博,但它们的工作方式有点像时间胶囊——所收集的信息仅限于第一次被训练时所使用的数据。例如,如果在一年前进行训练,那么驱动 AI 聊天机器人的大型语言模型就不会知道最近的产品或者服务。

通过最近发布的 NVIDIA AI Foundations 云服务系列中的 NVIDIA NeMo 服务,企业可以很好地填补这一缺口。企业用户可以使用专有数据来增强他们的大型语言模型,从而能够经常更新模型的知识库,而不必从头开始重新训练这些模型。

NeMo 服务中的这一新功能使大型语言模型能够从专有数据源中检索准确的信息,并为用户查询生成类似人类的对话式答案。有了这一功能,企业可以使用 NeMo 为其应用程序定制能够定期更新、拥有特定领域知识的大型语言模型。

这可以帮助企业跟上库存、服务等领域不断变化的形势,解锁高精度人工智能聊天机器人、企业搜索引擎和市场情报工具等功能。

NeMo 包括为语言模型的响应引用来源的能力,从而增加用户对输出的信任。使用 NeMo 的开发人员还可以设置护栏来定义人工智能的专业领域,从而更好地控制生成的响应。

Quantiphi 是一家以 AI 为先的数字工程解决方案和平台公司,也是 NVIDIA 的服务交付合作伙伴之一。它正在与 NeMo 合作,构建一个名为 baioniq 的模块化生成人工智能解决方案,帮助企业构建定制的大型语言模型,以提高工人的生产力。其开发团队正在创建一些工具,使用户可以在几秒钟内搜索非结构化文本、图像和表格中的最新信息。

为“暗数据”带来光明

分析师估计,大约有三分之二的企业数据没有被开发。这些信息被称为“暗数据”,它们未被开发的原因之一是很难从大量数据中收集到有意义的洞察。现在,有了 NeMo,企业可以使用自然语言提示从这些数据中获取洞察。

NeMo 可以帮助企业建立能够从不断变化的知识库中学习并做出反应的模型,无论该模型最初使用什么数据集进行训练。开发人员不需要为了新的信息而重新训练模型,只需要更新一个数据库作为该模型的记忆库即可。新增加的信息可以被添加到这个数据库中,而不需要修改大型语言模型在语言处理和文字生成方面的核心能力。

企业还可以设置护栏来定义人工智能的专业领域,生成式 AI 应用将不会对专业领域外的话题发表观点或意见。

掀起新一轮企业生成式 AI 应用的热潮

通过使用业务数据定制大型语言模型,企业可以使他们的 AI 应用变得敏捷、快速响应:

  • 聊天机器人:许多企业已使用 AI 聊天机器人在网站上与客户保持基础的互动。通过 NeMo,企业可以构建所在专业领域的虚拟专家。

  • 客户服务:企业可以使用最新产品的细节来更新 NeMo 模型,帮助现场服务人员运用最新信息,更加轻松地回答客户的问题。

  • 企业搜索:企业拥有非常丰富的资料,包括技术文档、公司政策和 IT 支持文档等。员工可以使用一个由 NeMo 驱动的内部搜索引擎,更快、更容易地检索信息。

  • 市场情报:金融行业需要收集关于全球市场、上市公司和经济趋势的洞察。通过将大型语言模型连接到定期更新的数据库,投资者和其他专家可以从大量信息中快速识别出有用的细节,比如监管文件、财报电话会议录音或财务报表等。

想在应用中添加生成式 AI 功能的企业可以申请抢先体验 NeMo 服务。(https://developer.nvidia.com/nemo-llm-service-early-access)

点击“阅读原文”,观看 NVIDIA 创始人兼首席执行官黄仁勋 NVIDIA GTC 主题演讲中关于 NVIDIA AI Foundations 的部分。

5c54e8ee-caa9-11ed-bfe3-dac502259ad0.gif  

3 月 24 日 下午 14:00-16:00,继续锁定 GTC23,加入在线观看(Watch Party) 派对,从黄仁勋与 OpenAI 创始人兼首席科学家高能对话中,看 AI 的现状和未来!

Watch Party 观看指南

会议开始前 15 分钟,

点击下方出现的“JOIN WATCH PARTY NOW"

进入 Teams 会议室观看

5c680140-caa9-11ed-bfe3-dac502259ad0.png

3 月 24 日 热门观看派对推荐: 【炉边谈话:看 AI 的现状和未来】 会议时间:14:00 - 16:00 会议代码:【WP52092】点击下方链接解会议详情 GTC23 | 黄仁勋与 Ilya Sutskever 的炉边谈话重磅来袭!— 看 AI 的现状和未来 【通过 AI 职业生涯改变世界】 会议时间:19:30 - 21:30 会议代码:【WP52162】 点击下方链接了解会议详情 : GTC23 | 科学计算精选论坛中文解读诚邀您的到来!


原文标题:GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97672

原文标题:GTC23 | 弥补不足:大型语言模型借企业数据之力变得更加智能

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    聆思大模型智能FAE,看得懂技术,答得准问题

    聆思大模型智能FAE,看得懂技术,答得准问题 在智能硬件开发的嵌入式技术支持中,响应迟缓、人员培训成本高企、服务时间覆盖不足等痛点,常常制约FAE团队效率 聆思大
    发表于 09-30 11:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    的好处: ①使处理速度变得非常快 ②更加安全 3、触觉 具身智能的关键之一:了解周围的外部刺激。 面向触觉感知的神经形态模型主要用于模拟手部皮肤触觉感知器在外部压力刺激下的神经电活动,
    发表于 09-18 11:45

    利用自压缩实现大型语言模型高效缩减

    随着语言模型规模日益庞大,设备端推理变得越来越缓慢且耗能巨大。一个直接且效果出人意料的解决方案是剪除那些对任务贡献甚微的完整通道(channel)。我们早期的研究提出了一种训练阶段的方法——自压
    的头像 发表于 07-28 09:36 365次阅读
    利用自压缩实现<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>高效缩减

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高
    的头像 发表于 06-04 09:26 677次阅读

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据
    的头像 发表于 04-30 18:34 1062次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 LLM<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用

    -Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用 Cognizant将在关键增长领域提供解决方案,包括企业级AI
    的头像 发表于 03-26 14:42 578次阅读
    Cognizant将与NVIDIA合作部署神经人工<b class='flag-5'>智能</b>平台,加速<b class='flag-5'>企业</b>人工<b class='flag-5'>智能</b>应用

    英伟达GTC2025亮点:电信行业领先企业启用代理式AI优化网络运维

    Amdocs、BubbleRAN、ServiceNow、软银集团与 Tech Mahindra 基于 NVIDIA AI Enterprise 开发大型电信模型与新型网络 AI 智能体 全球电信
    的头像 发表于 03-21 19:51 1771次阅读

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时遇到错误。
    发表于 03-05 08:07

    小白学大模型:训练大语言模型的深度指南

    在当今人工智能飞速发展的时代,大型语言模型(LLMs)正以其强大的语言理解和生成能力,改变着我们的生活和工作方式。在最近的一项研究中,科学家
    的头像 发表于 03-03 11:51 1211次阅读
    小白学大<b class='flag-5'>模型</b>:训练大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的深度指南

    语言模型的解码策略与关键优化总结

    本文系统性地阐述了大型语言模型(LargeLanguageModels,LLMs)中的解码策略技术原理及其实践应用。通过深入分析各类解码算法的工作机制、性能特征和优化方法,为研究者和工程师提供了全面
    的头像 发表于 02-18 12:00 1072次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>的解码策略与关键优化总结

    望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!

    语言模型的崛起为智能化应用开辟了新的可能性。借助深度学习技术,这些模型能够理解和生成自然语言,处理复杂的文本和语义信息。这使得它们在诸如人
    的头像 发表于 01-08 13:44 1039次阅读

    日本政府计划开发自动驾驶AI以弥补数据不足

    近日,为应对道路环境及交通状况数据缺失的挑战,日本政府正积极推进一项创新举措:开发能够生成高质量虚拟数据的人工智能技术。此举旨在通过技术手段弥补现实
    的头像 发表于 01-02 11:13 697次阅读

    语言模型管理的作用

    要充分发挥语言模型的潜力,有效的语言模型管理非常重要。以下,是对语言模型管理作用的分析,由AI部
    的头像 发表于 01-02 11:06 573次阅读

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    训练模型如BERT、GPT等。这些模型在理解自然语言、生成文本、处理对话等方面具有不同的能力。因此,在选择模型时,需要了解每个模型的特点和优
    发表于 12-17 16:53

    NaVILA:加州大学与英伟达联合发布新型视觉语言模型

    (VLM)是一种具备多模态生成能力的先进AI模型。它能够智能地处理文本、图像以及视频等多种提示,并通过复杂的推理过程,实现对这些信息的准确理解和应用。NaVILA正是基于这一原理,通过将大型
    的头像 发表于 12-13 10:51 959次阅读