0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI数据飞轮的工作原理

丽台科技 来源:NVIDIA英伟达 2025-06-10 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:NVIDIA英伟达

数据飞轮是一种反馈循环机制,通过从交互或流程中收集数据,持续优化 AI 模型,进而产生更优的结果和更有价值的数据。

1AI 数据飞轮的工作原理是什么?

AI 数据飞轮的工作原理是通过创造循环机制,帮助 AI 模型整合机构知识与用户反馈,从而实现持续的改进。当模型生成输出结果时,数据飞轮会将反馈与新数据收集起来,用于模型的优化与增强。这一流程涉及数据管护与数据质量的提升,以便确保 AI 模型的精度和性能均得到持续改善。

8af7745a-400e-11f0-b715-92fbcf53809c.jpg

数据飞轮:由数据处理、模型定制、评估、护栏和及部署构成的持续运转周期,能够利用企业数据改进 AI 系统

此外,数据飞轮内置 AI 护栏,以保持数据的完整性和可靠性,确保输出结果准确、合规、安全。这种持续的反馈和增强周期能够使 AI 模型的效能与日俱增。这一工作流由六大步骤组成:

数据处理:AI 数据飞轮的基础是企业数据。这类数据形式多样,包括文本文档、图像、视频、表格和图表。AI 数据飞轮需要通过对原始数据进行数据处理来提取和优化信息。随后,原始数据将接受进一步的筛选,去除低质量文档、个人身份信息 (PII) 与不良、有害数据,生成高质量数据。这样的数据管护能够有效提高应用的准确性。

模型定制:借助领域自适应预训练 (DAPT) 和监督式微调 (SFT) 等大语言模型 (LLM) 技术,您能够在资源要求较低情况下,快速为模型增添领域特定知识与任务专属技能。到这一步,模型已对公司的特有词汇和上下文有了更深的理解。

模型评估:接下来,您可以评估模型性能、验证答案(输出)是否符合应用的要求。以迭代的方式执行前三步,能够确保模型质量得到改进,且结果符合目标应用的要求。

AI 护栏实施:将 AI 护栏添加到定制模型中,可确保应用的部署符合企业对隐私、安全保障和安全的特定要求。

自定义模型部署:在同时部署生成式 AI 和代理式 AI 应用时,从不断扩大的数据库中持续检索信息。用户反馈和系统运行数据会被反复收集。借助 AI 数据飞轮,您可以在基于应用交互构建机构知识的同时,生成经优化、更智能的答案。

企业数据优化:由此产生的结果就是,随着时间推移,机构数据会基于收集自人类反馈和 AI 模型反馈的新数据持续更新。随着流程的重复,这一过程将反馈到数据处理中。

2扩展 AI 数据飞轮策略的目的是什么?

现实世界的 AI 智能体系统可能包含数百至数千个 AI 智能体,通过同时工作来实现流程的自动化。数据飞轮对于简化智能体操作(如审查新数据)至关重要,特别是在业务需求发生变化的情况下。这可确保 AI 智能体编排更加流畅,因为专业化的 AI 智能体团队可以提供针对资源优化的规划,并以更少的人工输入执行这些计划。

代理式 AI 的可扩展性依赖于由数据管护、模型训练、部署以及机构知识收集审查构成的自动化周期,最终实现智能体性能的不断提升。

此外,AI 应用还涉及若干身担特定职责的人类协作者:

8b1507ea-400e-11f0-b715-92fbcf53809c.jpg

3为什么数据飞轮对于代理式 AI和生成式 AI 的采用至关重要?

在采用 AI 智能体和生成式 AI 应用时,需要借助数据飞轮来推动软件持续改进、提升适应性。例如,随着业务需求发生变化或复杂性增加,性能和成本往往成为决定商业成败的关键。

借助高效的 AI 数据飞轮,企业组织可以:

开发符合业务或客户需求且经济高效的应用。

对产品进行个性化和优化,改善用户体验。

达成切实的目标,如提高销售转化率或通过实施自动化提升生产力。

为保持竞争优势,企业组织可以收集处理新的交互数据、优化 AI 模型,并逐步提升其 AI 应用的性能。从 LLM 到视觉语言模型 (VLM),可用于集成的数据类型丰富多样。

开发团队也可以加快模型训练速度,专注于利用其专有数据对现有基础模型进行调优。生成式 AI 微服务可通过 API 调用进一步简化这一流程。

这种方法能够大幅减少开发和部署代理式 AI 和生成式 AI 解决方案所需的时间和资源。

4应该在何时对数据飞轮进行加速?

加速 AI 数据飞轮对解决与代理式 AI 技术相关的依赖关系具有重要意义。

例如,如果没有集中式反馈和日志记录系统,我们就难以对系统性能进行跟踪和分析,而这有可能影响数据飞轮的运行速度。如果评估数据集不能准确反映现实世界场景,就有可能导致模型性能欠佳。

随着知识库的更新,系统反馈的相关性可能会下降,从而使飞轮难以实现持续改进。人工干预虽然有益,但需要耗费大量资源和时间。解决这一问题,将有助于在加速数据飞轮同时保持其效能。

这样一来,当系统层面发生大量影响性能的交互时,加速就变得很有必要。例如,在生成式 AI 应用中,准确性和与符合人类偏好很重要。在代理式 AI 应用中,则需要 AI 知识工作者对计划进行简化和执行。

8b247004-400e-11f0-b715-92fbcf53809c.jpg

5如何开始使用数据飞轮?

要借助数据飞轮构建新一代代理式 AI 和生成式 AI 应用,需要对机构数据进行快速迭代和利用。

NVIDIA NeMo 是一个用于构建数据飞轮的端到端平台,可助力企业利用最新信息对 AI 智能体进行持续优化。

借助 NeMo,企业 AI 开发者能够轻松完成对数据的大规模管护,利用热门调优技术定制 LLM,根据行业和自定义基准测试对模型进行具有一致性的评估,并在护栏的保障下得到适用且可靠的输出结果。

NeMo 平台包含:

NeMo Curator:可高效管护用于训练 LLM 的高质量数据集,从而起到提高模型性能、加速 AI 解决方案部署的作用。

NeMo Customizer:一项高性能、可扩展的微服务,可运用 LoRA、DPO 等热门参数高效调优技术,简化 LLM 的微调和校准工作。

NeMo Evaluator:一项企业级微服务,用于提供生成式 AI 模型的行业标准基准测试、合成数据生成以及端到端的 RAG 工作流。

NeMo Guardrails:一项面向开发者的微服务,可帮助开发者在基于 LLM 的应用中实现强大的安全性和保障措施,确保这些应用始终具有可靠性,且符合组织的政策和指南。

NeMo Retriever:一组微服务,可通过可扩展的数据采集和高精度的隐私保护检索为 AI 数据飞轮赋能。依靠源自大型数据集合、具有上下文感知能力的快速响应能力,开发者能够将 AI 应用与不同数据源连接起来,构建 AI 查询引擎,并利用实时洞察对 AI 模型进行持续优化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296483
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710
  • 智能体
    +关注

    关注

    1

    文章

    387

    浏览量

    11520

原文标题:丽台科普丨什么是数据飞轮?

文章出处:【微信号:Leadtek,微信公众号:丽台科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Cube如何导入数据集?

    我从在线平台标注完并且下载了数据集,也按照ai cube的要求修改了文件夹名称,但是导入提示 不知道是什么原因,我该怎么办? 以下是我修改后的文件夹目录
    发表于 08-11 08:12

    飞轮储能的电机控制方法

    摘 要:飞轮储能系统一般采用调节电枢电压来对转速进行调节,调节电压多通过PWM 信号来控制。但在这个高速系统中运用这种调节方式,会造成PWM输出电压滞后于调制电压信号,影响电枢电压的波形,从而会造成
    发表于 07-25 14:07

    FLASH的工作原理与应用

    的性能,即使在断电的情况下也能保持数据不丢失。Flash存储器的读取速度非常快,适合用于频繁读取数据的应用场景。它的工作原理是通过控制电子在半导体材料中的移动来存储
    的头像 发表于 05-27 13:10 1468次阅读
    FLASH的<b class='flag-5'>工作原理</b>与应用

    GPIO配置的工作原理是什么?

    我使用 EZ-USB 配置实用程序,我想知道是否有人知道 GPIO 配置的工作原理。 例如,GPIO0 可以用作传感器复位,我知道这个 GPIO0 用于重置传感器,但我不明白的是选项用户 GPIO 例如GPIO 1可以是User GPIO0,这是什么意思呢?
    发表于 05-19 06:56

    电动调压器的工作原理

    电压调压器是一种用于控制电路中电压的装置,其工作原理因类型而异,以下是几种常见电压调压器的工作原理
    的头像 发表于 05-12 13:46 908次阅读
    电动调压器的<b class='flag-5'>工作原理</b>

    【「零基础开发AI Agent」阅读体验】+Agent的工作原理及特点

    要了解Agent的使用,就需要先了解Agent的工作原理。 Agent的基本决策流程注意分为3个核心部分,即感知、规划及行动,见图1所示。 图1 基本决策流程 1)感知 感知是指Agent通过其
    发表于 05-11 10:24

    微动开关的工作原理

    微动开关的工作原理
    的头像 发表于 04-17 09:00 2717次阅读

    适用于数据中心和AI时代的800G网络

    和性能隔离能力,以保障不同用户任务互不干扰。 分布式AI计算与网络架构设计 分布式计算已成为AI训练的主流方式,通过将工作负载分配到多个GPU节点并行处理,以加速模型训练。这对数据
    发表于 03-25 17:35

    振弦式锚杆应力计的工作原理数据计算方法

    准确、稳定性好、长期监测可靠等优点。南京峟思将详细介绍振弦式锚杆应力计的工作原理及其数据计算方法。一、工作原理振弦式锚杆应力计的工作原理基于振弦的频率与所受张力之
    的头像 发表于 02-24 13:49 783次阅读
    振弦式锚杆应力计的<b class='flag-5'>工作原理</b>与<b class='flag-5'>数据</b>计算方法

    气体传感器工作原理及分类

    气体传感器作为现代科技的重要组成部分,广泛应用于环境监测、工业安全、医疗健康等多个领域。它们能够精确检测各种气体的浓度,为预警、控制和处理潜在危险提供关键数据。本文将深入探讨气体传感器的工作原理及其
    的头像 发表于 02-23 17:52 2085次阅读

    阻尼器的工作原理与结构

    阻尼器的工作原理与结构密切相关,其基本原理在于通过施加一个与振动方向相反的力(即阻尼力)来消耗振动的能量,使物体的振动幅度逐渐减小,直至停止振动。以下是对阻尼器工作原理与结构的介绍: 工作原理
    的头像 发表于 02-13 14:56 5376次阅读

    分压器的工作原理

     分压器是一种电路元件,其工作原理基于欧姆定律和电压分配法则。分压器通常由两个或更多个电阻(或其他元件,如电容器)串联而成,用于将输入电压分配到输出端。以下是分压器工作原理的详细解释:
    的头像 发表于 01-28 13:50 3243次阅读

    移动电源的工作原理_移动电源结构

    移动电源的工作原理是将电能存储在内置电池中,然后通过适当的电压和电流输出,为电子设备提供所需的电能。以下是关于移动电源工作原理的详细解释:
    的头像 发表于 01-27 16:11 3272次阅读

    超级电容电池的工作原理

    超级电容电池是一种介于传统电容器与电池之间的新型储能装置。其工作原理主要基于电荷分离和电场存储,以下是关于超级电容电池工作原理的详细解释:
    的头像 发表于 01-27 11:17 1984次阅读

    自动气象站的工作原理与应用

    自动气象站是现代气象观测网络的重要组成部分,它通过集成传感器、数据采集与处理系统、通讯设备等技术手段,实现了对大气环境参数的实时监测和高效数据传输。以下是对自动气象站的工作原理与应用的详细探讨
    的头像 发表于 12-18 13:56 1191次阅读