0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA TAO工具包和Appen实现AI模型微调

星星科技指导员 来源:NVIDIA 作者: Titus Capilnean 2022-04-13 15:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从头开始构建人工智能模型需要大量的数据、时间、金钱和专业知识。这与在人工智能领域取得成功的条件不符:快速上市,以及快速发展和定制解决方案的能力。 NVIDIA TAO 是一个人工智能模型调整框架,与从头开始的培训相比,它可以让您利用生产质量、预培训的人工智能模型,并在很短的时间内对其进行微调。

要进一步微调这些模型,或确认模型的精度,需要额外的高质量训练数据。 Appen 是 TAO 的数据注释合作伙伴,如果您没有合适的可用数据,它可以访问高质量的数据集和服务,为您的数据添加标签和注释,以满足您的独特需求。

在帖子中,我将向你展示如何使用 NVIDIA TAO 工具包 一个基于 CLI 的NVIDIA TAO 框架的解决方案,以及 AppEN 的数据标记平台,以简化整个培训过程,并为特定用例创建高度定制的模型。

在您的团队确定了要使用 ML 解决的业务问题后,您可以从 NVIDIA 收集的计算机视觉和对话人工智能中的预训练人工智能模型中进行选择。计算机视觉模型可以包括人脸检测模型、文本识别、分割等。然后,您可以应用 TAO 工具包来构建、培训、测试和部署您的解决方案。

为了加快数据收集和扩充过程,您现在可以使用 Appen 数据注释平台为您的用例创建正确的培训数据。该强大的平台使您能够访问 Appen 全球超过 100 万名熟练的注释员,他们来自 170 多个国家,讲 235 种语言。 Appen 的数据注释平台 和专业知识还为您提供了其他资源:

高质量数据集(用于需要数据时)

全球采购的人工标签机,用于为未标记的数据添加注释

一个易于使用的平台,您可以在其中启动注释作业并监控关键指标

质量保证检查和数据安全控制

有了干净、高质量的数据,您可以调整 经过训练的 NVIDIA 模型以满足您的需求,并进行修剪和再培训,以达到所需的性能水平。

如何使用 Appen 的平台准备数据

如果您还没有用于训练模型的数据,您可以自己收集这些数据,也可以求助于 Appen ,找到适合您的用例的源数据集。 Appen 数据注释平台( ADAP )可使用多种格式:

音频(. wav ,. mp3 )

图像(. jpeg ,. png )

文本(. txt )

视频(网址)

完成数据收集阶段后,除非您计划与 Appen 合作以满足数据收集需求,否则您可以使用 Appen 的平台快速标记您收集的数据。每行数据批注都需要 Appen 平台许可证和预算。

在此基础上,完成以下步骤,部署一个特别适合您需求的模型。在本文中,假设您正在为对象检测模型注释图像。

准备好你的数据

首先,将图像数据加载到网络可访问的位置:云或 ADAP 可以访问的位置,例如私有 Amazon S3 存储桶。

接下来,用两列结构输入 CSV 文件。第一列包含文件名,第二列包含图像的 URL 。您可以通过以下三种方式之一提供 URL :

对数据使用公开可用的 URL 。

使用预先签名的 URL 。

使用 Appen 的安全数据访问工具,您可以使用该工具将数据库安全地连接到平台; Appen 仅在需要时访问您的数据。

第二列包含设备上的本地文件名。图 1 显示了 CSV 文件的外观。

poYBAGJWfAaAbdYuAAHdcm4AAOo145.png

图 1 。用于 ADAP 中数据上传的 CSV 结构

创建作业并上载数据

如果尚未登录,可以 创建 ADAP 帐户 并登录。在运行新作业之前,您必须拥有平台的活动许可证。要了解更多有关计划和定价的信息, 联系 Appen 。

登录后,在Jobs下选择创造就业机会。

pYYBAGJWfA-ASf2PAACQvL2OgrU139.png

图 2 。 ADAP 工作概述页面

选择最适合工作的模板(情绪分析、搜索相关性等)。对于本例,请选择Image Annotation。

poYBAGJWfBqAApn5AAF4dwi-KDc050.png

图 3 。 ADAP 作业模板页面–图像注释

在Image Annotation下,选择使用边界框对图像中的对象进行注释和分类。将 CSV 文件拖放到Upload选项卡中,上传 CSV 文件。

设计你的工作

为 Appen 的 100 多万名数据标签员提供指导,说明他们应该寻找什么,以及他们应该知道的任何要求。该模板提供了一个简单的工作设计来帮助您开始。

接下来,选择管理图像注释本体,在这里定义应该检测的类。更新说明,以提供有关用例的更多上下文,并描述注释者应如何识别和标记图像中的对象。您可以预览作业,并查看注释员将如何查看它。

最后,创建测试问题来测量和跟踪贴标机的性能。

启动作业

在平台上正式启动注释作业之前,先进行测试运行。在你开始工作后, Appen 的全球数据标签员会根据你的规格标注你的数据。

班长

实时监控注释的准确率。在工作设计、试题或注释员等领域根据需要进行调整。

poYBAGJWfCeAfYZVAADzSgJf5hM807.png


pYYBAGJWfECAanZNAADsYgStpvw629.png

图 8 。 ADAP 注释进度监控页面

后果

选择Download、Full下载标签数据输出的报告。

将输出转换为 KITTI 格式

从这里开始,您需要一个脚本来将标记的数据转换为可供 TAO 工具包使用的格式,例如 KITTI 格式。

使用上一步的输出,可以使用以下部分将标记的数据转换为类似 Pascal Visual Object Class ( VOC )格式的格式。

训练你的模特

用 Appen 注释的数据现在可以用于训练对象检测模型。 TAO 工具包允许您根据数据调整流行的网络架构和主干,从而训练、微调、删减和导出高度优化和精确的人工智能模型,以供部署。对于本例,您可以选择 YOLOV3 对象检测模型,如下例所示:

$ wget --content-disposition https://api.ngc.nvidia.com/v2/resources/nvidia/tlt_cv_samples/versions/v1.0.2/zip -O tlt_cv_samples_v1.0.2.zip $ unzip -u tlt_cv_samples_v1.0.2.zip -d ./tlt_cv_samples_v1.0.2 && rm -rf tlt_cv_samples_v1.0.2.zip && cd ./tlt_cv_samples_v1.0.2

下载笔记本示例后,您可以使用以下命令启动笔记本:

$ jupyter notebook --ip 0.0.0.0 --port 8888 --allow-root

在 localhost 上打开 internet 浏览器并打开以下 URL :

http://0.0.0.0:8888

因为您正在创建一个 YOLOv3 模型,所以打开 yolo _ v3 / yolo _ v3 。 ipynb 笔记本。按照笔记本上的说明训练模型。

根据结果,微调模型,直到达到度量目标。如果需要,您可以在此阶段创建自己的主动学习循环。根据置信度或其他选择指标,使用 CSV 文件方法对数据进行优先级排序,如前面步骤所述。您还可以提前加载数据(包括输入和预测),这样 Appen 的注释员可以在模型经过培训后验证模型,并使用我们的领域专家和 open crowd 查看预测。

Pro tip:使用 Appen 解决方案 Workflows 轻松构建和自动化多步骤数据注释项目。

迭代

随着您不断提高模型性能, Appen 可以在后续的模型培训中进一步帮助您进行数据收集和注释。为了避免模型漂移或适应不断变化的业务需求,请定期对模型进行再培训。

结论

NVIDIATAO 工具包与 Appen 的数据平台相结合,使您能够训练、微调和优化预训练模型,以更快地启动人工智能解决方案。在不牺牲质量的情况下,将开发时间缩短十倍。在NVIDIA 和 Appen 的综合专业知识和工具的帮助下,您将满怀信心地推出人工智能。

关于作者

Titus Capilnean 领导 Appen 的营销传播,推动负责任、包容的人工智能,并与全球公司进行培训数据对话。他拥有 2016 年的机器学习证书、霍尔特国际商学院( Hult International Business School )的行政 MBA 学位,并在 Forbes 上发表了几篇关于人工智能的评论文章。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110329
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267900
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一款让工具管理更自由的RFID智能工具包

    CK-B1A是一款采用RFID技术的双肩工具背包,在设计上没有改变传统工具包的使用方式,但在内部增加了识别能力。在人员准备离开现场时,通过一键锁定,工具包会自动完成一次内部工具状态确认
    的头像 发表于 05-21 16:15 601次阅读
    一款让<b class='flag-5'>工具</b>管理更自由的RFID智能<b class='flag-5'>工具包</b>

    HM博学谷狂野AI模型第四期

    的工程内幕 一个大模型的诞生,离不开海量数据的训练与精调。狂野 AI 第四期将视角深入到模型训练的引擎室,详细拆解预训练与指令微调(SFT)的底层
    发表于 05-01 17:30

    推荐一个企业级AI模型微调项目实战课

    模型微调始终是连接算法创新与实际应用的桥梁。完成系统化的微调实战课程学习后,我深刻体会到这项技术如何突破"AI可用性"的瓶颈,真正实现从理
    的头像 发表于 04-25 11:19 395次阅读

    AI模型微调企业项目实战课

    决胜未来 未来十年,AI 的竞争将不再是“谁家模型参数大”的军备竞赛,而是“谁家模型更懂行业、更安全”的落地较量。 参与企业微调实战课,其意义远超掌握一门技术
    发表于 04-16 18:48

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) 为 AI 智能体提供动力 ,使其能够实现自然对话、复杂推理和高
    的头像 发表于 03-17 09:18 644次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,推动代理式、物理和医疗 <b class='flag-5'>AI</b> 下一阶段发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、
    的头像 发表于 03-16 16:27 808次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3176次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 863次阅读

    NVIDIA 推出 Alpamayo 系列开源 AI 模型工具,加速安全可靠的推理型辅助驾驶汽车开发

    的仿真工具和数据集。 l Alpamayo 1、AlpaSim 和物理 AI 开放数据集可为开发具备感知、推理与类人决策能力的车辆提供支持,使开发者能够进行模型调优、蒸馏和测试,从而提升安全性、鲁棒性
    的头像 发表于 01-06 09:40 596次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列开源 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>与<b class='flag-5'>工具</b>,加速安全可靠的推理型辅助驾驶汽车开发

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA)
    的头像 发表于 12-13 09:50 1679次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助
    的头像 发表于 12-01 09:25 1643次阅读

    NVIDIA开源Audio2Face模型及SDK

    NVIDIA 现已开源 Audio2Face 模型与 SDK,让所有游戏和 3D 应用开发者都可以构建并部署带有先进动画的高精度角色。NVIDIA 开源 Audio2Face 的训练框架,任何人都可以针对特定用例对现有
    的头像 发表于 10-21 11:11 1090次阅读
    <b class='flag-5'>NVIDIA</b>开源Audio2Face<b class='flag-5'>模型</b>及SDK

    MediaTek携手NVIDIA开启个人AI算力新纪元

    Spark 助力开发者能在本地端对大型 AI 模型进行原型设计(Prototype)、微调(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 将于
    的头像 发表于 10-16 11:26 1034次阅读

    NVIDIA从云到边缘加速OpenAI gpt-oss模型部署,实现150万TPS推理

    的发布持续深化了双方的 AI 创新合作。NVIDIANVIDIA Blackwell 架构上优化了这两款全新的开放权重模型实现了推理
    的头像 发表于 08-15 20:34 2618次阅读
    <b class='flag-5'>NVIDIA</b>从云到边缘加速OpenAI gpt-oss<b class='flag-5'>模型</b>部署,<b class='flag-5'>实现</b>150万TPS推理