0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是预训练 AI 模型?

NVIDIA英伟达 来源:未知 2023-04-04 01:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

预训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用,也可以根据不同行业的应用需求进行自定义。

如果要教一个刚学会走路的孩子什么是独角兽,那么我们首先应该向孩子展示这种生物的图像并描述其独有特征。

那么,如果要教一台人工智能(AI)机器什么是独角兽,该从什么地方做起呢?

预训练 AI 模型提供了解决方案。

预训练 AI 模型是一种为了完成某项特定任务而在大型数据集上进行训练的深度学习模型,它是一种类脑神经算法的表现形式,可以根据数据找到模式或进行预测。预训练 AI 模型既可以直接使用,也可以根据某个应用的具体需求进行进一步微调。

为什么使用预训练 AI 模型?

开发者可以使用预训练模型并根据需求对其进行自定义,无需从头开始构建 AI 模型。

无论是识别一匹虚构的马,检测自动驾驶汽车的安全隐患,还是根据医学影像诊断癌症,要构建一个 AI 应用,开发者首先需要一个能够完成特定任务的 AI 模型。而这个模型需要大量具有代表性的数据进行学习。

模型的学习过程需要经历好几层传入数据,并在每一层强调与目标相关的特征。

例如,在创建一个能够识别独角兽的模型时,首先会为其提供独角兽、马、猫、老虎和其他动物的图像作为传入数据。

然后再构建具有代表性的数据特征层。从线条、颜色等简单特征开始,深入到复杂的结构特征。依据计算出的概率,这些特征将被赋予不同程度的相关性。

举个例子,当一个生物看起来越像马,它是独角兽而不是猫或老虎的概率就越大。这些概率值被存储在 AI 模型的每个神经网络层。随着层数的增加,模型对表征的理解程度也在提高。

若要从头开始创建一个这样的模型,开发者通常需要调用包含数十亿行数据的巨大数据集,并且这些数据可能十分昂贵且难以获得。但如果因此在数据上让步,就会导致模型性能不佳。

预先计算的概率表征(也称权重)能够节省开发者或企业的时间、金钱和精力。已建立完成的预训练模型可通过这些权重进行训练。

高质量的预训练模型搭配大量准确且具有代表性的权重可以提高 AI 部署的成功率。

权重可以被修改,而且可以通过添加更多数据为模型进行进一步的自定义或微调。

在预训练模型基础上进行构建的开发者可以更快创建出 AI 应用,因为他们无需处理堆积如山的传入数据或去计算密集的数据层的概率。

换言之,使用预训练 AI 模型就像是用一件成衣根据自己的需求进行剪裁,而不用从布料和针线做起。

预训练 AI 模型通常被用于迁移学习,可以基于多种模型架构类型而构建。其中一种流行的架构类型是 Transformer 模型,一种通过追踪连续数据中的关系来学习上下文和意义的神经网络。

AI 公司 Clarifai 是NVIDIA 初创加速计划的高级合作伙伴。Clarifai 的平台高级副总裁 Alfredo Ramos 表示,预训练模型可以将 AI 应用的开发时间缩短一年并节约数十万美元的成本。

预训练模型如何推动 AI 的发展?

预训练模型简化并加快了 AI 的开发,许多开发者和公司通过它们来加速各种 AI 用例。

预训练模型主要推动了以下几个领域的 AI 发展:

  • 自然语言处理:预训练模型被用于翻译、聊天机器人等自然语言处理应用。大型语言模型一般基于 Transformer 模型架构构建,是预训练模型的延伸。世界上最大的 AI 模型之一NVIDIA NeMo Megatron就是一个预训练大型语言模型。

  • 语音 AI:预训练模型能帮助语音 AI 应用在不同的语言下也能直接使用。用例包括呼叫中心自动化、AI 助手和语音识别技术。

  • 计算机视觉:如上文所述的独角兽模型,预训练模型可以帮助 AI 快速识别生物或者物体、地点和人。预训练模型通过这种方式加速计算机视觉,为体育运动、智慧城市等领域的应用提供近似于人类的视觉能力。

  • 医疗:在医疗应用方面,MegaMolBART(NVIDIA BioNeMo服务和框架的一部分)等预训练 AI 模型能够理解化学语言并学习现实世界分子中原子之间的关系,为科学界提供了一种加快药物研发的强大工具。

  • 网络安全:预训练模型为实施 AI 网络安全解决方案打下了基础,并帮助人类安全分析师更快的发现威胁。包括人类和机器的数字指纹及异常、敏感信息和网络钓鱼检测等多种情况。

  • 艺术和创作流程:为推动最新的 AI 艺术浪潮,预训练模型可以在GauGANNVIDIA Canvas等工具的帮助下加快创作流程。

预训练 AI 模型的自定义和微调为其带来了无限的应用可能性,因此也可以用于更多其他行业。

何处获取预训练 AI 模型

谷歌、Meta、微软、NVIDIA 等公司正在发明用于构建 AI 模型的尖端模型架构和框架。

这些模型有时会在模型中心或作为开放源码发布,使开发者能够对预训练 AI 模型进行微调、提高其准确性并扩展模型库。

NVIDIA NGC汇集了通过 GPU 优化的 AI 软件、模型和 Jupyter Notebook 示例,包括各种预训练模型以及为 NVIDIA AI 平台优化的 AI 基准和训练方式。

NVIDIA AI Enterprise是一套全面且安全的云原生 AI 与数据分析软件套件,包含未加密的预训练模型。这让希望将 NVIDIA 预训练模型整合到其自定义 AI 应用中的开发者和企业能够查看模型权重和偏差、提高可解释性并轻松进行调试。

在 GitHub、Hugging Face 等平台也有数千个可供使用的开源模型。

十分重要的是,在训练预训练模型时,模型数据必须透明、可解释、符合隐私要求,并且是获得同意许可且无偏见的道德数据。

NVIDIA 预训练 AI 模型

为帮助更多开发者将 AI 原型投入到生产中,NVIDIA 提供了几种开箱即用的预训练模型:

  • NVIDIA SegFormer是一个在 GitHub 上提供的 Transformer 模型,可实现简单、高效、强大的语义分割。

  • NVIDIA 的专用计算机视觉模型经数百万张图像训练而成,可用于智慧城市、停车管理等应用。

  • NVIDIA NeMo Megatron是一个大型可定制语言模型,包含在 NVIDIA NeMo 中。NeMo 是一个用于构建灵活、高性能对话式 AI、语音 AI 和生物学应用的开源框架。

  • NVIDIA StyleGAN是一个基于风格的生成器架构,用于生成式对抗网络(或称 GAN)。它可以使用迁移学习来无限生成各种不同风格的绘画。

除此之外,NVIDIA 还能够提供:

  • NVIDIA Riva:一款用于构建和部署语音 AI 应用的 GPU 加速软件开发工具包,包含了十种语言的预训练模型。

  • MONAI:由 NVIDIA 和伦敦国王学院联合开发的开源医疗研究 AI 框架,包含了用于医学影像的预训练模型

点击阅读原文,进一步了解NVIDIA 预训练 AI 模型

扫描海报二维码即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!


原文标题:什么是预训练 AI 模型?

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99642

原文标题:什么是预训练 AI 模型?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型微调企业项目实战课

    业、守规矩、可完全掌控的专属 AI 底座,已经成为头部企业的隐性共识。 二、 核心破局:微调——用极低成本撬动专业能力 很多企业对“自主训练模型”存在误解,认为这需要像顶级科技巨头那样,耗费千万算力
    发表于 04-16 18:48

    AI模型训练与部署实战 | 线下免费培训

    你是否想系统了解AI落地全链路,但缺少一个完整的实战项目练手?模型部署环节繁多,缺乏一套清晰的实战路径?4月18日、4月25日、5月16日RT-Thread将分别在苏州、成都、南京举办“AI
    的头像 发表于 04-07 13:08 677次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>训练</b>与部署实战 | 线下免费培训

    如何训练自己的AI模型——RT-Thread×富瀚微FH8626V300L模型训练部署教程 | 技术集结

    面对消费电子中纷繁的智能检测需求,如何让算法持续进化?富瀚微最新发布的FH86X6V300芯片AI训练教程,以FH8626V300L为硬件核心,手把手带您走通从模型训练到端侧部署的完整
    的头像 发表于 02-09 11:51 629次阅读
    如何<b class='flag-5'>训练</b>自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>——RT-Thread×富瀚微FH8626V300L<b class='flag-5'>模型</b><b class='flag-5'>训练</b>部署教程 | 技术集结

    RA8P1部署ai模型指南:从训练模型到部署 | 本周六

    在嵌入式边缘AI中,如何把“训练好的模型”稳定地“跑在板子上”,决定了项目能否落地。我们带你基于RA8P1平台,跑通从数据准备、模型训练、量
    的头像 发表于 11-20 18:06 2425次阅读
    RA8P1部署<b class='flag-5'>ai</b><b class='flag-5'>模型</b>指南:从<b class='flag-5'>训练</b><b class='flag-5'>模型</b>到部署 | 本周六

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识
    发表于 10-22 07:03

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、分布式群体智能 1)物联网AGI系统 优势: 组成部分: 2)分布式AI训练 7、发展重点:基于强化学习的后训练与推理 8、超越大模型:神经符号计算 三、AGI芯片的实现 1、技术需
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    持续发展体现在: 1、收益递减 大模型的基础的需要极大的算力,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现在: ①模型大小 ②训练数据量 ③
    发表于 09-14 14:04

    模板驱动 无需训练数据 SmartDP解决小样本AI算法模型开发难题

    算法作为软实力,其水平直接影响着目标检测识别的能力。两年前,慧视光电推出了零基础的基于yolo系列算法架构的AI算法开发平台SpeedDP,此平台能够通过数据驱动模型训练,实现算法从0到1的开发
    的头像 发表于 09-09 17:57 1564次阅读
    模板驱动  无需<b class='flag-5'>训练</b>数据  SmartDP解决小样本<b class='flag-5'>AI</b>算法<b class='flag-5'>模型</b>开发难题

    基于大规模人类操作数据训练的VLA模型H-RDT

    近年来,机器人操作领域的VLA模型普遍基于跨本体机器人数据集训练,这类方法存在两大局限:不同机器人本体和动作空间的差异导致统一训练困难;现有大规模机器人演示数据稀缺且质量参差不齐。得
    的头像 发表于 08-21 09:56 1234次阅读
    基于大规模人类操作数据<b class='flag-5'>预</b><b class='flag-5'>训练</b>的VLA<b class='flag-5'>模型</b>H-RDT

    在K230中,如何使用AI Demo中的object_detect_yolov8n,YOLOV8多目标检测模型

    在K230的AI开发教程文档中,可以看到有源码的AI Demo,其中包括yolov8n模型,在仓库里可以看到源码 我想请问各位大佬,如何使用这个程序?如何更改程序,替换为我自己的数据集和
    发表于 08-07 06:48

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业级AI模型加速开发 Cognizant是数据与AI模型
    的头像 发表于 07-31 17:25 820次阅读

    ai_cube训练模型最后部署失败是什么原因?

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打
    的头像 发表于 07-28 11:28 4852次阅读
    摩尔线程“<b class='flag-5'>AI</b>工厂”:五大核心技术支撑,打造大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>超级工厂

    嵌入式AI技术漫谈:怎么为训练AI模型采集样本数据

    多少数据,才能形成合适的样本集,进而开始训练模型呢? 此时,回答“按需提供”或者“先试试看”似乎会变成一句车轱辘话,看似回答了问题,但客户还是无从下手。 AI数据样本的三个原则 这里,我以教孩子认识苹果和鸭梨为例进行说明。假设
    的头像 发表于 06-11 16:30 1560次阅读