0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达通过数据集模拟新图像,突破人工智能训练潜力

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2020-12-09 10:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英伟达待发布最新研究成果,通过现有数据集模拟新图像,以期突破人工智能训练的潜力。

英伟达展示了其最新的人工智能模型,该模型使用了一个小数据集生成式对抗网络通常使用的数据集的一小部分,据了解,这些数据集的对象是来自大都会艺术博物馆的艺术品。

从数据集中,英伟达开发的人工智能能够创建新的图像,复制原始艺术家的作品,这些图像可以用来帮助进一步升级人工智能模型。

人工智能通过应用一种突破性的神经网络训练技术取得了这一重要的成就,这种技术类似于流行的NVIDIA StyleGAN2模型。

该技术被称为自适应识别器增强技术(ADA), 英伟达称该技术可以将所需的训练图像数量减少10-20倍,同时仍能获得良好的效果。

英伟达图形研究副总裁David Luebke说:

这些结果意味着人们可以使用生成式对抗网络来解决耗时太长或难以获取大量数据的问题,我迫不及待地想看看艺术家、医学专家和研究人员用它来做什么。

医疗保健是英伟达的研究可以应用的一个特别令人兴奋的领域。例如,它可以帮助创建癌症组织学图像来训练其他AI模型,这项突破将有助于解决当前大多数数据集的问题。

人工智能训练通常需要大型数据集,但并不是一直有效可用的。另一方面,大型数据集很难确保其内容是否合适,不会无意中导致算法偏差。

今年早些时候,麻省理工学院被迫删除了一个名为8000万小图像的大型数据集。该数据集在训练人工智能方面很流行,但被发现包含带有种族主义、厌恶女性和其他不可接受的标签的图像。

麻省理工学院网站上的一份声明称,他们并不知道这些冒犯性的标签,它们是“使用来自WordNet的名词进行自动数据收集的结果”。

该声明还解释了数据集中包含的8000万张图片大小只有32×32像素意味着手工检查几乎是不可能的,也不能保证所有冒犯性的图片都会被删除。

从一个可以手动检查的小数据集开始,像英伟达ADA这样的技术可以用来创建新的图像来模拟原始图像,并可以放大到训练人工智能模型所需的大校

在一篇博文中,英伟达写道:

“通常需要5万到10万张训练图像来训练高质量的生成式对抗网络。但在许多情况下,研究人员根本没有可供他们使用的数万或数十万张样本图像。

由于只有几千张图像可供训练,许多生成式对抗网络在产生真实的结果时会不准确。当鉴别器仅仅记住了训练图像而不能向生成器提供有用的反馈时,就会出现这种问题,称为过拟合。”
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261600
  • ada
    ada
    +关注

    关注

    0

    文章

    16

    浏览量

    21969
  • 英伟达
    +关注

    关注

    23

    文章

    4041

    浏览量

    97688
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    标贝科技参编《人工智能高质量数据建设指南》

    人工智能迈入“数据驱动”的关键发展阶段,高质量数据已成为突破技术瓶颈、推动产业落地的核心引擎。日前,中国信息通信研究院
    的头像 发表于 09-11 17:19 694次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    应用。 为什么选择 Neuton 作为开发人员,在产品中使用边缘人工智能的两个最大障碍是: ML 模型对于您所选微控制器的内存来说太大。 创建自定义 ML 模型本质上是一个手动过程,需要高度的数据科学知识
    发表于 08-31 20:54

    中国中车通过中国信通院可信AI人工智能数据质量四级评估

    2025年8月,中国中车集团有限公司顺利通过中国信通院可信AI人工智能数据质量4级评估,成为制造行业中首个获得最高评级的中央企业。此次评估严格依据中国信通院牵头编制的《面向
    的头像 发表于 08-22 17:02 1205次阅读

    新思科技携手英伟加速定制化AI芯片开发

    随着近年来机器学习技术的不断进步,人工智能(AI)在图像识别、自动驾驶和生成式AI等领域均实现了显著发展。之所以能取得这些进展,这些进步主要归功于能够在日益复杂的数据
    的头像 发表于 08-15 15:44 690次阅读
    新思科技携手<b class='flag-5'>英伟</b><b class='flag-5'>达</b>加速定制化AI芯片开发

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。 四、九门课程全覆盖,满足多元学习需求 对于高校教学或者技术学习来说,课程覆盖的广度
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    是“中国特供版”人工智能芯片;是英伟公司为符合美国出口规定专门为中国市场开发的定制芯片,H20芯片在训练AI模型方面不如英伟
    的头像 发表于 04-16 16:59 1891次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    , 帮助企业更有效地将数据用于构建、扩展和管理生成式人工智能(Gen AI)工作负载和 AI 智能体应用 。此外,IBM 将在混合云基础架构产品 IBM Fusion 中加入 内容感知存储 功能,并扩展
    发表于 03-24 19:20 415次阅读

    英伟与xAI签AI基建协议 加入全球人工智能基础设施投资合作伙伴联盟

    全球人工智能基础设施投资合作伙伴联盟“Global AI Infrastructure Investment”联盟是由贝莱德及其旗下的全球基础设施合伙公司(GIP)、微软与阿联酋投资机构MGX于去年
    的头像 发表于 03-20 13:58 990次阅读

    英伟携手Illumina与Mayo Clinic推动医疗健康创新

    技术的又一重要举措。 据英伟1月13日发布的声明显示,基因测序领域的领军企业Illumina将采纳英伟的化学和生物生成人工智能平台。这一
    的头像 发表于 01-16 10:40 914次阅读

    英伟发布Nemotron-CC大型AI训练数据

    近日,英伟在其官方博客上宣布了一项重大进展,推出了一款名为Nemotron-CC的大型英文AI训练数据库。这一数据库的发布,标志着
    的头像 发表于 01-14 14:14 794次阅读

    荷兰与英伟、AMD商讨共建人工智能设施

    荷兰政府正在积极寻求与全球领先的科技公司英伟和AMD的合作,共同推动荷兰人工智能设施的建设与发展。 据荷兰政府官方网站的消息,荷兰经济事务大臣迪尔克·贝尔亚尔茨于近日对美国硅谷进行了访问,期间
    的头像 发表于 01-10 13:36 1015次阅读

    美银分析师:英伟加大“物理AI”投入为明智之举

    近日,美国银行的分析师对英伟在“物理AI”领域的最新动向发表了评论。分析师指出,英伟决定加大对“物理AI”的投入,是其在人工智能领域发展
    的头像 发表于 01-08 10:51 742次阅读

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数据
    发表于 12-24 00:33