0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯AI Lab宣布正式开源“Tencent ML-Images”项目

G5zW_AppDowns 来源:未知 作者:李倩 2018-10-23 16:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,及简单易用、性能强大的深度学习模型,促进人工智能行业共同发展。

腾讯AI Lab此次公布的图像数据集ML-Images,包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,基于ML-Images训练得到的深度残差网络ResNet-101,具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。

本次正式开源,其主要内容包括:

ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。

ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。

完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。

各大科技公司都非常重视人工智能基础能力的建设,都建立了仅面向其内部的大型图像数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着非常高的门槛。

当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万图像和1.1万多常见物体类别,或将成为新的行业基准数据集。

此外,基于ML-Images训练得到的ResNet-101模型,具有优异的视觉表示能力和泛化性能。通过迁移学习,该模型在ImageNet验证集上取得了80.73%的top-1分类精度,超过谷歌同类模型(迁移学习模式)的精度,且值得注意的是,ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。

注:微软ResNet-101模型为非迁移学习模式下训练得到,即1.2M预训练图像为原始数据集ImageNet的图像。

腾讯AI Lab此次开源的“Tencent ML-Images”项目,展现了腾讯在人工智能基础能力建设方面的努力,以及希望通过基础能力的开放促进行业共同发展的愿景。

“Tencent ML-Images”项目的深度学习模型,目前已在腾讯多项业务中发挥重要作用,如“天天快报”的图像质量评价与推荐功能,其后台测试的日调用量已达1000万次。

如下图所示,天天快报新闻封面图像的质量得到明显提高。

左图为优化前,右图为优化后

此外,腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。

自2016年腾讯首次在GitHub上发布开源项目(https://github.com/Tencent),目前已累积开源覆盖人工智能、移动开发、小程序等领域的57个项目。为进一步贡献开源社区,腾讯相继加入Hyperledger、LF Networking和开放网络基金会,并成为LF深度学习基金会首要创始成员及Linux基金会白金会员。作为腾讯“开放”战略在技术领域的体现,腾讯开源将继续对内推动技术研发向共享、复用和开源迈进,向外释放腾讯研发实力,为国内外开源社区提供技术支持,注入研发活力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 腾讯
    +关注

    关注

    7

    文章

    1682

    浏览量

    50780
  • 数据集
    +关注

    关注

    4

    文章

    1232

    浏览量

    26070
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123990

原文标题:腾讯AI Lab正式开源业内最大规模多标签图像数据集

文章出处:【微信号:AppDowns,微信公众号:掌上科技频道】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开源鸿蒙项目顺利孵化毕业

    2025年11月21日,2025开放原子开发者大会在北京隆重启幕。作为本次大会的重磅环节和核心焦点之一,在大会开幕式上,开放原子开源基金会(以下简称“基金会”)宣布开源鸿蒙项目达成
    的头像 发表于 11-27 14:36 349次阅读

    开源鸿蒙和开源欧拉成为开放原子开源基金会首批毕业项目

    11月21日,在2025开放原子开发者大会开幕式上,开放原子开源基金会宣布旗下开源鸿蒙(OpenHarmony)与开源欧拉(openEuler)成为首批毕业
    的头像 发表于 11-25 17:22 624次阅读

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GPU 驱动的物理仿真,缩小仿真与现实世
    的头像 发表于 09-23 17:15 2036次阅读
    NVIDIA Isaac <b class='flag-5'>Lab</b>多GPU多节点训练指南

    腾讯地图在AI时代的全新思考与实践

    9月17日,在2025腾讯全球数字生态大会地图专场上,腾讯集团副总裁、腾讯智慧出行总裁钟翔平分享了腾讯地图在AI时代的全新思考与实践。
    的头像 发表于 09-18 10:32 713次阅读

    Arm率先适配腾讯混元开源模型,助力端侧AI创新开发

    本周初,腾讯混元宣布开源四款小尺寸模型(参数分别为 0.5B、1.8B、4B、7B),可无缝运行于消费级显卡上。作为全球应用范围最为广泛的计算平台,Arm 在开源首日就已率先实现适配,
    的头像 发表于 08-08 09:16 1170次阅读
    Arm率先适配<b class='flag-5'>腾讯</b>混元<b class='flag-5'>开源</b>模型,助力端侧<b class='flag-5'>AI</b>创新开发

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    于OpenVINO™ 构建的 AI 软件平台的可扩展性,英特尔助力ISV生态伙伴率先实现应用端Day 0 模型适配,大幅加速了新模型的落地进程,彰显了 “硬件 + 模型 + 生态” 协同的强大爆发力。 混元新模型登场:多维度突破,酷睿 Ultra 平台Day 0适配 腾讯
    的头像 发表于 08-07 14:42 1138次阅读
    硬件与应用同频共振,英特尔Day 0适配<b class='flag-5'>腾讯</b><b class='flag-5'>开源</b>混元大模型

    开放原子开源基金会与腾讯云达成合作

    近日,在北京举行的2025开放原子开源生态大会现场,开放原子开源基金会与腾讯云计算(北京)有限责任公司签署“开源协作平台互联合作协议”。
    的头像 发表于 08-05 11:06 1100次阅读

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    NanoEdge AI Studio 面向STM32开发人员机器学习(ML)技术

    NanoEdge™ AI Studio*(NanoEdgeAIStudio)是一种新型机器学习(ML)技术,可以让终端用户轻松享有真正的创新成果。只需几步,开发人员便可基于最少量的数据为其项目创建
    的头像 发表于 04-22 11:09 1024次阅读
    NanoEdge <b class='flag-5'>AI</b> Studio 面向STM32开发人员机器学习(<b class='flag-5'>ML</b>)技术

    开源AI MPU

    1. 基于RISC-V的开源AI MPU/加速器 ‌ ‌**(1) SiFive Intelligence系列**‌ ‌ 特点 ‌:SiFive提供开源的RISC-V IP核,支持AI
    的头像 发表于 04-02 17:44 2163次阅读

    销售易在腾讯云城市峰会上发布中国首款AI CRM

    3月19日,腾讯旗下CRM销售易亮相腾讯云城市峰会上海站,以“智能加持,增长无忧”为主题承办AI+CRM分论坛,腾讯副总裁、腾讯政企业务总裁
    的头像 发表于 03-24 11:16 579次阅读

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    2025年3月11日, Banana Pi 开源硬件平台很高兴宣布,与全球知名半导体解决方案供应商瑞萨电子(Renesas Electronics)正式达成技术合作关系。此次合作标志着双方将在开源
    发表于 03-12 09:43

    腾讯元宝AI产品更新,正式接入DeepSeek R1模型

    近日,腾讯元宝AI产品在应用商店迎来了重要更新,正式接入了DeepSeek R1模型,并宣布该模型已联网且以满血状态上线。这一更新标志着腾讯元宝在A
    的头像 发表于 02-14 09:29 1355次阅读

    腾讯混元3D AI创作引擎正式发布

    近日,腾讯公司宣布其自主研发的混元3D AI创作引擎已正式上线。这一创新性的创作工具将为用户带来前所未有的3D内容创作体验,标志着腾讯AI
    的头像 发表于 01-23 10:33 1003次阅读

    腾讯混元大模型开源成绩斐然,GitHub Star数近1.4万

    近日,在2024年12月24日举办的开放原子开发者大会暨首届开源技术学术大会上,腾讯云副总裁、腾讯混元大模型负责人刘煜宏发表了重要演讲。他强调,腾讯始终将
    的头像 发表于 12-26 10:30 1076次阅读