0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google LLC推出了新版本的Open Images

倩倩 来源:新经网 2020-03-22 16:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google LLC今天推出了新版本的Open Images(其用于人工智能研究的照片数据集),其中添加了数百万个其他数据点,并提供了一个被称为“本地化叙事”的功能,旨在帮助学术项目。

Open Images于2016年首次发布,其中包含900万张带有描述性标签的照片。此类数据集在AI生态系统中起着重要作用。研究人员使用它们来开发用于目标识别和自动驾驶等任务的新型机器学习模型。

除了提供可免费使用的照片外,Open Images还包含数百万条对AI培训有价值的注释。未经训练的神经网络无法自行识别照片中的对象,因此需要诸如注释之类的元数据来了解屏幕上的内容。元数据越详细,AI可以学习的越好。

今天发布的新版本的“开放图像”增加了2350万张“照片级”标签,这些标签已经过人类验证,可以对图像中发生的事情提供一般描述。该数据库现在总共有5990万个这样的标签。Google还添加了更多情境注释,包括250万个用于描述照片中人物所执行动作的标签,以及另外391,000个用于描述对象之间关系的标签。

但是,主要亮点是Google的本地化叙述。这些是搜索巨头开发的一种新型注释,它希望AI模型能够比旧的注释方法收集更多有关图像的信息。

Google通过让人类注释者将鼠标悬停在照片中的每个对象上并使用自己的文字进行描述来生成本地化的叙事。然后将光标移动的记录与自然语言描述配对,以便每个单词都可以与其所应用的对象相关联。谷歌说,这种方法将使AI模型在Open Images数据集上进行训练时可以更有效地学习。

“为了了解这些本地化叙述所代表的更多数据量,鼠标轨迹的总长度约为6400公里,如果不停地大声朗读,所有叙述都将花费约1.5年的时间来聆听,” Google研究科学家Jordi Pont-Tuset在博客文章中进行了详细介绍。

到目前为止,Google已经为约500,000个Open Images文件创建了本地化的叙述。Pont-Tuset写道,此次更新代表着“在改善图像分类,物体检测,视觉关系检测和实例分割的统一注释方面,迈出了重要的定性和定量步骤。” “我们希望Open Images V6能够进一步刺激人们对真实场景的理解。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1820

    浏览量

    60715
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108415
  • 生态系统
    +关注

    关注

    0

    文章

    711

    浏览量

    21627
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    普华基础软件开源小满V25.04-patch和V25.10-patch版本发布

    坚实底层基座。新版本现已全面开放,用户可前往社区获取新版本全部源代码、工具安装包、示例工程及相关文档,并支持从原有版本平滑升级。
    的头像 发表于 05-11 15:38 208次阅读

    OpenAI正式发布ChatGPT Images 2.0版本

    在人工智能技术迅猛发展的浪潮中,OpenAI始终是引领行业变革的先锋力量。近日,OpenAI正式发布ChatGPT Images 2.0版本,这一消息如同一颗重磅炸弹,在科技圈引发了强烈反响,在
    的头像 发表于 04-22 11:32 4621次阅读

    Altera正式推出Quartus Prime Pro 26.1版本

    以更快、更广、更简为核心,Altera 正式推出 Quartus Prime Pro 26.1 版本新版本实现了更高效的编译与时序收敛、更顺畅的开发者设计流程,并简化了用户操作与 AI 集成
    的头像 发表于 04-20 14:29 675次阅读

    芯科科技发布Simplicity Studio 6软件开发套件最新版本SiSDK 2025.12.0

    Silicon Labs(芯科科技)近期发布了Simplicity Studio 6软件开发套件的最新版本-SiSDK 2025.12.0,这代表着嵌入式与无线软件开发的一次重大进步。该版本重点关注
    的头像 发表于 01-29 10:29 1558次阅读

    蔚来世界模型NWM全新版本使用指南

    今天,「蔚来世界模型 NWM」全新版本正式开启推送。首批超过46万辆「Banyan 榕」车型将陆续收到推送。「Cedar 雪松」和「Cedar S 雪松」车型,也将于近期推送。此次,蔚来率先将「世界
    的头像 发表于 01-29 09:13 899次阅读

    蔚来世界模型NWM全新版本正式推送

    2026年1月28日,「蔚来世界模型 NWM」全新版本正式开启推送,首批将为超过46万辆「Banyan 榕」车型推送。「Cedar 雪松」车型及「Cedar S 雪松」车型,也将于近期开启推送。
    的头像 发表于 01-28 15:38 675次阅读

    客户在升级新版本的开发工具后,打开工程,有发现工程中系统字体找不到?

    客户在升级新版本的开发工具后,打开工程,有发现工程中系统字体找不到?
    发表于 01-20 15:16

    如何使用新版本J-Flash编程CW32 MCU

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users<用户名>
    发表于 11-12 07:24

    【直播预告】RT-Trace 全新版本发布|ITM输出 MemoryWatch 功能首发实测! | 问学直播

    RT-Trace迎来又一次重要更新!本次新版本带来了两项备受期待的功能——ITM输出与MemoryWatch内存监控,让调试可视化更高效、问题定位更精准。为帮助开发者快速上手新特性
    的头像 发表于 10-14 11:57 743次阅读
    【直播预告】RT-Trace 全<b class='flag-5'>新版本</b>发布|ITM输出  MemoryWatch 功能首发实测! | 问学直播

    新版本qemu编译不过怎么解决?

    新版源码 qemu-vexpress-a9编译不过了。提示RT_PAGE_AFFINITY_BLOCK_SIZE 未定义
    发表于 09-24 07:20

    如何使用新版本J-Flash编程CW32 MCU?

    1、从Segger公司官网下载安装最新版本JLink驱动,比如V7.96a,安装目录下没有JLinkDevices.xml文件。 2、在C:Users AppDataRoamingSEGGER目录
    的头像 发表于 07-01 15:05 1222次阅读
    如何使用<b class='flag-5'>新版本</b>J-Flash编程CW32 MCU?

    戴尔数据保护软件迎来全新版本

    无缝运行的异常检测,一站式监控多达150个系统,额外的MFA多重身份验证Dell PowerProtect Data Manager19.19全新版本现已到来!
    的头像 发表于 06-27 13:55 1131次阅读

    软件更新 | 从数据到模型,全面升级!TSMaster新版助力汽车研发新突破

    为满足汽车电子开发领域日益增长的测试与仿真需求,TSMaster最新版本聚焦实车数据采集、MBD智能建模与新API扩展三大核心功能。无论您是进行车载网络测试、ECU开发还是自动化验证,新版本都能
    的头像 发表于 06-21 20:04 1617次阅读
    软件更新 | 从数据到模型,全面升级!TSMaster<b class='flag-5'>新版</b>助力汽车研发新突破

    谷歌推出Gemini 2.5 Pro预览版(I/O版本)

    我们目睹了开发者使用 Gemini 2.5 Pro 取得了令人赞叹的成就。因此,我们决定提前数周发布更新版本,以便开发者尽早体验新版模型。
    的头像 发表于 06-10 10:43 1379次阅读

    CANoe产品体系19版本新功能(上)

    新版本持续助力当前车辆E/E架构中ECU开发验证,同时赋能后续智能网联电动车型预研验证。
    的头像 发表于 05-29 14:03 3201次阅读
    CANoe产品体系19<b class='flag-5'>版本</b>新功能(上)