0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首个语法生成网络 视觉识别优于当前最先进框架

DPVg_AI_era 来源:fqj 2019-06-05 11:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

神经网络结构是提高深度神经网络性能的基础。研究人员开发出了首个通过语法引导的神经网络生成器AOGNets,它能更有效地在原始数据中提取信息,在图像分类、目标检测和分割方面的表现优于包括ResNets、DenseNets、ResNeXts和DualPathNets在内最先进的神经网络。

北卡罗莱纳州立大学的研究人员开发了一个通过语法指导的网络生成器来打造深度神经网络的新框架。在实验测试中,被称为AOGNets的新网络在视觉识别任务方面优于现有的最先进的框架,包括广泛使用的ResNet和DenseNet系统。

作为这项研究中一篇论文的作者,北卡罗莱纳州立大学电子与计算机工程副教授吴田富博士说:“与我们对比过的任何一个网络相比,AOGNets都具有更好的预测精度。” AOGNets也更容易解释,这意味着用户可以看到系统是如何得出结论的。”

新框架对系统架构使用了一个组合语法方法,该方法可以从以前的网络系统上获取最佳实践,从而更有效地从原始数据中提取有用的信息。

吴教授说:“我们发现,层次和组合语法为我们提供了一种简单、优雅的方法来统一以前系统架构所采用的方法,据我们所知,这是第一个将语法用于网络生成的成果。”

为了测试他们的新框架,研究人员开发了AOGNets,并将其用三个图像分类基准(CIFAR-10、CIFAR-100和ImageNet-1K)进行了测试。

“在公平比较下,AOGNets的表现明显优于其他所有最先进的网络,包括ResNets, DenseNets, ResNeXts和DualPathNets。” 吴田富说:”利用图像网络中的网络剖分度量,AOGNets获得了最高的模型可解释性分。AOGNets在对抗性防御和平台不可知( platform-agnostic)部署(移动vs云)方面进一步显示出巨大的潜力。”

研究人员还使用vanilla Mask R-CNN系统在微软Coco基准测试中测试了AOGNets在目标检测和实例语义分割方面的表现。

“在模型尺寸更小、推理时间相似或更短的情况下,AOGNets比ResNet和ResNeXt获得了更好的结果。” 吴教授表示:“结果表明,在目标检测和分割任务中,AOGNets具有较好的学习效果。”

这些测试是相关的,因为图像分类是视觉识别的核心基础任务之一,而ImageNet是标准的大规模分类基准。同样,目标检测和分割是两个核心的高级视觉任务,而MS-COCO是最广泛使用的基准之一。

“为了评估用于视觉识别中进行深度学习的新网络体系结构,它们是黄金试验台。” 吴田富说道:“AOGNets是在一个有原则的语法框架下开发的,并在ImageNet和MS-COCO下都得到了显著的改进,从而对许多实际应用中的表示学习显示出潜在的广泛和深刻的影响。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108160
  • 视觉识别
    +关注

    关注

    3

    文章

    111

    浏览量

    17389

原文标题:AOGNets:首个语法生成网络,视觉识别优于当前最先进框架

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技NEO-unify如何打造原生视觉语言理解与生成

    当前,多模态模型普遍采用“视觉编码器(VE)用于理解,变分自编码器(VAE)用于生成”的组合式设计。这套范式虽行之有效,却也内在割裂了感知与创造,常面临模块协同与效率权衡的挑战。
    的头像 发表于 03-10 14:37 409次阅读
    商汤科技NEO-unify如何打造原生<b class='flag-5'>视觉</b>语言理解与<b class='flag-5'>生成</b>

    爱立信携手DNB斩获全球首个自智网络L4级认证

    马来西亚的DNB 5G网络已获得全球认可,被视为最先进网络之一,并荣获TM Forum颁发的全球首个服务保障L4自智认证。该认证基于爱立信的基于AI的意图驱动运营解决方案(IBO),
    的头像 发表于 11-18 09:06 7110次阅读

    语法纠错和testbench的自动生成

    检查语法错误,并将结果列在问题中: 比如我在81行少打了一个分号,错误会自动报出。 4.testbench自动生成 需要在拓展中输入Verilog_testbench,找到如下拓展: 安装成功后
    发表于 10-27 07:07

    nuclei studio生成的c语言文件是不支持c的语法吗?

    nuclei studio 生成的c语言文件感觉不支持c的语法,因为刚使用这个软件,还请各位大佬帮忙看看
    发表于 10-20 11:02

    目前最先进的半导体工艺水平介绍

    当前全球半导体工艺水平已进入纳米级突破阶段,各大厂商在制程节点、材料创新、封装技术和能效优化等方面展开激烈竞争。以下是目前最先进的半导体工艺水平的详细介绍: 一、制程工艺突破 英特尔18A(约
    的头像 发表于 10-15 13:58 2482次阅读

    无人机AI视觉行为识别系统

    无人机AI视觉行为识别系统 随着无人机技术的快速发展和计算机视觉领域的突破性进展,无人机AI视觉行为识别系统应运而生。传统监控系统受限于固定
    的头像 发表于 07-04 16:53 1203次阅读

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用 LZ-Picodet 模型训练的人脸检测模型 LZ-Face,以及ArcFace人脸识别模型,实现人脸识别系统。 源代码:ht
    发表于 07-01 12:01

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用LZ-Picodet模型训练的人脸检测模型LZ-Face,以及ArcFace人脸识别模型,实现人脸识别系统。
    的头像 发表于 07-01 10:09 1068次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++人脸<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。 本文将教会你如何使用基于RV1106的 LockAI视觉识别
    发表于 06-30 16:45

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。本文将教会你如何使用基于RV1106的LockAI视觉识别
    的头像 发表于 06-30 15:44 1274次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:手写数字<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI视觉识别进行条码
    发表于 05-27 10:26

    基于LockAI视觉识别模块:C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI视觉识别进行条码
    的头像 发表于 05-27 09:32 980次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++条码<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:C++二维码识别

    二维码识别视觉模块经常使用到的功能之一。我们将演示如何使用基于瑞芯微RV1106的LockAI视觉识别模块进行二维码识别
    的头像 发表于 05-26 09:42 1157次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++二维码<b class='flag-5'>识别</b>

    Gemini API集成Google图像生成模型Imagen 3

    开发者现在可以通过 Gemini API 访问 Google 最先进的图像生成模型 Imagen 3。该模型最初仅对付费用户开放,不久后也将面向免费用户推出。
    的头像 发表于 05-14 16:53 1455次阅读

    基于LockAI视觉识别模块:C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。基础知识讲解1.1OpenCV简介OpenCV(OpenSourceComputerVisionLibra
    的头像 发表于 04-30 18:23 881次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++图像采集例程