一探究竟视觉学习、图形摄影、人类感知、立体三维以及识别等各个领域-电子发烧友网

计算机视觉三大会议之一的ECCV 2018将于9月8号到14号在德国慕尼黑召开！本次会议共接收论文779篇，同时在会议上将举行11场tutorials和43场各个领域的workshops。同时优秀的论文还将在会议上进行口头报告，在四天的会议日程中将会有59个orals报告覆盖了从视觉学习、图形摄影、人类感知、立体三维以及识别等各个领域。我们先来一探究竟吧！

根据网站上公布的论文题目，可以看到今年的研究热点依然围绕学习、网络等研究方式展开，但同时，检测、可视化和视觉方面的研究也占有重要的位置。接下来我们就提前来看看ECCV将为我们带来哪些精彩的研究前沿吧！

Oral

今年ECCV的主论坛将12个不同主题的分论坛分别安排到了10-13号四天的会议时间中，主要包括了视觉学习、计算摄影学、人类分析和感知、三维重建、优化与识别等领域。

在视觉学习方向，有来自Facebook的Yuxin Wu和Kaiming提出的Group Normalization来解决Batch Normalizaiton存在的问题，将不同的通道分组归一化实现了优异的表现。

还有来自爱丁堡大学和日本理化研究所的研究人员提出的深度匹配自编码器，用于从非配对多模态数据中学习出共有的隐含空间。

同时来自约翰霍普金斯大学、斯坦福大学和谷歌联合研究的渐进式神经架构搜索，用于学习神经网络的结构。通过基于序列模型的优化策略实现了高于强化学习和进化算法近五倍的效率和8倍的总体计算提升。并在CIFAR-10和ImageNet上取得了很高的精度。

值得一提的是，除了来自于霍普金斯的刘晨曦和谷歌的Zoph外，论文作者还包括李飞飞和李佳等。据报道这篇文章与Neural Architecture Search with Reinforcement Learning和Large Scale Evolution of Image Classifiers等技术一起支撑了谷歌AutoML的发展。

在计算摄影学方向，包括了从点光源、光场、可编程器件等研究热点。

来自慕尼黑工大的研究人员利用相机卷帘快门的特性优化了直接稀疏里程计的后端，实现了近实时的准确VO方法。

来自海德堡大学的研究人员提出了一种基于style-aware content的损失函数并联合自编码器训练出了实时高分辨率的风格迁移模型。使得生产的图像包含了更多更自然的美感。

来自圣迭戈分校和Adobe的研究人员提出了一种利用单张手机照片获取不同材料表面变化的双边反射率函数，通过神经网络实现了对于SVBRDF的估计，为光度渲染带来了新的可能。

在人类行为分析与感知包括了人体及各部分的姿态估计、人脸人手追踪、行人识别、行为预测等方面。

来自布里斯托、卡塔尼亚和多伦多大学的研究人员们给出了一个用于研究人类行为习惯的第一人称数据库EPIC-KITCHENS，这一数据库记录了来自多个国家的参与者在厨房中的第一人称视角，包含了1150万帧图像和3.96万个动作分割与45.34万个bbox。这一数据集将用于第一人称的物体检测、行为识别和行为预测中去。

同样来自湖南大学和东京大学的研究人员提出了从第一人称视角来预测凝视注意力的模型。

来自中山大学、商汤和视源的研究人员们提出了一种通过部分xx网络实现了实例人体分析，通过将实例人体解析任务分解成语义分割和基于边缘检测将语义部件归并到确定人物身上的两个子任务来实现。

来自伯克利的研究人员提出了一种联合视频中图像和声音信息的网络用于融合多传感器的表达，利用自监督的方式训练出了一种可以预测视频帧和音频是否对齐的神经网络，并可用于视频声源定位、音-视识别和音轨分离等任务。

萨里大学和adobe的研究人员通过训练对称的卷积自编码器来学习出骨架关节位置的编码和身体的体积表示。能够准确恢复出关节位置的3D估计。

来自洛桑理工的研究人员也提出了一种非监督的3D人体姿态估计模型，通过自编码器可以从单一视角的图像预测另一个视角。由于它编码了3D几何表示，研究人员还将它用于半监督学习映射人体姿态。

在立体视觉三维重建方面，主要研究集中在几何、立体视觉和深度推理等方面。

来自香港科技大学的研究人员提出了利用非结构化的图像作为输入，端到端地推算出参考图像的深图信息。其提出的NVSNet将相机参数编码为可微单应性变换来得到视椎体损失体积，建立起了2D特征抽取和3D损失正则化之间的关系。最终通过3D卷积来对初始点云规则化和回归来得到最终的输出结果。

为了解决点云预测中点的位置与物体全局几何形状不匹配的问题的问题，港中文提出了几何对抗损失优化单视角下点云的全局三维重建。利用多视角几何损失和条件对抗损失来对网络进行训练。

多视角几何损失使得网络学习重建多视角下有效的3D模型，而条件对抗损失则保证重建的3D物体符合普通图片中的语义信息。

除此之外还包括了普林斯顿的共面匹配方法、普林斯顿与谷歌共同完成的主动立体视觉网络以及慕尼黑工大提出的基于深度预测的单目稀疏直接里程计等研究工作。

在匹配与识别方面涵盖了目标检测、定位、纹理和位置精炼等方面的研究。

来自密歇根大学的研究人员提出了一种基于关键点对儿的目标检测方法CornerNet。它将目标检测任务转换为利用单个神经网络对bbox左上和右下角的检测。这种方法消除了对于锚框的依赖。并提出了一种称为角点pooling的层来提高对角点的定位能力。最终在COCO上达到了42.1%的mAP.

来自清华北大、旷视和头条的研究人员提出了一种目标检测中描述框定位置信度的方法IoU-Net，并利用定位置信度来改善目标检测中非极大值抑制，以产生更精确的预测框。同时提出了基于优化的框提炼方法。

来自以色列理工学院的研究人员提出了一种基于上下文损失的图像迁移方法，适用于非对齐的数据。这种模型基于上下文和语义来定义损失。这一模型在卡通图像模拟、语义风格迁移和领域迁移中都表现除了很好的效果。

Tutorials

本届ECCV的tutorials同样是涉及了视觉领域各个方面的前沿内容，从对抗学习到3D重建，从行人识别到目标检测。一定能找到一个你需要的教程来深入学习。其中有Kaiming，rbg和Gkioxari等大神带来的视觉识别及其未来的系列教程。

还有神经网络训练中归一化方法的理论与实践、特征与学习的视觉定位。

还包括行人重识别的表达学习和基于步态&面部分析的识别方法。此外还包括快速三维感知重建和理解的tutorial。

更多内容请参阅，某些教程目前已经开放相关资料下载了：

https://eccv2018.org/program/workshops_tutorials/

Workshop

最后我们来概览一番每次会议都必不可少的workshops。本届ECCV包括了43个workshops，其中包含了11个各领域的挑战赛。值得一提的是，很多来自中国的队伍在很多挑战赛中都取得了不错的成绩。

今年的workshops 主要集中于识别、检测、自动机器（自动驾驶、无人机、机器人等）、人类理解分析、三维重建理解、几何/表示学习和早期视觉等领域。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

编码器

编码器

+关注

关注
41

文章
3356

浏览量
131421
神经网络

神经网络

+关注

关注
42

文章
4562

浏览量
98646
计算机视觉

计算机视觉

+关注

关注
8

文章
1591

浏览量
45591

原文标题：计算机视觉三大会议之——ECCV 2018 观看指南（含大量剧透+传送门）

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

《基于“矿板”低成本学习Zynq系列》之二-什么样的矿板,一探究竟

本文转自公众号,欢迎关注《基于“矿板”低成本学习Zynq系列》之二-什么样的矿板,一探究竟 (qq.com) 一.前言前面一篇淘板记中我们淘到了基于Zynq-7010的矿板,初步确认没问题

发表于 06-26 08:40 •2751次阅读

《基于“矿板”低成本<b class='flag-5'>学习</b>Zynq系列》之二-什么样的矿板,<b class='flag-5'>一探究竟</b>

基于安芯一号SLH89F5162的真三维立体图形显示

。LED点阵将需要显示的立体图像投影到高速旋转平面镜上，通过适当调节电机转速、合理控制LED灯有规律的亮灭和人眼视觉暂留特性实现360度视场三维立体图形显示。该装置可在全空间的

发表于 10-19 15:16

双目立体视觉原理大揭秘（一）

双目视觉的应用来说，主要分为四大部分：一双目视觉导航、定位；二三维重构；三双目立体测量；四

发表于 11-21 16:20

双目立体视觉原理大揭秘（二）

`双目立体视觉原理大揭秘（二）——三维重构双目立体视觉是一门有着广阔应用前景的学科，根据双目立体视觉CCAS提供的思路及组成原理，随着光学、

发表于 11-21 16:22

三维曲线导入到三维图形控件中

用三维线条图做了一个同心圆曲线，怎么才能把它导入到三维图形控件中呢？如图

发表于 10-27 13:49

基于立体视觉的变形测量

，快速、精确的获得被测对象的全场位移应变信息，在各个研究领域得到了广泛应用。 立体视觉是由多幅图像获取物体三维几何信息的方法。双目立体视觉利

发表于 09-21 10:11

双目立体视觉的运用

物体的三维模型，其效果也更生动逼真，又如文物保护上，因其贵重不宜直接接触，使用双目立体视觉测量既能得到三维图像、尺寸大小，又不会对文物产生破坏。此外，技术人员还开发了一款在测量应用

发表于 03-03 09:36

高速相机在三维运动康复中的应用案例

关键词：高速摄像系统,高速摄像,双目摄影测量仪,人体运动三维跟踪将高速摄像系统用于人体运动三维跟踪中可以真实地再现运动员的动作和运动轨迹，输出任意时刻运动员各环节的位移、速度、角速度等

发表于 06-07 11:35

三维设计应用案例

CAD是目前工业制造产品设计的重要软件之一，广泛应用于机械、建筑等领域。而常用的CAD软件，也就是所谓的三维制图软件，较二维的图纸和二

发表于 07-03 07:06

如何设计三维图形加速系统？

随着图形处理的巨额运算量，CPU变得不堪重负。此时，需要使用特定的硬件设备来为嵌入式CPU承担图形处理的任务。具有三维图形硬件加速能力的ARM+FPGA架构嵌入式图形系统就是其中

发表于 10-18 07:47

基于STM32的三维旋转显示平台设计（立体成像）！！！

`现实的世界是一个拥有宽度、高度和深度的三维立体世界。在平面二维显示技术已经成熟的今天，三维立体

发表于 08-27 14:59

三维立体数字沙盘是是什么？

`　　那什么是三维立体数字沙盘呢？三维立体数字沙盘又叫三维数字沙盘、立体数字沙盘，是利用

发表于 08-28 14:40

三维可视化的应用和优势

、三维动画、以及计算机程控技术与实体模型进行融合，实现对设备运行的检测与模拟，使得管理者对于其所管理设备的外观形象、所处位置、运行参数一目了然，可以很大程度上减少管理者的劳动强度，进而提高管理效率和水平

发表于 12-02 11:52

江西南昌三维动画制作的优势

江西南昌三维动画制作的优势三维动画技术是随着计算机软硬件技术的发展而产生的一新兴技术，它可以用在各种领域之中，例如直观地表达复杂的施工过程、构建出奇幻瑰丽的魔幻世界、还原出工程完成后的

发表于 04-19 10:50

一探究竟关于USB转接口部分的电路

看CT117E的原理图中，关于USB转接口部分的电路并未详细标明芯片型号，不知道又有何蹊跷，今就来一探究竟…具体位置藏匿于LCD之下，掀开之后，便可窥得：两个芯片：FT2232D和ATMEL528...

发表于 12-16 06:25

搜索历史

一探究竟视觉学习、图形摄影、人类感知、立体三维以及识别等各个领域

评论

《基于“矿板”低成本学习Zynq系列》之二-什么样的矿板,一探究竟

基于安芯一号SLH89F5162的真三维立体图形显示

双目立体视觉原理大揭秘（一）

双目立体视觉原理大揭秘（二）

三维曲线导入到三维图形控件中

基于立体视觉的变形测量

双目立体视觉的运用

高速相机在三维运动康复中的应用案例

三维设计应用案例

如何设计三维图形加速系统？

基于STM32的三维旋转显示平台设计（立体成像）！！！

三维立体数字沙盘是是什么？

三维可视化的应用和优势

江西南昌三维动画制作的优势

一探究竟关于USB转接口部分的电路