| 雷峰网
您正在使用IE低版浏览器,为了您的雷峰网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
此为临时链接,仅用于文章预览,将在时失效
人工智能 正文
发私信给隔壁王大喵
发送

0

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

本文作者: 隔壁王大喵 编辑:郭奕欣 2017-04-06 15:13
导语:来自微软亚洲研究院的研究员提出了两种全新的模块,用于构建可变形卷积神经网络。

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

论文摘要

由于用于构建卷积神经网络(CNNs)的各个模块具有较为固定的几何结构,从而在根本上限制了 CNNs 算法对几何变换的建模。雷锋网了解到,在《Deformable Convolutional Networks》这篇论文中,来自微软亚洲研究院的研究员们提出了两种全新的模块 Deformable convolution 和 Deformable RoI pooling 用于提升 CNNs 算法对几何变换的建模能力。

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

上图展示了一个 3 x 3 大小的 Deformable convolution 结构

Deformable convolution 和 Deformable RoI pooling 两种模块构建的思想分别是:

  • 在提供了额外偏移的情况下增加模块中的空间采样位置(见 Figure 2);

  • 在没有额外监督的情况下从目标任务学习偏移(见 Figure 3)。

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

上图展示了一个 3 x 3 大小的 Deformable RoI pooling 结构

值得一提的是,这两个模块都可以轻而易举地取代现有卷积神经网络(CNNs)中的相对应模块,并且也可以通过标准的反向传播算法进行端到端(End-to-End)的训练从而产生可变形的卷积网络(Deformable convolutional networks)。

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

  • 上图中(a)展示了传统卷积操作中两层固定的感受野,而(b)展示可变形卷积操作中两层可自适应的感受野。(a)与(b)两图遵循相同的结构,自上而下分别是:1、最顶层的图片中展示两个激活单元,它们分位于不同形状与大小的物体中,而它们的输入来自于一个3x3大小的滤波器;2、中间的图片展示了两个3x3大小的滤波器在前一个特征图(feature map)上的采样位置,并且其中依然有两个激活单元被高亮出来;3、最底层的图片中展示了在前一个特征图上两个层级的3x3大小的滤波器的采样位置,其中有两组采样位置被高亮出来,它们分别对应于上一层图片中的高亮单元。

据雷锋网了解,微软亚洲研究院的研究员们已经通过大量的实验验证了该新方法对于物体检测和语义分割这两个复杂视觉任务具有有效性,并且相关的实验代码也将被公开出来。

via Deformable Convolutional Networks,雷锋网编译

雷峰网版权文章,未经授权禁止转载。详情见转载须知

微软亚洲研究院提出两大创新模块,构建可变形卷积神经网络

分享:
相关文章

知情人士

我也是个旅途的浪人
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
Baidu
map