「论文阅读」Conditional-Convolutions-for-InstanceSegmentation
0x01 概要
Mask R-CNN等性能最好的实例分割方法依赖于ROI操作(通常是ROIPool或roalign)来获得最终的实例掩码。相比之下,我们建议从一个新的角度来解决站姿分割问题。我们不使用实例级roi作为固定权重网络的输入,而是使用基于实例的动态感知网络。CondInst有两个优点:1)通过完全卷积网络。
CondInst有两个优点:
1)通过完全卷积网络解决实例分割,消除了ROI裁剪和特征对齐的需要;
2)由于动态生成条件卷积的能力大大提高,掩模头可以非常紧凑(例如,3转换层,每个只有8个通道),导致明显更快的推断。
0x02 Mask-RCNN的缺点
实例分割是计算机视觉中的一项基本而又具有挑战性的任务,它需要一种算法来预测图像中每个感兴趣的实例的每像素掩模。尽管最近提出了一些工作,但实例分割的主流框架仍然是两阶段方法Mask R-CNN,它将实例分割转化为两阶段的检测和分割任务。Mask R-CNN首先使用一个更快的对象检测器R-CNN来预测每个实例的边界框。然后在每个实例中,使用roiallign操作从网络的特征图中裁剪出感兴趣的区域(roi)。为了预测每个 ...
「论文阅读」空间金字塔池化网络SPP-Net
0x01概要介绍
0x02 SPP-Net
0x03 网络结构
1x01 卷积层和特征图
1x02 空间金字塔池层
0x04 训练网络
1x01 单一尺度训练——single-size
1x02 多尺寸训练——multi-size(以两种尺度为例)
0x05 Spp-Net在目标检测上的应用
0x01概要介绍
现有的深卷积神经网络(CNNs)需要一个固定大小(如224×224)的输入图像。这种要求是“人为的”,可能会降低对任意大小/比例的图像或子图像的识别精度。在这项工作中,我们为网络配备了另一种池策略“空间金字塔池”,以消除上述要求。这种新的网络结构称为SPP网,它可以生成一个固定长度的表示,而不考虑图像的大小/比例。金字塔池对对象变形也很健壮。有了这些优势,SPP网应该在总体上改进所有基于CNN的图像分类方法。
SPP-net使用单一的完整图像表示而不是精细的方法实现了最先进的分类结果-调音SPP网络的强大功能在目标检测中也很重要。利用SPP网络,我们只需计算一次来自整个图像的特征映射,然后将任意区域(子图像)的特征集合起来生成固定长度的表示,以训练检测器。该 ...