论文及代码详解——可变形卷积（DCNv1）

原创

已于 2023-08-17 20:42:06 修改 · 1.1w 阅读

169

标签

#深度学习 #神经网络 #机器学习 #可变形卷积

收录于

于 2023-08-17 19:54:53 首次发布

文章目录

论文详解
代码详解

论文：《Deformable Convolutional Networks》

论文详解

Deformable Convolution

普通卷积的数学表达
普通的二维卷积包括两个步骤:
1)在输入特征图x上使用regular gird R进行采样;
2)以w加权的采样值的总和。网格R定义接收域的大小和扩张。例如，

$\mathcal{R}=\{(-1,-1),(-1,0), \ldots,(0,1),(1,1)\}$
定义了一个dilation=1, 3x3的卷积。
对于输出特征图 $y$ 上的每个位置 $p_0$ ，
Eq(1)

$\mathbf{y}\left(\mathbf{p}_0\right)=\sum_{\mathbf{p}_n \in \mathcal{R}} \mathbf{w}\left(\mathbf{p}_n\right) \cdot \mathbf{x}\left(\mathbf{p}_0+\mathbf{p}_n\right),$

其中 $p_n$ 穷举了 $\mathcal{R}$ 中的所有位置。

可变形卷积的数学表达
在可变形卷积中，regular grid R用偏移量 $\left\{\Delta \mathbf{p}_n \mid n=1, \ldots, N\right\}$ 进行增广, 其中 $N=|\mathcal{R}|$

上述的式子就变成了：

Eq(2)

$\mathbf{y}\left(\mathbf{p}_0\right)=\sum_{\mathbf{p}_n \in \mathcal{R}} \mathbf{w}\left(\mathbf{p}_n\right) \cdot \mathbf{x}\left(\mathbf{p}_0+\mathbf{p}_n+\Delta \mathbf{p}_n\right)$