卷积神经网络

本文最后更新于 2024年11月5日 凌晨

从全连接层道卷积

全连接层

\([H]_{i,j}=[U]_{i,j}+\mathop\sum\limits_{k}\mathop\sum\limits_l [W]_{i,j,k,l}[X]_{k,l}\\=[U]_{i,j}+\mathop\sum\limits_{a}\mathop\sum\limits_{b} [V]_{a,b}[X]_{i+a,j+a}\)

平移不变性

检测对象在输入X中的平移,只会导致隐藏层H中的平移

V和U实际上不依赖于(i,j)的值,即\([V]_{i,j,a,b}=[V]_{a,b}\),且U是一个常数

\([H]_{i,j}=u+\sum\limits_a\sum\limits_b[V]_{a,b}[X]_{i+a,j+b}\)

局部性

\([H]_{i,j}\)不会关注距离(i,j)太远的地方

\([H]_{i,j}=u_d+\sum\limits^{\Delta}_{a=-\Delta}\sum\limits^{\Delta}_{b=-\Delta}[V]_{a,b}[X]_{i+a,j+b}\)

代价

  • 特征必须平移不变
  • 每一层只包含局部信息

通道

对于图像,一般是三维的张量

\([H]_{i,j,d}=\sum\limits^{\Delta}_{a=-\Delta}\sum\limits^{\Delta}_{b=-\Delta}\sum\limits^{\Delta}_{c}[V]_{a,b,c,d}[X]_{i+a,j+b,c}\)

图像卷积

\(n_k\times n_w的输入矩阵,k_h\times k_w的卷积核,输出矩阵为(n_k-k_h+1)\times(n_w-k_w+1)\)


卷积神经网络
https://meteor041.git.io/2024/11/05/卷积神经网络/
作者
meteor041
发布于
2024年11月5日
许可协议