基于Fourier的图上卷积算子的构建

时间：2023-06-21 理论教育版权反馈

【摘要】：构建基于谱域的图卷积神经网络，首先考虑如何从谱域定义的图上卷积。e-iωt满足当然e-iωt就是Δ的本征函数，ω与特征值密切相关。由传统傅里叶变换可知，我们需要找到一个和e-iωt等价的一组基向量实现图上的傅里叶变换，为了寻找这组基向量，我们首先考虑图上的拉普拉斯算子。图4-22图的拓扑图其中，D为图的度矩阵，A为其邻接矩阵，L为其拉普拉斯矩阵。

基于Fourier的图上卷积算子的构建

构建基于谱域的图卷积神经网络，首先考虑如何从谱域定义的图上卷积。由卷积定理（函数卷积的傅里叶变换是函数傅里叶变换的乘积，即对于函数f与h，两者的卷积是其函数傅里叶变换的乘积）有

其中，f为待卷积函数，h为卷积核（根据需要设计），f*h为卷积结果。

可知，只要解决图上傅里叶变换的方法，就可以定义图上的卷积了，下面从传统的傅里叶变换开始逐步理解图上的傅里叶变换。

1.图上的傅里叶变换

（1）传统的傅里叶变换

传统的傅里叶变换定义为

其中，对于信号f（t）与基函数e-iωt的积分，为什么要用e-iωt作为基函数呢？从数学上看e-iωt是拉普拉斯算子的特征函数（满足特征方程），这样ω就和特征值有关了。

广义的特征方程定义为

其中A是一种变换，V是特征向量或者特征函数（无穷维的向量），λ是特征值。

e-iωt满足

当然e-iωt就是Δ的本征函数，ω与特征值密切相关。

由传统傅里叶变换可知，我们需要找到一个和e-iωt等价的一组基向量实现图上的傅里叶变换，为了寻找这组基向量，我们首先考虑图上的拉普拉斯算子。

（2）图上的拉普拉斯算子

①拉普拉斯算子的定义

拉普拉斯算子的定义如下：

拉普拉斯算子的含义很明确，它是所有非混合二阶偏导数的和。

②拉普拉斯算子在数字图像处理上的近似

图像是一种离散数据，那么拉普拉斯算子必然要进行离散化，先从导数说起：

pagenumber_ebook=117,pagenumber_book=107

可以得出以下两个结论：

a.二阶导数近似等于其二阶差分；

b.二阶导数等于其在所有自由度上微扰之后获得的增益。

一维函数其自由度可理解为+1和-1两个方向。对于二维图像来说，则有4个自由度可以变化，即如果对f（x，y）处的像素进行扰动，其可以变为4种状态f（x+1，y），f（x-1，y），f（x，y+1），f（x，y-1）。当然，如果将对角线方向也认为是一个自由度的话，会再增加几种状态：f（x+1，y+1），f（x+1，y-1），f（x-1，y+1），f（x-1，y-1）。下面讨论第一种。

pagenumber_ebook=117,pagenumber_book=107

上式可以理解为，图像上某一点拉普拉斯算子的值即其进行扰动，时期变化到相邻像素后得到的增益。可以总结为拉普拉斯算子就是在所有自由度上进行微扰后获得的增益。

③拉普拉斯算子在图上的近似

pagenumber_ebook=117,pagenumber_book=107

其中，fi即函数f在节点i的值。类比图像中的f（x，y），即f在（x，y）处的值，对于任意节点i，对节点i进行微扰，它可能变为任意一个与它相邻的节点j∈Ni，其中Ni表示节点i的一阶邻域节点的集合。

对于图来说，从节点i变化到节点j的增益fj-fi是多少？最容易想到的就是和它们的边权相关，那就只有Aij了。

对于节点i来说，其变化的增益就是

pagenumber_ebook=118,pagenumber_book=108

如图4-22所示。

pagenumber_ebook=118,pagenumber_book=108

图4-22　图的拓扑图

pagenumber_ebook=118,pagenumber_book=108

其中，D为图的度矩阵，A为其邻接矩阵，L为其拉普拉斯矩阵。

•拉普拉斯矩阵⇔离散拉普拉斯算子。

•拉普拉斯矩阵的【特征向量U】⇔拉普拉斯算子的【本征函数e-iωt】。

④拉普拉斯矩阵（半正定、对称）

拉普拉斯矩阵的性质：

•有N个线性无关的特征向量。

•特征值非负。

•特征向量相互正交，即Q为正交矩阵。

下面给出拉普拉斯矩阵半正定性的证明。

证明：对于∀f∈RN，f≠0，有

pagenumber_ebook=119,pagenumber_book=109

所以，拉普拉斯矩阵是半正定的。

（3）特征向量矩阵（一组基）

把拉普拉斯算子的特征函数变为图对应的拉普拉斯矩阵的特征向量。

①图上拉普拉斯算子的定义形式

先说图拉普拉斯算子的定义，有很多种，主要是以下2种。

a.L=D-A。

b.Lnor=D-1/2LD-1/2或者Lnor=D-1L。

其实就是一种，第二种是第一种的标准化（normalized）形式。

②求图拉普拉斯矩阵的特征向量

针对图拉普拉斯矩阵：

根据矩阵L的特征分解定义：将矩阵L分解为由特征值λ和特征向量u表示的矩阵之积。

a.求特征值和特征向量。λ为特征值，u为特征向量，则满足下式：

b.求特征分解。令L是一个N×N的方阵，且有N个线性无关的特征向量，这样L可以被分解为

pagenumber_ebook=119,pagenumber_book=109

其中，U为图的拉普拉斯矩阵L的特征向量矩阵，且其第i列为L的特征向量ui，ui为列向量，U={u1，u2，…，un}。

设λ1≤λ2≤…≤λn为L的特征值，Λ=diag（λ1，λ2，…，λn）。

（4）图上的傅里叶变换

根据传统傅里叶的定义，得到图上的傅里叶变换：

①i为第i个顶点；

②λl为第l个特征值，ul为第l个特征向量；③f为待变换信号（向量），f^为其对应的傅里叶变换，f和f^与顶点i一一对应，即

pagenumber_ebook=120,pagenumber_book=110

即f在图上的傅里叶变换的矩阵形式为

逆变换形式为

为什么UT f就是对向量f的傅里叶变换，U f^就是对向量f的傅里叶逆变换呢？我们先来理解一下特征值和特征向量，从线性说起，一个线性变换可由一个矩阵乘法表示，一个空间坐标系可看作一个矩阵，那么这个坐标系就可由这个矩阵的所有特征向量表示，用图来表示的话，可以想象就是一个空间张开的各个坐标角度，这一组向量可以完全表示一个矩阵表示的空间的“特征”，而它们的特征值就表示了各个特征上的强度（可以想象成从各个角度上伸出的长短，越长的轴就越可以代表这个空间，它的“特征”就越强，或者说越显性，而短轴自然就成了隐性特征）。

pagenumber_ebook=120,pagenumber_book=110

pagenumber_ebook=121,pagenumber_book=111

其中，⊙表示哈达玛积（Hadamard product）。

pagenumber_ebook=121,pagenumber_book=111

3.图上的卷积核

（1）第一代GCN

卷积核：

pagenumber_ebook=121,pagenumber_book=111

上式就是标准的第一代GCN中的layer了，其中σ（·）是激活函数，Θ=（θ1，θ2，…，θn）就跟三层神经网络中的weight一样是任意的自由参数，通过初始化赋值，然后利用误差反向传播进行调整，x就是图上对应于每个点的特征向量。

第一代GCN的缺点：有n个参数θn，计算量大。

pagenumber_ebook=122,pagenumber_book=112

第二代GCN是如何引入空间局部性的呢？这里首先要讲到拉普拉斯矩阵的性质，对于一个拉普拉斯矩阵，如果节点dG（m，n）＞s，则Lsm，n=0，其中，dG（m，n）为节点m和节点n的最短距离。因此第二代的卷积公式其实只使用了一个K-hot的邻域，即感受野为K。

有人提出了一种卷积核的设计方法，即gθ（Λ）可以用切比雪夫（Chebyshev）多项式Tk（x）到kth的截断展开来近似。

切比雪夫多项式：