ICML 2022 | Structural Entropy Guided Graph Hierarchical Pooling
文章信息
「来源」:Proceedings of the 39th International Conference on Machine Learning(ICML) 2022
「标题」:Structural Entropy Guided Graph Hierarchical Pooling
「作者」:Junran Wu, Xueyuan Chen, Ke Xu, Shangzhe Li
「链接」:https://proceedings.mlr.press/v162/wu22b.html
内容简介
随着深度学习在自然语言处理(NLP)和图像方面取得巨大成功,大量研究工作开始致力于将神经网络应用于非欧几里得数据的任务中。近年来,图神经网络(GNN)在图的深度学习中无处不在,并在节点分类等众多领域取得了不小的成就,相应的池化方法也在有关图的各种任务中得到验证。
然而,目前仍存在许多阻碍GNN发展的问题,「例如基于节点丢弃的池化方法会导致信息的丢失、忽略池化层之间的关系会引起任务出现次优结果等。」
受结构熵的启发,本文提出了一种名为SEP的分层池化方法来解决上述两个问题。具体地说,「在不分配特定于层的压缩配额的情况下,设计了一种全局优化算法来即刻生成用于池化的集群分配矩阵」。接着,本文展示了已有方法在环形和网格合成图重建中的局部结构损伤。除此之外,本研究进一步设计了两个分类模型,SEP-G和SEP-N,分别用于图分类和节点分类。结果表明,SEP在图分类基准上优于最先进的图池化方法,并在节点分类上获得了卓越的性能。
本文的主要贡献如下:
在之前的分层池化工作中发现了两个阻碍 GNN 发展的关键问题,包括由于固定压缩配额和逐步池化设计导致的局部结构损坏和次优问题。 通过引入结构信息理论,本文提出了一种称为SEP的新的分层池方法,以解决公开的问题。 在图重建、图分类和节点分类任务上广泛验证SEP,并且与 SOTA 分层池化方法相比,观察SEP有哪些优异表现。
相关工作
分层池化
为了追求更好的泛化和性能,采用池化操作来放大感受野并减小输入大小。一种设计是从原始图中选择最重要的个节点来组织一个新节点,这种节点丢弃设计虽然有效,但会导致信息丢失和孤立的子图,从而降低GNN的性能。因此,出现了另一种基于节点聚类的设计并避免该问题,其中原始图的节点被合并成一堆集群。虽然这种设计防止了信息丢失,但由于固定的节点压缩配额,图局部结构仍会受到破坏。
结构熵
信息熵源于通信系统中对信息测量的需求。相应地,为了衡量图中的信息,结构熵被提出并被用于评估图的层次结构的复杂性。此外,二维和三维结构熵,可以分别衡量两级和三级层次结构的复杂性,已应用于医学、生物信息学和网络的安全性。鉴于图信息的这种全局测量,结构熵可用于解码图的基本结构,在此启发下,本文提出了SEP以解决阻碍GNN发展的两个问题。
方法介绍
在结构熵的启发下,本文提出了研究的关键思想和聚类分配构建的算法。接着,设计了一个具有多个卷积层和池化层的GNN模型来学习图分类的全局表示。此外,本文开发了另一个模型,该模型由额外的卷积层和反池化层组成,以获得节点分类的局部表示。SEP与图神经网络相结合的架构如图1所示。
通过最小化结构熵进行聚类分配
本文提出了一种称为SEP的新的分层池化方法,通过最小化结构熵,可以将图的层次结构解码为相应的编码树,其中可以最小化来自噪声或随机变化的干扰。本研究相信存在一个有效的结构熵最小化算法可以揭示分层池层之间的连接并消除图中的噪声结构。设一个二元组为图,编码树上的结构熵的形式方程可写为:
使用图的维结构熵来解码具有固定高度的最优编码树:
用于图分类的图神经网络
首先介绍基于SEP的图分类架构,并将其命名为SEP-G,如图2所示,它由三个块组成,每个块都有一个GCN层和SEP层。使用SET-G的图表示可以正式写为:
用于节点分类的图神经网络
在图3中展示了节点分类的架构图,并将其称之为SEP-N。和SEP-G一样,每个块都由一个GCN层和一个SEP层组成。使用SET-N的图表示可以正式写为:
实验分析
本文主要设计进行了三个实验,分别是图重建、图分类和节点分类实验。在图重建实验中,SEP几乎完全重建了环并保留了网格中心的基本结构,这表明SEP的池化方法获得了原始图的关键结构信息。图分类实验的结果如表1所示:节点分类实验的结果如表3和表4所示:
总结
在本文中,研究开发了一种优化算法来解决现有分层池化方法的几个限制。特别是在「结构熵」的启发下,本文设计的池化方法SEP不仅可以捕获池化层之间的连通性,还可以解决由于节点压缩而导致局部结构遭受破坏的问题。在提出的SEP的基础上,引入两种学习模型即SEP-G和SEP-N,分别用于「图分类」和「节点分类」。实验结果表明,SEP-G在图分类方面取得了显着的改进,同时,与 其他GNN相比,SEP-N在节点分类任务上表现出了优越的性能。结构熵和节点特征的结合展示了未来研究工作的一个有趣方向