云栈社区»论坛 › 回收站「 Recycle Bin 」 › 图神经网络G-Merging：参数融合新范式，5%参数实现多任务统一 ...

发回帖发新帖

3242 积分	0 好友	432 主题

发消息

图神经网络G-Merging：参数融合新范式，5%参数实现多任务统一

发表于 2026-3-8 08:42:15 | 查看: 123| 回复: 0

G-Merging论文发现与主题示意

不同行业产生的图数据往往具有天然的差异化特性，这使得图神经网络模型的学习和应用面临着更为严峻的多域、多任务泛化挑战。

目前在图学习领域，“预训练 + 下游微调”已成为主流范式。研究者通常会先在大规模图数据上进行自监督预训练，得到一个通用基础模型，随后再针对不同的下游任务分别进行微调。这种策略在分子性质预测等图学习任务中已被证明行之有效。

但随之而来的是一个现实且棘手的问题：如果我们需要同时处理多个下游任务，是否就必须为每个任务单独保存和维护一个完整的微调模型？

例如在分子性质预测场景中，Tox21、SIDER、ClinTox、HIV 等众多数据集各自关注不同的分子属性。为每个任务独立微调一个模型固然能获得不错的效果，但在实际部署时，需要维护多个模型副本，会带来高昂的存储成本和计算负担。因此，业界一直希望探索能否构建一个统一的模型，使其能够同时处理多个不同的任务。

“模型融合（Model Merging）”为此提供了一种极具潜力的解决思路。这种方法旨在直接融合多个已微调模型的参数，快速构建出一个统一的多任务模型，而无需从头开始进行复杂的联合训练。在计算机视觉和自然语言处理领域，模型融合已经得到了充分研究，从最初简单的参数平均，到后来调整合并权重、引入额外可训练模块等更先进的方法，都在提升下游任务表现方面取得了显著成果。

然而，图数据与图像、文本数据存在本质不同。图具有天然的结构异质性，即不同数据集的图拓扑结构分布差异可能非常显著。因此，直接将适用于CV/NLP的简单参数平均方法应用于图神经网络，往往会导致模型性能出现断崖式下跌。

那么，图神经网络是否也能实现高质量的模型融合？来自大湾区大学、深圳大学、威斯康星大学麦迪逊分校等机构的研究者们给出了肯定的答案。

G-Merging论文标题与作者信息

论文标题：G-Merging: Graph Model Merging for Parameter-Efficient Multi-Task Knowledge Consolidation
收录会议：ICLR 2026
论文链接：https://openreview.net/forum?id=FoTtvLkkfU
代码链接：https://github.com/cjcj46262/G-Merging

数字序号02

方法框架

针对图数据结构的特殊性，研究团队提出了 G-Merging，这是一个专门为图神经网络设计的多任务模型融合框架。

G-Merging整体框架架构图
图1. G-Merging 框架图

G-Merging 的整体思路清晰，可分为三个核心阶段：

1. 初步参数融合

此阶段基于“任务算术（Task Arithmetic）”思想。首先，计算每个微调模型相对于预训练基础模型的“任务向量（Task Vector）”，即参数变化量。然后将这些任务向量叠加到预训练模型上，得到一个初步的统一多任务模型。这一步的目的在于快速提取跨任务共享的通用知识，且完全无需训练，能大幅减少直接存储多个模型带来的参数冗余。

2. 拓扑感知对齐

简单的参数叠加不可避免地会引入表示偏移。为了解决这个问题，G-Merging 为每个任务分别训练一个轻量级的适配器（Adapter）模块。其关键创新在于设计了一种 拓扑感知的 Wasserstein 距离（Topology-aware Wasserstein Distance, TWD） 损失函数。

传统的表示对齐方法通常只考虑特征分布，而 TWD 创造性地将图的邻接矩阵结构信息纳入距离约束，使得对齐过程能够显式地“感知”图数据的拓扑连接关系。该损失函数同时在节点级和图级对齐融合模型与原始微调模型的表示分布。

这一阶段，主干模型的参数保持冻结，仅训练占参数量极少的 Adapter，其训练成本仅约为完整微调的 1/8。

3. 无参数的MoE路由推理

在推理阶段，G-Merging 将不同任务对应的 Adapter 视为多个“专家”（Experts），构建了一个无需额外训练参数的混合专家（Mixture-of-Experts, MoE）结构。路由权重并非固定或通过学习得到，而是根据输入图与各任务原型图之间的结构相似度动态计算。这种机制使得拓扑结构相似的任务能够自动共享知识，同时有效缓解了不同任务之间可能存在的冲突。

最终，在部署时，我们仅需保存一个统一的 GNN 主干模型和一组轻量的 Adapter 参数即可。

数字序号03