

论文标题:
TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning
论文链接:
https://arxiv.org/abs/2601.21135

引言:离散假设的局限
因果表征学习(Causal Representation Learning, CRL)旨在从高维观测数据中恢复潜在的因果变量及其关系,是近年来机器学习与因果推断交叉领域的重要研究方向。
在时序数据的场景下,现有的 CRL 方法(如 TDRL、NCTRL 等)普遍依赖一个关键假设:因果机制在不同域之间是离散切换的。
然而,真实世界中的系统演化往往是连续且渐进的。
想象一辆汽车正在进行转弯操作:方向盘角度、车速与横向加速度之间的因果关系不会在某一时刻突然“跳变”,而是随着车辆从直行→进入弯道→稳定过弯的过程平滑过渡的。
类似地,人类从步行到跑步的步态转换,也涉及肢体协调和地面接触动力学的连续重组,而非瞬间切换。
这就引出了我们的核心问题:如何学习能够捕捉因果机制连续演化的表征?

问题建模:从离散域到连续轨迹
我们提出的关键洞察是:将过渡机制建模为有限个原子机制(Atomic Mechanisms)的凸组合,由时变混合系数 $\alpha(t)$ 控制。
具体而言,假设存在 $K$ 个原子因果机制 $\{ C_k \}_{k=0}^{K-1}$,它们对应单纯形(simplex)的顶点。在任意时刻 $t$,系统的实际机制状态 $s_t$ 是这些原子机制的凸组合:

这样,机制的演化就被刻画为单纯形内的一条连续轨迹,而非顶点之间的离散跳转。不同的轨迹(即使起点和终点相同)代表了不同的过渡路径,这是离散切换模型无法区分的。

理论贡献:联合可辨识性
我们的理论贡献包含两个层面:
定理 4.1(潜在变量的可辨识性):在可逆混合函数和充分变异性条件下,学习到的表征与真实潜在因果变量之间存在逐分量的单调变换关系(up to permutation)。这一结果继承并扩展了已有 temporal CRL 的可辨识性框架。
定理 4.2-4.3(混合轨迹的可恢复性):作为我们的主要理论贡献,我们证明了连续混合轨迹 $\alpha(t)$ 也是可恢复的,并给出了有限样本误差界——该误差界随着轨迹平滑度的提高而改善。
这意味着即使只观测到原子机制(训练阶段),也能在测试时恢复从未见过的中间机制状态。这一发现为处理动态系统中的连续演化现象提供了坚实的理论基础。

方法:TRACE 框架
基于上述理论,我们提出了 TRACE(Trajectory Recovery for Continuous Mechanism Evolution) 框架,采用两阶段设计:
阶段一:原子机制学习
利用 Mixture-of-Experts(MoE) 架构,在仅包含原子机制的数据上进行训练。每个 Expert 学习一个原子因果机制的条件分布。核心思想是:MoE 的门控网络自然对应于混合系数 $\alpha(t)$,每个 Expert 自然对应于一个原子机制。
阶段二:轨迹恢复
给定经历机制过渡的测试数据,利用已训练好的 MoE 模型的门控输出来恢复混合轨迹。由于每个 Expert 已经学会了对应的原子机制,门控权重直接反映了当前时刻各原子机制的混合比例。
这一设计的优雅之处在于:训练仅需离散的原子机制数据,但推断时可以泛化到任意连续的中间机制状态。

实验结果
合成数据实验
我们在精心设计的合成数据集上验证了理论预测。TRACE 在恢复混合轨迹方面达到了高达 0.99 的相关系数,大幅超越了基于离散切换假设的基线方法(TDRL、NCTRL 等)。
值得注意的是,基于离散假设的方法(如 NCTRL 的 hard gating)在过渡区域只能产生 argmax 式的硬切换输出,完全无法捕捉连续过渡的细节。
即使使用 soft gating,这些方法也无法恢复真实的混合轨迹,因为它们并未针对连续机制演化进行建模。
理论验证
实验结果与我们的理论预测高度一致:
- 轨迹恢复误差随样本量增加而降低,符合有限样本误差界的预测
- 更平滑的轨迹确实带来了更好的恢复精度
- 即使原子机制的数量增加,TRACE 仍能保持稳定的性能

讨论与展望
TRACE 的提出填补了因果表征学习中从离散到连续的重要空白。我们的工作揭示了几个值得进一步探索的方向:
- 更复杂的机制空间:当前的凸组合假设可以进一步放松,探索更一般的机制流形。
- 实际应用:连续机制过渡在蛋白质构象动力学、气候系统演化、经济政策效应传导等场景中广泛存在,TRACE 框架有望在这些领域发挥作用。
- 与因果发现的结合:恢复的机制轨迹可以用于识别系统行为的关键转折点,实现预测性控制和早期异常检测。
总结来说,本文的主要贡献包括:
- 新问题:首次形式化了因果表征学习中的连续机制演化问题
- 理论保证:证明了潜在变量和连续混合轨迹的联合可辨识性,并给出有限样本误差界
- 实用框架:提出 TRACE,一个基于 MoE 的优雅框架,训练于离散数据、泛化到连续过渡
- 实证验证:在合成和真实数据上展示了显著优于现有方法的性能
我们相信,从离散到连续的这一范式转变,将为深度学习和因果推理打开新的研究空间,也为更深入地理解动态系统提供了强大的工具。如果你对这类前沿的机器学习理论研究感兴趣,欢迎到 云栈社区 的技术论坛板块,与其他开发者和研究者一起探讨。