云栈社区»论坛 › 回收站「 Recycle Bin 」 › 基于原子机制的连续演化：TRACE框架实现因果表征学习中的轨迹恢 ...

发回帖发新帖

5682 积分	0 好友	744 主题

发消息

基于原子机制的连续演化：TRACE框架实现因果表征学习中的轨迹恢复

发表于 2026-3-13 07:03:27 | 查看: 178| 回复: 0

学术主题横幅：自然语言处理与计算机视觉

论文标题：TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

论文标题：
TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

论文链接：
https://arxiv.org/abs/2601.21135

01.

引言：离散假设的局限

因果表征学习（Causal Representation Learning, CRL）旨在从高维观测数据中恢复潜在的因果变量及其关系，是近年来机器学习与因果推断交叉领域的重要研究方向。

在时序数据的场景下，现有的 CRL 方法（如 TDRL、NCTRL 等）普遍依赖一个关键假设：因果机制在不同域之间是离散切换的。

然而，真实世界中的系统演化往往是连续且渐进的。

想象一辆汽车正在进行转弯操作：方向盘角度、车速与横向加速度之间的因果关系不会在某一时刻突然“跳变”，而是随着车辆从直行→进入弯道→稳定过弯的过程平滑过渡的。

类似地，人类从步行到跑步的步态转换，也涉及肢体协调和地面接触动力学的连续重组，而非瞬间切换。

这就引出了我们的核心问题：如何学习能够捕捉因果机制连续演化的表征？

02.

问题建模：从离散域到连续轨迹

我们提出的关键洞察是：将过渡机制建模为有限个原子机制（Atomic Mechanisms）的凸组合，由时变混合系数 $\alpha(t)$ 控制。

具体而言，假设存在 $K$ 个原子因果机制 $\{ C_k \}_{k=0}^{K-1}$，它们对应单纯形（simplex）的顶点。在任意时刻 $t$，系统的实际机制状态 $s_t$ 是这些原子机制的凸组合：

时间序列的加权求和公式

这样，机制的演化就被刻画为单纯形内的一条连续轨迹，而非顶点之间的离散跳转。不同的轨迹（即使起点和终点相同）代表了不同的过渡路径，这是离散切换模型无法区分的。

03．

理论贡献：联合可辨识性

我们的理论贡献包含两个层面：

定理 4.1（潜在变量的可辨识性）：在可逆混合函数和充分变异性条件下，学习到的表征与真实潜在因果变量之间存在逐分量的单调变换关系（up to permutation）。这一结果继承并扩展了已有 temporal CRL 的可辨识性框架。

定理 4.2-4.3（混合轨迹的可恢复性）：作为我们的主要理论贡献，我们证明了连续混合轨迹 $\alpha(t)$ 也是可恢复的，并给出了有限样本误差界——该误差界随着轨迹平滑度的提高而改善。

这意味着即使只观测到原子机制（训练阶段），也能在测试时恢复从未见过的中间机制状态。这一发现为处理动态系统中的连续演化现象提供了坚实的理论基础。

04．

方法：TRACE 框架

基于上述理论，我们提出了 TRACE（Trajectory Recovery for Continuous Mechanism Evolution） 框架，采用两阶段设计：

阶段一：原子机制学习
利用 Mixture-of-Experts（MoE） 架构，在仅包含原子机制的数据上进行训练。每个 Expert 学习一个原子因果机制的条件分布。核心思想是：MoE 的门控网络自然对应于混合系数 $\alpha(t)$，每个 Expert 自然对应于一个原子机制。

阶段二：轨迹恢复
给定经历机制过渡的测试数据，利用已训练好的 MoE 模型的门控输出来恢复混合轨迹。由于每个 Expert 已经学会了对应的原子机制，门控权重直接反映了当前时刻各原子机制的混合比例。

这一设计的优雅之处在于：训练仅需离散的原子机制数据，但推断时可以泛化到任意连续的中间机制状态。

05.

实验结果

合成数据实验
我们在精心设计的合成数据集上验证了理论预测。TRACE 在恢复混合轨迹方面达到了高达 0.99 的相关系数，大幅超越了基于离散切换假设的基线方法（TDRL、NCTRL 等）。

值得注意的是，基于离散假设的方法（如 NCTRL 的 hard gating）在过渡区域只能产生 argmax 式的硬切换输出，完全无法捕捉连续过渡的细节。

即使使用 soft gating，这些方法也无法恢复真实的混合轨迹，因为它们并未针对连续机制演化进行建模。

理论验证
实验结果与我们的理论预测高度一致：

轨迹恢复误差随样本量增加而降低，符合有限样本误差界的预测
更平滑的轨迹确实带来了更好的恢复精度
即使原子机制的数量增加，TRACE 仍能保持稳定的性能

06.

讨论与展望

TRACE 的提出填补了因果表征学习中从离散到连续的重要空白。我们的工作揭示了几个值得进一步探索的方向：

更复杂的机制空间：当前的凸组合假设可以进一步放松，探索更一般的机制流形。
实际应用：连续机制过渡在蛋白质构象动力学、气候系统演化、经济政策效应传导等场景中广泛存在，TRACE 框架有望在这些领域发挥作用。
与因果发现的结合：恢复的机制轨迹可以用于识别系统行为的关键转折点，实现预测性控制和早期异常检测。

总结来说，本文的主要贡献包括：

新问题：首次形式化了因果表征学习中的连续机制演化问题
理论保证：证明了潜在变量和连续混合轨迹的联合可辨识性，并给出有限样本误差界
实用框架：提出 TRACE，一个基于 MoE 的优雅框架，训练于离散数据、泛化到连续过渡
实证验证：在合成和真实数据上展示了显著优于现有方法的性能

我们相信，从离散到连续的这一范式转变，将为深度学习和因果推理打开新的研究空间，也为更深入地理解动态系统提供了强大的工具。如果你对这类前沿的机器学习理论研究感兴趣，欢迎到 云栈社区 的技术论坛板块，与其他开发者和研究者一起探讨。

上一篇：CVPR 2026录用CraftMesh论文，17岁高中生唯一一作引关注
下一篇：Chrome 垂直选项卡功能启用指南：v146+版本设置与使用体验

因果表征学习, 连续机制演化, TRACE, 轨迹恢复, 原子机制

基于原子机制的连续演化：TRACE框架实现因果表征学习中的轨迹恢复

相关帖子