找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4036

积分

0

好友

552

主题
发表于 4 小时前 | 查看: 3| 回复: 0

学术主题横幅:自然语言处理与计算机视觉

论文标题:TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

论文标题:
TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

论文链接:
https://arxiv.org/abs/2601.21135

01.

引言:离散假设的局限

因果表征学习(Causal Representation Learning, CRL)旨在从高维观测数据中恢复潜在的因果变量及其关系,是近年来机器学习与因果推断交叉领域的重要研究方向。

在时序数据的场景下,现有的 CRL 方法(如 TDRL、NCTRL 等)普遍依赖一个关键假设:因果机制在不同域之间是离散切换的

然而,真实世界中的系统演化往往是连续且渐进的。

想象一辆汽车正在进行转弯操作:方向盘角度、车速与横向加速度之间的因果关系不会在某一时刻突然“跳变”,而是随着车辆从直行→进入弯道→稳定过弯的过程平滑过渡的。

类似地,人类从步行到跑步的步态转换,也涉及肢体协调和地面接触动力学的连续重组,而非瞬间切换。

这就引出了我们的核心问题:如何学习能够捕捉因果机制连续演化的表征?

02.

问题建模:从离散域到连续轨迹

我们提出的关键洞察是:将过渡机制建模为有限个原子机制(Atomic Mechanisms)的凸组合,由时变混合系数 $\alpha(t)$ 控制。

具体而言,假设存在 $K$ 个原子因果机制 $\{ C_k \}_{k=0}^{K-1}$,它们对应单纯形(simplex)的顶点。在任意时刻 $t$,系统的实际机制状态 $s_t$ 是这些原子机制的凸组合:

时间序列的加权求和公式

这样,机制的演化就被刻画为单纯形内的一条连续轨迹,而非顶点之间的离散跳转。不同的轨迹(即使起点和终点相同)代表了不同的过渡路径,这是离散切换模型无法区分的。

03.

理论贡献:联合可辨识性

我们的理论贡献包含两个层面:

定理 4.1(潜在变量的可辨识性):在可逆混合函数和充分变异性条件下,学习到的表征与真实潜在因果变量之间存在逐分量的单调变换关系(up to permutation)。这一结果继承并扩展了已有 temporal CRL 的可辨识性框架。

定理 4.2-4.3(混合轨迹的可恢复性):作为我们的主要理论贡献,我们证明了连续混合轨迹 $\alpha(t)$ 也是可恢复的,并给出了有限样本误差界——该误差界随着轨迹平滑度的提高而改善。

这意味着即使只观测到原子机制(训练阶段),也能在测试时恢复从未见过的中间机制状态。这一发现为处理动态系统中的连续演化现象提供了坚实的理论基础。

04.

方法:TRACE 框架

基于上述理论,我们提出了 TRACE(Trajectory Recovery for Continuous Mechanism Evolution) 框架,采用两阶段设计:

阶段一:原子机制学习
利用 Mixture-of-Experts(MoE) 架构,在仅包含原子机制的数据上进行训练。每个 Expert 学习一个原子因果机制的条件分布。核心思想是:MoE 的门控网络自然对应于混合系数 $\alpha(t)$,每个 Expert 自然对应于一个原子机制。

阶段二:轨迹恢复
给定经历机制过渡的测试数据,利用已训练好的 MoE 模型的门控输出来恢复混合轨迹。由于每个 Expert 已经学会了对应的原子机制,门控权重直接反映了当前时刻各原子机制的混合比例。

这一设计的优雅之处在于:训练仅需离散的原子机制数据,但推断时可以泛化到任意连续的中间机制状态

05.

实验结果

合成数据实验
我们在精心设计的合成数据集上验证了理论预测。TRACE 在恢复混合轨迹方面达到了高达 0.99 的相关系数,大幅超越了基于离散切换假设的基线方法(TDRL、NCTRL 等)。

值得注意的是,基于离散假设的方法(如 NCTRL 的 hard gating)在过渡区域只能产生 argmax 式的硬切换输出,完全无法捕捉连续过渡的细节。

即使使用 soft gating,这些方法也无法恢复真实的混合轨迹,因为它们并未针对连续机制演化进行建模。

理论验证
实验结果与我们的理论预测高度一致:

  • 轨迹恢复误差随样本量增加而降低,符合有限样本误差界的预测
  • 更平滑的轨迹确实带来了更好的恢复精度
  • 即使原子机制的数量增加,TRACE 仍能保持稳定的性能

06.

讨论与展望

TRACE 的提出填补了因果表征学习从离散到连续的重要空白。我们的工作揭示了几个值得进一步探索的方向:

  1. 更复杂的机制空间:当前的凸组合假设可以进一步放松,探索更一般的机制流形。
  2. 实际应用:连续机制过渡在蛋白质构象动力学、气候系统演化、经济政策效应传导等场景中广泛存在,TRACE 框架有望在这些领域发挥作用。
  3. 与因果发现的结合:恢复的机制轨迹可以用于识别系统行为的关键转折点,实现预测性控制和早期异常检测。

总结来说,本文的主要贡献包括:

  • 新问题:首次形式化了因果表征学习中的连续机制演化问题
  • 理论保证:证明了潜在变量和连续混合轨迹的联合可辨识性,并给出有限样本误差界
  • 实用框架:提出 TRACE,一个基于 MoE 的优雅框架,训练于离散数据、泛化到连续过渡
  • 实证验证:在合成和真实数据上展示了显著优于现有方法的性能

我们相信,从离散到连续的这一范式转变,将为深度学习和因果推理打开新的研究空间,也为更深入地理解动态系统提供了强大的工具。如果你对这类前沿的机器学习理论研究感兴趣,欢迎到 云栈社区 的技术论坛板块,与其他开发者和研究者一起探讨。




上一篇:CVPR 2026录用CraftMesh论文,17岁高中生唯一一作引关注
下一篇:Chrome 垂直选项卡功能启用指南:v146+版本设置与使用体验
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-13 11:11 , Processed in 0.484220 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表