3484 积分	0 好友	480 主题

发消息

[Python] 利用T-KAN模型提升高频限价订单簿预测：效率、可解释性与策略回测

发表于 2026-1-10 01:51:44 | 查看: 82| 回复: 0

该论文主要探讨了如何利用 T-KAN 改进高频交易（HFT）中限价订单簿（LOB）的预测能力。

一、摘要

高频交易环境下的限价订单簿（LOB）数据具有极大的噪声和非线性。传统模型（如 DeepLOB）面临 Alpha衰减（Alpha Decay） 的挑战，即随着预测时间范围（k）的增加，预测能力迅速下降。本文提出了 T-KAN 模型，利用可学习的 B样条（B-spline）激活函数 替代标准 LSTM 中固定的线性权重。这使得模型能够学习市场信号的“形状”而非仅仅是幅度。

主要成果：

在 FI-2010 数据集上，预测范围 k=100 时，F1-Score 相对提升了 19.1%。
在考虑 1.0 bps 交易成本的模拟回测中，T-KAN 实现了 132.48% 的回报率，而 DeepLOB 则亏损 -82.76%。

该模型还具有良好的可解释性（能观察到样条函数中的“死区”以过滤噪声），且适合通过高层次综合（HLS）在 FPGA 上实现低延迟部署。

二、引言

LOB 特性：LOB 是一个高维、离散事件的动态系统。研究聚焦于“竞价阶段（Auction Phase）”，该阶段价格发现剧烈，存在结构性流动性转移。
建模需求：模型需要能够捕捉复杂的、具有“路径依赖”特征的非线性关系。
传统方法的局限：标准 LSTM 依赖于固定的点状激活函数（如 Sigmoid/Tanh）和静态权重矩阵（W），这种“通用逼近”方法在处理微观结构数据的局部震荡时参数效率低下。
T-KAN 方案：通过用可学习的单变量样条函数替换静态矩阵，T-KAN 允许“在边缘上进行计算（computation on the edges）”，从而提供高分辨率的流形来捕捉激进的价格发现过程。

三、文献综述

3.1 市场微观结构中的深度学习：

FI-2010 是基准数据集。
发展历程：从 CNN（提取空间特征）到 DeepLOB（CNN+LSTM 处理时空依赖）再到 TABL（注意力机制）。
问题：由于“维数灾难”，固定激活函数的网络在建模高频分量时受限。

3.2 Kolmogorov-Arnold Networks (KAN) 与样条理论：

基于 Kolmogorov-Arnold 表示定理，多元连续函数可以表示为单变量连续函数的和。
KAN 将这些函数参数化为 B样条（B-splines）。通过可学习的样条，网络学习激活函数本身，从而更精细地拟合非线性 LOB 流形。

3.3 循环机制与 T-KAN 混合体：

缺陷：普通 KAN 缺乏内部记忆状态，不擅长捕捉时间序列的顺序依赖（即“时间缺口”）。
解决方案：T-KAN (KAN-LSTM) 混合架构。在 T-KAN 单元中，利用 KAN 层重新定义 LSTM 的门控逻辑（输入门、遗忘门、输出门）。
公式变化：将线性变换转变为基于样条的函数变换。
损失函数：为解决类别不平衡（中性类别占 65%），采用了 逆频率加权（Inverse Frequency Weighting） 的多类交叉熵损失函数。

T-KAN单元公式与损失函数

四、方法论

4.1 数据框架：

使用 FI-2010 基准数据集 ，特征经过 Z-score 标准化。
滑动窗口单元：使用 T=10 的回溯视窗构建输入样本 $Xt ∈ ℝ^{T×144}$ ，以捕捉订单流的动量。

4.2 架构规范：

DeepLOB 基线：CNN 提取特征 + LSTM 处理时序。
T-KAN 配置：
- 使用双层 LSTM 编码器（64个隐藏单元）捕捉高频依赖。
- 最终隐藏状态输入到一个 KAN 优化分类头（KAN Head） 。
- 该结构能将潜在表示投影到高维流形上，有效划分波动的竞价阶段数据。

4.4 优化与权重：