云栈社区»论坛 › 技术文档「 Note & Doc 」 › Polymarket套利实战：从Bregman投影到Frank-Wolfe算法的完整数学 ...

发回帖发新帖

4001 积分	0 好友	521 主题

发消息

Polymarket套利实战：从Bregman投影到Frank-Wolfe算法的完整数学路线图

发表于 2026-2-9 06:30:57 | 查看: 298| 回复: 0

最近一篇研究论文揭示了令人震撼的事实：经验丰富的交易员在一年内，从Polymarket这类预测市场中，通过确定性套利策略提取了4000万美元的利润。其中排名第一的交易员独赚 $2，009,631.76。这些人并非依赖运气的赌徒，他们运行的是Bregman投影、Frank-Wolfe算法，并求解着足以让大多数计算机科学博士感到棘手的复杂优化问题。

当你看到一个市场中“是”（YES）报价 $0.62、“否”（NO）报价$0.33时，你可能会想：“加起来是 $0.95，存在套利机会”。你的直觉是对的。但多数人未曾意识到的是：当你还在手动检查 YES + NO 是否等于$1 时，量化系统已经在毫秒级时间内求解整数规划问题，扫描17,218个条件。当你的人工双订单还未完成提交，微小的价差早已消失。系统早已在数十个相关市场中发现了同样的价格偏离，计算了考虑订单簿深度和手续费的最优仓位，并行执行了交易，并将资金迅速轮转到下一个机会。

差异绝不仅仅是速度，而是背后坚实的数学基础设施。

本文将详细拆解那套从Polymarket套取4000万美元的确切数学框架。你会理解为何简单的加法检查行不通，整数规划如何压缩指数级搜索空间，以及Bregman散度对于定价效率的真实意义。更重要的是，你将看到区分业余脚本与运行数百万资金生产系统的具体算法策略与工程实现。

注意：这不是一篇可以略读的概览。如果你真心想搭建能够扩展到七位数资金规模的系统，请通读全文。如果你只寻找快速致富的捷径或“感觉式编程”，本文或许并不适合你。

第一部分：边际多面体问题（为什么简单数学会失效）

多条件市场的现实

单一条件市场示例：“特朗普会赢得宾夕法尼亚州吗？”

YES: $0.48
NO: $0.52
总和: $1.00

看起来完美无缺，没有套利空间，对吧？

错了。

现在加入另一个市场：“共和党会以5分以上优势赢得宾夕法尼亚州吗？”

YES: $0.32
NO: $0.68

每个市场内部的价格总和仍为$1，看起来依然正常。

但这里存在逻辑依赖关系。如果共和党以5+优势获胜，那么特朗普必然赢得宾夕法尼亚州。这两个市场并非完全独立。而这，正是高级套利机会的来源。

数学框架

对于具有 n 个条件的市场，存在 2^n 种可能的价格组合。但只有 n 种有效结果，因为最终恰好有一个条件会解析为TRUE。

定义有效收益向量的集合 Z：

Z = { z ∈ {0,1}^n | sum(z) = 1 }

其中 z 是一个二元向量，表示在某个结果中哪个条件为TRUE。

边际多面体 (Marginal Polytope) 是这些有效向量的凸包：

P = conv(Z)

可以简单理解为把所有有效向量“包裹”起来的一个封闭几何区域。例如，2个向量的凸包是连接这两点的线段，3个向量的凸包是三角形。

无套利的价格必须位于这个凸包 P 之内。任何落在 P 之外的价格，理论上都是可以利用的。

市场的实际定价必须落在这个「凸包区域 P」内——因为其边界由“真实有效结果”决定，代表了价格的合理区间。如果价格落在 P 外，就说明定价偏离了真实结果，存在无风险套利空间。

以宾夕法尼亚州的例子来看：

市场A有2个条件，对应2种有效结果。
市场B有2个条件，对应2种有效结果。
朴素的组合检查会认为有 2 × 2 = 4 种可能结果。
实际有效结果：只有3种（逻辑依赖关系消除了其中1种不可能的组合）。

当市场定价假设存在4种独立结果，而实际上只有3种时，这种错误定价就创造了确定性的利润。

为什么暴力枚举会失效

考虑2010年NCAA篮球锦标赛市场：

63场比赛（每场胜/负）
2^63 种可能结果（这是一个天文数字）
超过5，000种衍生证券

在这种情况下，检查每一种可能的结果组合在计算上是完全不可能的。

研究团队发现，仅2024年美国大选市场就存在1，576对潜在的依赖市场。朴素的两两验证需要为每一对检查 2^n × 2^m 种组合。即使每个市场只有10个条件，那也是每对 1024 × 1024 ≈ 一百万次检查。乘以1，576对……当你的笔记本电脑还在计算时，选举结果恐怕早已公布了。

整数规划解决方案

与其暴力枚举所有结果，不如用一组线性约束来描述什么是“有效”的集合。

Z = { z ∈ {0,1}^n | Az = b }

其中A和b编码了条件之间的逻辑约束（例如，“胜场数之和不能超过总比赛场数”）。

一个来自杜克大学对阵康奈尔大学的真实案例：每支队伍有7个证券（代表赢得0到6场比赛）。总共14个条件，朴素来看有 2^14 = 16，384 种可能组合。

但逻辑上，他们不可能都赢得5场或更多比赛，因为两队会在半决赛相遇。这就是需要被编码的约束。

通过整数规划设置约束：

sum(z_duke_0_to_6) = 1 （杜克队的7个证券中，有且仅有一个会生效）
sum(z_cornell_0_to_6) = 1 （康奈尔队的7个证券中，有且仅有一个会生效）
z_duke_5 + z_duke_6 + z_cornell_5 + z_cornell_6 <= 1 （两队不能同时有“赢5场”或“赢6场”的情况发生）

仅仅三个线性约束，就替代了需要对16，384种组合进行的暴力检查。

这就是量化系统处理指数级复杂性的方式：不是枚举，而是用约束来精确定义可行域。

真实数据的检测结果

研究团队分析了2024年4月至2025年4月的Polymarket数据：

检查了总共17，218个条件
发现7，051个条件存在单市场套利机会（占比41%）
错误定价的中位数约为 $0.60（意味着价格总和经常偏离$1.00 达40%）
确认有13对存在依赖关系的市场存在可利用的跨市场套利

错误定价中位数达到$0.60，表明市场远非有效，而是存在大规模的可利用机会。

关键要点：套利检测不仅仅是检查几个数字相加是否等于1。它的本质是，在一个指数级庞大的结果空间中，使用紧凑的线性表示来求解约束满足问题。

第二部分：Bregman投影（如何真正消除套利）

发现套利机会是一个问题，而计算出最优的套利交易则是另一个更具挑战性的问题。

你不能简单地通过平均或微调价格来“修复”市场。你需要将当前的市场状态（价格向量）“投影”到无套利的流形上，同时尊重市场固有的信息结构。

为什么标准距离度量会失效

欧几里得投影会尝试最小化：

||p - q||²

其中p是当前价格，q是无套利价格。这种方法平等对待所有价格变动。但预测市场使用成本函数（通常是对数市场评分规则LMSR），价格代表隐含概率。从 $0.50 变动到$0.60，与从 $0.05 变动到$0.15，尽管数值差都是$0.10，但信息含量和市场影响完全不同。

价格变动	数值差	概率变化的实际含义	信息含量 / 市场影响
0.50 → 0.60	+0.10	概率从 50%→60%，相对上升 20%	普通变动，市场信心小幅提升，信息含量较低
0.05 → 0.15	+0.10	概率从 5%→15%，相对上升 300%	剧烈变动，市场对“小概率事件”信心剧增，信息含量极高

做市商使用的对数成本函数，意味着正确的“距离”度量必须尊重这种概率结构。

Bregman散度

对于任意凸函数 F 及其梯度 ∇F，Bregman散度定义为：

D_F(p, q) = F(p) - F(q) - ⟨∇F(q), p - q⟩

在预测市场的上下文中：

F 是成本函数 C 的凸共轭。
p 是当前市场状态。
q 是目标价格向量。

对于最常用的LMSR，对应的 F 是负熵：

F(p) = Σ_i p_i log(p_i)

这使得 D_F(p， q) 恰好成为KL散度 (Kullback-Leibler divergence)，一种度量两个概率分布之间信息论距离的工具。

KL散度的核心特性完美匹配市场微观结构：

非对称性：D_KL(p||q) ≠ D_KL(q||p)。这匹配市场现实——将低概率向上调整和将高概率向下调整的成本是不同的。
对极端值敏感：相同的数值差，在接近0或1的极端概率区间，KL散度计算结果远大于中间概率区间，反映了“极端价格变动蕴含更高信息量”的规律。
非负性：D_KL(p||q) ≥ 0，且当且仅当 p = q 时为零。

套利利润公式

任何交易可能获得的最大保证利润等于：

max profit = D_F(p， proj_P(p))

其中 proj_P(p) 是当前价格向量 p 在无套利凸包 P 上的Bregman投影。

这并非一个直观的结论，其证明需要凸优化对偶理论。但其含义非常清晰：寻找最优套利交易，等价于计算一个Bregman投影。

真实数据与执行意义

那位年赚200万美元的顶级套利者，其核心策略就是比其他人更快、更准确地求解这个优化问题：

min_{q ∈ P} D_F(p, q)

每一笔盈利的交易，都是在市场价格因套利行为而变动之前，快速找到了那个最优的投影点 proj_P(p)。

当你检测到套利机会时，你需要明确知道：

建立什么头寸（买入/卖出哪些条件）
多大的规模（考虑订单簿深度）
预期多少利润（考虑执行滑点和风险）

Bregman投影同时给出了这三个问题的答案。 投影点 q* 指明了无套利的价格向量，散度 D_F(p， q*) 指明了最大可提取利润，而梯度 ∇F(q*) 则指明了交易的方向。

没有这个数学框架，你是在猜测；有了它，你是在进行系统化优化。这正体现了严谨数学基础在复杂金融工程中的核心价值。

关键要点：套利不仅仅是发现错误定价的资产。它实质是在市场微观结构所定义的特定空间中，求解一个带约束的凸优化问题。数学的严谨性直接决定了盈利能力。

第三部分：Frank-Wolfe算法（使其计算可行）

直接计算高维空间中的Bregman投影通常是不可行的。边际多面体 P 可能具有指数级数量的顶点。

标准的凸优化算法需要访问完整的约束集。对于大规模预测市场，这意味着枚举每一个有效结果，这显然不现实。

Frank-Wolfe算法（也称为条件梯度法）通过一个巧妙的转换解决了这个难题：它将投影问题简化为一系列更易求解的线性规划问题。

核心洞见

Frank-Wolfe不是一次性在整个复杂多面体 P 上优化，而是迭代地构建它。

算法步骤：

1. 从已知顶点的小集合 Z_0 开始（例如，单位向量）
2. 对于每次迭代 t：
   a. 在当前顶点集合的凸包 conv(Z_{t-1}) 上求解凸优化子问题：
      μ_t = argmin_{μ ∈ conv(Z_{t-1})} D_F(p, μ)
   b. 通过求解一个整数规划(IP)来寻找能使目标函数下降最快的“新顶点”：
      z_t = argmin_{z ∈ Z} ⟨∇D_F(p, μ_t), z⟩
   c. 将新顶点添加到活跃集中：
      Z_t = Z_{t-1} ∪ {z_t}
   d. 计算收敛间隙：
      gap = ⟨∇D_F(p, μ_t), μ_t - z_t⟩
   e. 如果间隙 (gap) ≤ ε (预设阈值)，则停止迭代

活跃集 Z_t 每次迭代只增长一个顶点。即使经过100次迭代，你也只需要追踪100个顶点，而不是万亿个。这实现了计算复杂度的巨大降维。

整数规划预言机

上述第2b步是计算成本最高的部分。每次迭代都需要求解：

min_{z ∈ Z} ⟨g_t, z⟩

其中 g_t = ∇D_F(p, μ_t) 是当前梯度，Z 是由整数约束定义的有效收益向量集合。这本质上是一个整数线性规划问题。

一般情况下，整数规划是NP难的。但对于具有良好结构的问题（如预测市场中的逻辑约束），现代商业求解器（如Gurobi）可以非常高效地处理。研究团队使用的Gurobi 5.5，其典型求解时间因市场状态而异：

早期迭代（大部分结果未定）：< 1秒
中期（30-40场比赛结果确定）：10-30秒
后期（50+场比赛结果确定）：< 5秒（因为可行集缩小，问题更简单）

梯度有界化与自适应收缩

标准Frank-Wolfe的收敛性证明要求梯度是Lipschitz连续的。但对于LMSR对应的负熵函数 F(p) = Σ p log p，其梯度 log p 在 p → 0 时会趋向负无穷，导致“爆炸”，违反假设。

解决方案是使用Barrier Frank-Wolfe。我们不在原始多面体 P 上优化，而是在一个略微收缩的多面体上优化：

P_ε = { q ∈ P | q_i ≥ ε for all i }

其中 ε > 0 是一个小的正数。对于任何固定的 ε > 0，梯度在 P_ε 上就是有界的。算法会自适应地随着迭代减小 ε 的值，最终收敛到原始问题的真实解。

生产环境中的性能表现

论文中的原话是：“一旦投影变得实际可行（计算够快），FWMM (Frank-Wolfe Market Maker) 在定价准确性上就优于LCMM (Linear Cost Market Maker)。”

在实际的锦标赛市场数据回溯测试中：

前16场比赛：LCMM和FWMM表现相似（因为此时整数规划求解器还太慢）
当45场比赛结果确定后：首次成功的30分钟以内投影完成
剩余赛程：FWMM在证券定价上比LCMM中位数提升了38%

转折点出现在结果空间缩小到足以让整数规划求解器在交易时间框架内完成计算的时候。

关键要点：理论的优雅若无计算可行性则毫无意义。结合了整数规划预言机的Frank-Wolfe算法，使得Bregman投影在具有万亿级可能结果的市场上变得实际可行。这就是那4000万美元套利利润被实际计算和执行所依赖的核心算法。

第四部分：非原子约束下的执行（为什么订单簿改变一切）

假设你已经检测到套利，也通过Bregman投影计算出了最优交易。现在，你需要真正去执行它。

而这里，正是大多数纸上谈兵的策略失败的地方。

非原子执行问题

Polymarket使用中央限价订单簿。与某些去中心化交易所（DEX）的原子交易（所有交易要么同时成功，要么同时失败）不同，CLOB中的执行是顺序的。

设想一个完美的套利计划：

买入 YES @ $0.30
买入 NO  @ $0.30
总成本： $0.60
保证赔付：$1.00
预期利润：$0.40

现实可能是：

提交YES订单 → 以$0.30成交 ✓
（你的买单消耗了流动性，市场价格随之更新）
提交NO订单  → 以$0.78成交 ✗ （因为价格已变动）
总成本： $1.08
赔付： $1.00
实际结果： -$0.08 亏损

你只成功执行了“一条腿”的交易，却暴露在了方向性风险之下。这就是为什么研究论文只关注那些至少有 $0.05 利润空间的机会——更小的价差很容易被这种执行风险吞噬。

基于成交量加权平均价格的分析

与其假设能以当前报价瞬时成交，不如计算更真实的预期执行价格——成交量加权平均价格。

研究方法是对Polygon链上的每个区块（约2秒）进行分析：

对于每个区块：
  计算该区块内所有YES交易的VWAP_yes
  计算该区块内所有NO交易的VWAP_no
  如果 |VWAP_yes + VWAP_no - 1.0| > 0.02：
     记录为一个套利机会
     利润 = |VWAP_yes + VWAP_no - 1.0|

按区块分析VWAP，能够捕捉一个原子时间单位内的实际可达成价格，而非理想化的瞬时报价。

流动性约束与最大可提取利润

即使价格存在错误定价，你能捕捉的利润也仅限于订单簿上可用的流动性范围。

研究中的一个真实案例：

市场显示套利机会：YES系列价格总和 = $0.85
潜在利润率：$0.15 per$1
但在这些错误价格上的订单簿总深度：仅有 $234
因此，最大可提取利润 = $234 × 0.15 =$35.10

对于多条件市场的组合套利，你需要所有相关头寸的对应价格上都有足够流动性。你的最大仓位由流动性最小的那条“腿”决定。

执行成功率数据

研究数据显示了检测与执行之间的巨大差距：

单条件套利：检测到7，051个机会，大部分被执行（成功率87%）。失败主因：流动性不足（48%）、价格变动（31%）、竞争（21%）。
组合套利：检测到13对机会，仅成功执行5对（成功率38%）。失败主因：无法同时在所有市场获得足够流动性（71%）、速度竞争（18%）。

这清晰地表明，执行风险是理论利润与实际利润之间的关键过滤器。

速度层级与复利优势

散户的执行延迟（约2.65秒）与成熟系统的延迟（约2.04秒，且决策时间极短）存在显著差异。关键不在于区块链确认时间（~2秒），而在于从检测到提交订单的决策延迟。

快钱包系统能在30毫秒内并行提交所有交易，试图让它们在同一个区块内确认，从而最小化非原子执行风险。当你（在链上）看到他们的交易被确认时，他们已经完成套利并离场，而你试图“复制”其交易时，很可能只是在为他们提供退出流动性，并承受因市场移动带来的滑点损失。

资本规模效应

顶级套利者能以百万美元资本高效运转的策略，对于5万美元的小资金可能完全无效。原因包括：滑点占利润比例更高、无法分散投资于足够多的机会、单次失败可能导致多日利润回吐、Gas费等固定成本侵蚀利润边际。

例如，一次4条腿的策略Gas费约$0.02：

若利润为$0.08，Gas成本占25%
若利润仅为$0.03，Gas成本则高达67%

这再次印证了研究中$0.05最低利润阈值的现实考量。

关键要点：数学上的正确性是必要的，但绝非充分条件。执行速度、订单簿深度、非原子成交风险共同决定了实际的盈利能力。研究表明4000万美元被提取，正是因为成熟的参与者系统性地解决了执行层面的工程挑战，而不仅仅是数学问题。

第五部分：完整系统架构（实际部署的内容）

理论是简洁优美的，而实际的生产系统则是复杂严谨的。以下是一个基于研究结果和工业实践总结出的可行套利系统架构。

数据管道

实时数据流：

WebSocket 连接 Polymarket CLOB API
  ├─ 订单簿更新流（价格/数量变化）
  ├─ 交易执行流（实时成交）
  └─ 市场创建/结算事件流

历史数据分析（用于回测与模型训练）：

Alchemy Polygon 节点 API
  └─ 查询 Polymarket 核心合约的事件日志
      ├─ OrderFilled 事件（已成交订单）
      ├─ PositionSplit 事件（新代币铸造）
      └─ PositionsMerge 事件（代币合并销毁）

研究分析了超过8600万笔交易。处理这种量级的数据需要稳固的基础设施，而非临时脚本。

依赖关系检测层

对于305个美国大选市场，理论上需要检查 C(305,2) = 46,360 对组合。人工分析绝无可能。

研究采用了大语言模型（DeepSeek-R1-Distill-Qwen-32B）结合提示工程进行自动化初步筛选：

输入：两个市场及其条件描述
输出：有效结果组合的JSON

后续验证检查：
1. 每个市场是否每个结果恰好有一个TRUE条件？
2. 有效组合数是否少于 n×m（表明存在依赖）？
3. 依赖子集是否满足套利条件？

在大选市场中的应用结果：

40，057 对独立（无套利可能）
1，576 对存在依赖（潜在套利）
374 对满足严格的组合套利条件
13 对 经过人工验证确认可利用

对于复杂多条件市场，该流程的准确率约为81.45%，足以作为高效的过滤层，最终执行前再辅以人工验证。

三层式优化与执行引擎

第一层：快速线性约束检查
运行简化的线性规划松弛，在毫秒级别检查基本约束（如概率和为1、蕴含关系下的概率不等式）。用于快速过滤掉最明显的错误定价。

第二层：整数规划辅助的Frank-Wolfe投影
这是核心优化层。集成Gurobi等IP求解器，运行Barrier Frank-Wolfe算法。

研究参数：Alpha=0.9（目标提取90%以上理论利润），初始收缩参数ε=0.1，收敛阈值1e-6，时间限制30分钟（随市场状态动态调整）。
典型需要50-150次迭代。每次迭代的IP求解时间在1秒到30秒之间，取决于问题的即时规模。

第三层：执行前验证与模拟
在提交真实订单前，针对当前最新的订单簿进行成交模拟。
检查项包括：

各价格档位是否有足够流动性？
考虑订单簿深度后的预期滑点是多少？
滑点后的保证利润是否仍高于最低阈值（如$0.05）？
只有所有检查通过，交易指令才会被发送至执行模块。

仓位管理

采用考虑执行风险的修正版凯利公式：

f* = (p * b - q) / b * η

其中：

p = 套利机会的“胜率”（在确定套利中可视为1）
b = 利润百分比
q = 失败概率 (1-p)
η = 完全执行概率（根据订单簿深度估算）

同时，设定单次头寸上限不超过订单簿深度的50%，以避免自身的交易对市场造成过大冲击。

监控与风险管理

一个生产级系统需要实时监控仪表板，追踪：

每分钟检测到/执行的机会数量
执行成功率
累计总利润与当前回撤
平均决策延迟（从检测到提交）
并设置警报，例如：回撤超过15%、执行成功率低于30%、IP求解器频繁超时等。

研究发现，顶级套利者一年进行了4，049笔交易，平均每天约11笔。这并非传统意义上的高频交易，而是系统性、高确定性的中低频套利。

实际产出与结论

2024年4月至2025年4月的估算总套利利润提取额高达$39，688，585。其中前10名提取者拿走了约20.5%（超过800万美元）。排名第一的交易员通过4，049笔交易赚取$2，009，632，平均每笔交易利润约$496。

这不是彩票，也不是幸运的时机捕捉。这是数学精确性与系统工程化执行结合的必然结果。

散户方式与量化系统方式的对比泾渭分明：

散户：周期性（如每30秒）轮询价格，手动或简单脚本检查价差，人工提交订单，祈祷一切顺利。
量化系统：实时数据流，整数规划检测逻辑依赖，Frank-Wolfe算法计算最优投影，并行订单执行与滑点控制，系统化的仓位和风险管理。

最终结果就是：一组人系统性地提取了4000万美元，而另一组人则在不知不觉中为他们提供了流动性。

关键要点：一个能够盈利的生产系统，需要同时具备数学理论的严谨性与工程实践的成熟度。这涵盖了凸优化理论、分布式实时数据处理、高性能计算、风险管理系统和低延迟执行算法。数学是基石，而稳固的基础设施使其转化为真实的利润。

最终现实

当多数交易者还在阅读“预测市场十大技巧”时，成熟的量化系统已经在持续地：

求解整数规划以检测数万个条件间的隐藏依赖。
计算Bregman投影来定位最优套利交易点。
运行Frank-Wolfe算法进行高效求解。
执行考虑真实流动性的并行订单。
系统性地提取着以百万美元计的保证利润。

差异的本质，是系统化的数学基础设施。

相关的研究论文是公开的，核心算法是已知的，市场上产生的利润是真实可见的。剩下的核心问题或许是：你能否在下一个“4000万美元”被完全提取之前，构建出自己的竞争系统？

核心资源索引

核心研究论文：“Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets” (arXiv:2508.03474v1)
理论基础：“Arbitrage-Free Combinatorial Market Making via Integer Programming” (arXiv:1606.02825v2)
优化求解器：Gurobi Optimizer
LLM依赖分析：DeepSeek-R1-Distill-Qwen-32B
区块链数据：Alchemy Polygon Node API

算法路径是清晰的，基础设施组件也已存在。真正的挑战，最终落到了系统的设计与执行层面。对于希望深入优化理论与算法实践细节的开发者，持续的学习与交流至关重要，这也是技术社区如云栈社区的价值所在。

上一篇：OpenClaw AI智能体如何自动运营公司？VoxYZ零人团队架构解析
下一篇：大厂员工年薪百万后的感悟：世界是个草台班子，多数人都在装

Polymarket, 套利, Bregman投影, Frank-Wolfe算法, 数学优化