在一个学习小组里,大家对“AI辅助投资”的讨论非常热烈。我自己虽然有兴趣,但对投资领域了解不深,很难组织有效的讨论。
既然不懂,为什么不学呢?抱着这个想法,我做了一些初步的调研,从最基本的概念入手。Ernie Chan所著的《量化交易》(第二版)成为了我的起点。
这本书篇幅不长,以科普和理念传播为主,没有过多深奥的细节,很适合我这样的初学者。书中的一些工具介绍可能稍有过时,论述也主要围绕美股市场展开,但这些细节对建立整体认知框架影响不大。
下面是我整理的核心要点总结,既便于自己日后回顾,也希望能为同样感兴趣的朋友提供一份清晰的路线图。
读完这本书后,我发现量化交易这个“生意模式”或许很适合技术背景的人。它不依赖销售或运营具体产品,策略性强且可扩展性高——对于偏好深度思考而非频繁社交的技术人来说,这不失为一个友好的方向。尽管我目前仍是新手,但这无疑是一个值得长期探索的潜在领域。
模块一:商业逻辑与散户优势
这一部分奠定了全书的思想基础,帮助读者建立信心,理解个人交易者为何能在市场中找到自己的生存空间。
- 容量悖论(Capacity)
- 机构的劣势:大资金是流动性的“需求者”。为了买入大量股票,他们不得不推高价格(支付冲击成本),这迫使大型机构只能执行长线或高容量策略,并且更容易受到宏观经济的广泛影响。
- 散户的优势:小资金则是流动性的“提供者”。你可以专注于“低容量策略”,例如短期做市,通过捕捉微小的买卖价差或套利机会获利。这类策略通常夏普比率很高,但正因为其容量小,无法容纳大资金,从而为个人交易者留下了机会。
- 约束即成本
- 机构投资者受到严格监管和有限合伙人(LP)偏好的多重限制,常常不得不遵循许多并非数学最优的约束条件,例如必须保持市场中性、禁止做空、禁止交易期货等。
- 独立的个人交易者没有这些束缚,可以更纯粹地追求数学模型上的最优解。
- 极简商业模式
- 量化交易具有极高的可扩展性。一套策略代码编写完成后,管理1万元资金与管理100万元资金所花费的精力相差无几。
- 零营销:你的对手盘只认价格不认人,无需维护复杂的客户关系。
模块二:策略研发
这部分回答了“交易什么”的问题,简要介绍了策略的分类与相关算法工具的应用。
- 两大策略基础
- 均值回归:赌价格会回到其“合理”水平。其核心数学工具是协整 和平稳性。需要特别注意:高相关性并不代表协整关系,而协整才是配对交易能够长期盈利的统计基础。
- 动量:赌当前趋势将会延续。其成因可能包括信息扩散缓慢、羊群效应等。主要风险在于趋势发生突然反转。
- 寻找策略的渠道
- 优先关注技术博客和专业论坛上的分享(易于理解和改造),其次是学术论文(通常过于复杂或其中的套利空间早已消失)。
- 简单性原则:模型越简单通常越稳健,参数越少则越不容易在回测中产生过拟合。
- AI 与机器学习的正确用法
- 不要直接使用AI模型去预测价格走势,那是一片竞争激烈的红海。
- 元标记:一种更聪明的用法是利用人工智能来预测“你的策略在当前市场环境下是否能够盈利”。模型的输入是各种市场特征,输出则是策略的预期胜率。这种方法可以实现条件参数优化,让策略能够动态调整参数,以适应不同的市场状态。
模块三:回测避坑
回测是量化交易的试金石,其核心思想在于“证伪”而非“证实”。
- 三大致命偏差
- 前瞻偏差:最常见的一种。指在回测代码中不小心使用了“未来数据”,例如用当日的最高价来决定是否在开盘时买入。解决方法是在编码时严格使用滞后一期的数据。
- 幸存者偏差:指回测时只使用了如今仍然上市的公司数据,而忽略了那些已经破产或退市的股票(这类股票通常价格较低)。这会导致策略的盈利表现被严重高估。解决方法是购买和使用包含了已退市股票信息的无偏大数据集。
- 数据窥探偏差:指通过反复调整参数,直到回测曲线看起来完美无缺。解决方法是严格进行样本外测试,并尽量减少策略的参数数量。
- 交易成本的杀伤力
- 一个高夏普比率的策略,在扣除了真实的交易滑点和佣金成本后,可能会直接变为亏损。在回测中,必须计入至少5个基点(0.05%)的单向交易成本。
- 核心评估指标
- 夏普比率:衡量风险调整后收益的“性价比”。计算公式为:(策略年化收益率 - 无风险利率)/ 策略年化波动率。
- 最大回撤:衡量策略对投资者心理承受能力的考验,即资产净值从峰值到谷底的最大跌幅。
模块四:执行系统
这部分涉及将策略代码转化为真实交易的工程实践。
- 账户结构选择
- 零售账户:自由度最高,保密性好,适合对策略保密性要求高的情形。但杠杆率较低(受Reg T限制)。建议注册有限责任公司以隔离个人的无限责任风险。
- 自营交易账户:可以提供极高的杠杆(可达20倍),适合低波动性的套利策略。但存在策略思路可能被平台方“借鉴”的风险。
- 自动化分级
- 半自动:程序生成交易订单 -> 人工审核确认 -> 批量上传执行。适合低频交易,能有效防止“胖手指”错误或代码漏洞导致的灾难性后果。
- 全自动:必须通过券商API直接对接。适合高频交易,需要将程序托管在低延迟的VPS上,以降低网络延迟和断线风险。
- 成本控制战术
- 1%法则:单笔订单的大小不应超过该股票日均成交量的1%,以尽量减少对市场价格的冲击。
- 四次根号法则:在构建投资组合时,个股权重应与其市值的四次方根成正比。这可以避免资金过度集中于巨头公司,给予小盘股合理的配置权重。
- 避开低价股:股价低于5美元的股票,其买卖价差和佣金成本占比通常过高,会侵蚀大部分利润。
模块五:资金与风险管理
这是区分赌徒与专业交易员的关键,其核心是凯利公式的应用。
- 财富增长公式
- 长期的复合增长率公式揭示了夏普比率才是驱动财富增长的核心引擎,而不仅仅是追求高收益率。
- 过高的风险(波动率)实际上会拖累长期的复合增长。
- 凯利公式的应用
- 对于一个单一策略,其最优杠杆率公式为:f* = μ / σ²(即期望超额收益率除以收益的方差)。收益期望越高,可用的杠杆越大;波动越大,则应使用越小的杠杆。
- 半凯利准则:由于现实市场存在“肥尾”现象,且参数估计存在误差,在实际操作中应将凯利公式计算出的最优杠杆减半使用,或者根据“历史最大回撤”来倒推并限制最大杠杆。
- 止损的辩证法
- 动量策略:必须设置严格的止损规则,或在交易信号反转时立即离场。
- 均值回归策略:慎用硬性止损。因为对于这类策略,价格偏离均值越远,其回归的预期力量反而越强,此时止损可能恰好在胜率最高的时候让你被迫离场。
总结:从入门到实践的五个步骤
- 定战略:我的定位是什么?是专注于短线做市,还是参与长线趋势跟踪?
- 找策略:我的策略逻辑是基于均值回归还是动量?我找到的资产配对是否具有统计上的协整关系?
- 验真伪:我的回测是否严谨?有没有无意中使用未来数据?是否考虑了退市股票的影响?交易成本扣除足够了吗?
- 搭系统:我选择半自动还是全自动交易?如何开设LLC来保护个人资产?
- 控风险:根据凯利公式,我的策略胜算几何?如果发生极端行情,我的仓位会爆仓吗?

量化交易是一个融合了金融、统计学和计算机科学的交叉领域,对于技术人而言,入门的过程本身就是一次极佳的系统性思维训练。如果你也对通过代码和模型理解市场感兴趣,不妨从这本《量化交易》开始,逐步搭建自己的知识体系。在云栈社区等开发者聚集地,你也能找到更多同行者,共同探讨策略、分享数据处理的技巧。
|