项目卡片
- 项目:AI Hedge Fund[1]
- 状态:v2026.5.14 / 59k Star / 活跃迭代中
- 一句话判断:一个教育向的 AI 模拟对冲基金,19 个投资大师 Agent 协同做决策,架构完整但不适合实盘
它在解决什么问题
AI Hedge Fund 做了一件事:用 LLM Agent 模拟一个对冲基金的分析团队。你给一串股票代码,十几个不同风格的“分析师”各自出报告,汇总到风控经理,最后由投资组合经理拍板。
项目的 README 反复强调:This is for educational purposes only, not intended for real trading。定位是概念验证和教学。
我一开始看到 59k Star 也想过:一个教育项目凭什么这么火?看完代码后理解了——它确实展示了一条完整的 AI 投资决策链路,而且源码全部开放。
19 个 Agent 各自扮演什么角色
项目把分析师分成两派。
名宿派——用真实投资大师的投资哲学当 system prompt,让 LLM 角色扮演:
- Warren Buffett(巴菲特):看护城河、ROE、自由现金流、内在价值
- Charlie Munger(芒格):只买好公司、合理价格
- Cathie Wood(Cathie Wood):押注颠覆式创新
- Michael Burry(Michael Burry):逆向投资、找被低估的标的
- Nassim Taleb(Taleb):尾部风险、杠铃策略、反脆弱
一共 13 位“投资大师”,每位有独立的 prompt 模板和数据分析逻辑。比如巴菲特的 agent 会从 Financial Datasets API 拉取 ROE、负债率、毛利率、股东权益、分红回购等数据,先做定量评分(护城河、管理层质量、定价权),再把结果喂给 LLM 做最终判断。
量化派——纯数值计算,不依赖 LLM 推理:
- Technical Analyst:趋势跟踪、均值回归、动量、波动率、统计套利五个子策略加权合成
- Fundamentals Analyst:财务指标分析
- Sentiment Analyst:市场情绪
- Valuation Analyst:估值模型
这两个派系并行跑完,结果统一汇总到 Risk Manager 和 Portfolio Manager。Risk Manager 按波动率和相关性动态调整每只股票的仓位上限;Portfolio Manager 综合所有信号做最终买卖决策,严格受风控约束。
谁适合用它,怎么用
三类用户:
1. 想理解 AI Agent 架构的开发者
这个项目是 LangGraph 的实战范例。19 个 Agent 组成一个有向无环图(DAG),从 start_node 并行分发给所有分析师,汇总到风控,最后到组合经理。State 在节点间传递,用 TypedDict 定义。
如果你在学 AI Agent 编排,这个项目比大多数教程有实际意义——因为它处理的是真实数据、有明确的业务目标。
2. 想了解量化投资流程的人
从数据获取(Financial Datasets API)→ 信号生成 → 风险管理 → 组合构建 → 回测验证,链路完整。代码里有现成的技术分析指标(EMA、RSI、Bollinger Bands、ADX、Hurst 指数)、估值模型(三阶段 DCF)、波动率仓位调整逻辑。
3. 想做实验或二次开发的人
上手很快。安装只需要 Poetry,最少一个 API key(OpenAI / Anthropic / DeepSeek / Groq 任选一个)加上 Financial Datasets API key。支持 Ollama 本地模型。
git clone https://github.com/virattt/ai-hedge-fund.git
cd ai-hedge-fund
cp .env.example .env # 填入 API key
poetry install
poetry run python src/main.py --ticker AAPL,MSFT,NVDA --model gpt-4.1
指定 --model 可以选择 LLM,不加则进入交互选择。Web 界面也有一套,适合不想碰终端的用户。回测同样一行搞定:
poetry run python src/backtester.py --ticker AAPL,MSFT,NVDA
它的边界在哪里
不能用来实盘交易。 项目在多处强调这一点,代码也确实不会发起任何真实交易。所有决策只是 JSON 输出。
Financial Datasets API 是唯一数据源。 这个 API 提供美股价格、财务指标、新闻、内部人交易等数据,但只覆盖美股日线频率。如果你关注 A 股、加密货币或更细粒度的数据,需要自己对接。
LLM 推理成本不低。 19 个 Agent 每个都可能调用一次 LLM,加上风控和组合经理,一次完整分析可能需要 20+ 次 LLM 调用。用 GPT-4.1 级别的模型,处理 3 只股票的单次成本大概在 2 之间,取决于 token 消耗量。Financial Datasets API 有免费额度,但超过后需要付费。用 Groq 或 Ollama 可以把 LLM 成本降到接近零,不过 Ollama 对硬件有要求(至少需要能跑 llama3 级别的模型)。
v2 正在重构。 当前主分支是“名宿 Agent”体系。v2 是一次彻底的量化重写——去掉角色扮演,换成信号 → 特征 → 组合优化 → 风控 → 执行的 pipeline,加入 CPCV 交叉验证、PBO 过拟合检测、Almgren-Chriss 市场冲击模型。目前标注为 WIP,尚未集成到主应用。
技术分析 Agent 是纯确定性的。 五个子策略(趋势、均值回归、动量、波动率、统计套利)用 Python 数值计算,加权合成信号。这部分不依赖 LLM,输出稳定可复现。反而是名宿 Agent 的输出会因为 LLM 的随机性产生波动。
支持的 LLM 和扩展性
项目支持 11 个 LLM 提供商:
| 类别 |
提供商 |
| 云端 |
OpenAI、Anthropic、Google Gemini、DeepSeek、Groq、xAI |
| 中国可用 |
DeepSeek、Kimi (Moonshot) |
| 自部署 |
Ollama、Azure OpenAI、OpenRouter |
| 俄罗斯 |
GigaChat |
每个 Agent 还可以绑定不同的 LLM 模型。比如你可以让巴菲特用 GPT-4.1、技术分析用 DeepSeek、风控用 Claude——在 Web 界面里按 Agent 配置。
这也是项目的实用价值之一:它展示了多 LLM 调度的工程实现,用 LangChain 的统一接口对接不同提供商,处理 JSON mode 不兼容、重试逻辑、结构化输出等实际工程问题。
值不值得关注
如果你是量化从业者,直接去看 v2 的代码——CPCV 验证、Almgren-Chriss 执行模型、Black-Litterman 组合优化这些才是正经的量化工程。v1 的角色扮演 Agent 更像是展示用途。
如果你是 AI 开发者,v1 是 LangGraph 多 Agent 编排的优秀范例——19 个 Agent 的 DAG 编排、共享状态传递、结构化 LLM 输出、Pydantic schema 校验、多提供商适配,这些工程实践能直接复用。
如果你想用它做投资参考,请记住它只是一个教学工具。19 个“大师”的分析质量完全取决于 LLM 的能力和 prompt 的设计,而且 Financial Datasets 的免费额度有限。把它当架构参考和学习材料更合理。
59k Star 背后是真实的需求——越来越多人想搞清楚 AI 在投资领域能做什么、不能做什么。这个项目给了一个可运行的答案,虽然远不是最终答案。
[1] AI Hedge Fund: https://github.com/virattt/ai-hedge-fund