找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4570

积分

0

好友

657

主题
发表于 1 小时前 | 查看: 3| 回复: 0

项目卡片

  • 项目:AI Hedge Fund[1]
  • 状态:v2026.5.14 / 59k Star / 活跃迭代中
  • 一句话判断:一个教育向的 AI 模拟对冲基金,19 个投资大师 Agent 协同做决策,架构完整但不适合实盘

它在解决什么问题

AI Hedge Fund 做了一件事:用 LLM Agent 模拟一个对冲基金的分析团队。你给一串股票代码,十几个不同风格的“分析师”各自出报告,汇总到风控经理,最后由投资组合经理拍板。

项目的 README 反复强调:This is for educational purposes only, not intended for real trading。定位是概念验证和教学。

我一开始看到 59k Star 也想过:一个教育项目凭什么这么火?看完代码后理解了——它确实展示了一条完整的 AI 投资决策链路,而且源码全部开放。

19 个 Agent 各自扮演什么角色

项目把分析师分成两派。

名宿派——用真实投资大师的投资哲学当 system prompt,让 LLM 角色扮演:

  • Warren Buffett(巴菲特):看护城河、ROE、自由现金流、内在价值
  • Charlie Munger(芒格):只买好公司、合理价格
  • Cathie Wood(Cathie Wood):押注颠覆式创新
  • Michael Burry(Michael Burry):逆向投资、找被低估的标的
  • Nassim Taleb(Taleb):尾部风险、杠铃策略、反脆弱

一共 13 位“投资大师”,每位有独立的 prompt 模板和数据分析逻辑。比如巴菲特的 agent 会从 Financial Datasets API 拉取 ROE、负债率、毛利率、股东权益、分红回购等数据,先做定量评分(护城河、管理层质量、定价权),再把结果喂给 LLM 做最终判断。

量化派——纯数值计算,不依赖 LLM 推理:

  • Technical Analyst:趋势跟踪、均值回归、动量、波动率、统计套利五个子策略加权合成
  • Fundamentals Analyst:财务指标分析
  • Sentiment Analyst:市场情绪
  • Valuation Analyst:估值模型

这两个派系并行跑完,结果统一汇总到 Risk ManagerPortfolio Manager。Risk Manager 按波动率和相关性动态调整每只股票的仓位上限;Portfolio Manager 综合所有信号做最终买卖决策,严格受风控约束。

谁适合用它,怎么用

三类用户

1. 想理解 AI Agent 架构的开发者

这个项目是 LangGraph 的实战范例。19 个 Agent 组成一个有向无环图(DAG),从 start_node 并行分发给所有分析师,汇总到风控,最后到组合经理。State 在节点间传递,用 TypedDict 定义。

如果你在学 AI Agent 编排,这个项目比大多数教程有实际意义——因为它处理的是真实数据、有明确的业务目标。

2. 想了解量化投资流程的人

从数据获取(Financial Datasets API)→ 信号生成 → 风险管理 → 组合构建 → 回测验证,链路完整。代码里有现成的技术分析指标(EMA、RSI、Bollinger Bands、ADX、Hurst 指数)、估值模型(三阶段 DCF)、波动率仓位调整逻辑。

3. 想做实验或二次开发的人

上手很快。安装只需要 Poetry,最少一个 API key(OpenAI / Anthropic / DeepSeek / Groq 任选一个)加上 Financial Datasets API key。支持 Ollama 本地模型。

git clone https://github.com/virattt/ai-hedge-fund.git
cd ai-hedge-fund
cp .env.example .env  # 填入 API key
poetry install
poetry run python src/main.py --ticker AAPL,MSFT,NVDA --model gpt-4.1

指定 --model 可以选择 LLM,不加则进入交互选择。Web 界面也有一套,适合不想碰终端的用户。回测同样一行搞定:

poetry run python src/backtester.py --ticker AAPL,MSFT,NVDA

它的边界在哪里

不能用来实盘交易。 项目在多处强调这一点,代码也确实不会发起任何真实交易。所有决策只是 JSON 输出。

Financial Datasets API 是唯一数据源。 这个 API 提供美股价格、财务指标、新闻、内部人交易等数据,但只覆盖美股日线频率。如果你关注 A 股、加密货币或更细粒度的数据,需要自己对接。

LLM 推理成本不低。 19 个 Agent 每个都可能调用一次 LLM,加上风控和组合经理,一次完整分析可能需要 20+ 次 LLM 调用。用 GPT-4.1 级别的模型,处理 3 只股票的单次成本大概在 2 之间,取决于 token 消耗量。Financial Datasets API 有免费额度,但超过后需要付费。用 Groq 或 Ollama 可以把 LLM 成本降到接近零,不过 Ollama 对硬件有要求(至少需要能跑 llama3 级别的模型)。

v2 正在重构。 当前主分支是“名宿 Agent”体系。v2 是一次彻底的量化重写——去掉角色扮演,换成信号 → 特征 → 组合优化 → 风控 → 执行的 pipeline,加入 CPCV 交叉验证、PBO 过拟合检测、Almgren-Chriss 市场冲击模型。目前标注为 WIP,尚未集成到主应用。

技术分析 Agent 是纯确定性的。 五个子策略(趋势、均值回归、动量、波动率、统计套利)用 Python 数值计算,加权合成信号。这部分不依赖 LLM,输出稳定可复现。反而是名宿 Agent 的输出会因为 LLM 的随机性产生波动。

支持的 LLM 和扩展性

项目支持 11 个 LLM 提供商:

类别 提供商
云端 OpenAI、Anthropic、Google Gemini、DeepSeek、Groq、xAI
中国可用 DeepSeek、Kimi (Moonshot)
自部署 Ollama、Azure OpenAI、OpenRouter
俄罗斯 GigaChat

每个 Agent 还可以绑定不同的 LLM 模型。比如你可以让巴菲特用 GPT-4.1、技术分析用 DeepSeek、风控用 Claude——在 Web 界面里按 Agent 配置。

这也是项目的实用价值之一:它展示了多 LLM 调度的工程实现,用 LangChain 的统一接口对接不同提供商,处理 JSON mode 不兼容、重试逻辑、结构化输出等实际工程问题。

值不值得关注

如果你是量化从业者,直接去看 v2 的代码——CPCV 验证、Almgren-Chriss 执行模型、Black-Litterman 组合优化这些才是正经的量化工程。v1 的角色扮演 Agent 更像是展示用途。

如果你是 AI 开发者,v1 是 LangGraph 多 Agent 编排的优秀范例——19 个 Agent 的 DAG 编排、共享状态传递、结构化 LLM 输出、Pydantic schema 校验、多提供商适配,这些工程实践能直接复用。

如果你想用它做投资参考,请记住它只是一个教学工具。19 个“大师”的分析质量完全取决于 LLM 的能力和 prompt 的设计,而且 Financial Datasets 的免费额度有限。把它当架构参考和学习材料更合理。

59k Star 背后是真实的需求——越来越多人想搞清楚 AI 在投资领域能做什么、不能做什么。这个项目给了一个可运行的答案,虽然远不是最终答案。

[1] AI Hedge Fund: https://github.com/virattt/ai-hedge-fund




上一篇:职场避坑:和领导独处时,这4句话烂在肚子里也别说
下一篇:Spring Boot定时任务生产避坑与调优指南
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-5-25 23:21 , Processed in 0.753276 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表