本帖最后由 alphaFind 于 2026-1-23 19:54 编辑
做量化研究,真正费时的经常不是写因子,而是把信息从不同入口搬到同一张桌子上:价格、三表、估值指标、公告/新闻、SEC 10-K/10-Q……来回对齐口径、补缺、再改一轮结论,时间就这么被吃掉了。
我是《alphaFind》。今天分享一个偏“研究助理”取向的开源项目 Dexter。它不是交易系统,不碰下单,但把研究链路里最基础也最耗人的两件事做扎实了:查数据和留痕。
1)Dexter 在做什么:让研究问题可执行、可复盘
Dexter 的工作方式很直白:你丢一个自然语言问题,它把问题拆成需要的数据与步骤,调用工具把数据拉回来,再汇总成答案。
对我来说,它最有价值的是两点:
- 过程留痕:每次工具调用的入参、结果都会写入
.dexter/scratchpad/*.jsonl。研究不是“一锤子买卖”,能复盘、能追责、能复用,这点很关键。
- 上下文不爆炸:循环过程中不会把“全量数据”都塞给模型,而是把每次工具结果压成一句摘要,再推进下一轮(context compaction)。最后出答案时再把完整数据拿出来用。
做因子研究时,我们追求的就是这个感觉:结论跑得动,过程说得清。
2)技术栈与结构:TypeScript + Bun 的终端研究工具
Dexter 是一个 TypeScript + Bun 的 CLI 应用,终端界面用 Ink + React,模型侧用 LangChain 来做工具调用。
如果你想快速读懂它,建议按这几条主线看:
- 交互入口:
src/index.tsx → src/cli.tsx(输入、历史记录、调试面板、模型选择、中断)
- Agent 循环:
src/agent/agent.ts(迭代、执行工具、生成最终回答)
- 提示词策略:
src/agent/prompts.ts(system prompt / iteration prompt / final answer prompt / tool summary prompt)
- 工具注册:
src/tools/registry.ts(默认提供 financial_search;如果配了 Tavily 才启用 web_search)
这类项目很多,但 Dexter 的代码读起来比较“工程味”:职责清楚,关键路径短,便于你把它拆下来接到自己的研究流程里。后面如果云栈社区要做“研究工作台模板”,这种结构就很适合作为底座。
3)我觉得它做对了的 3 件事
A. 金融数据走专用通道
在 system prompt 里明确规定:涉及价格、财报、指标、filings 等金融数据,优先走 financial_search;只有非结构化信息才用 web_search(可选)。这能减少很多“搜索噪声”。
B. financial_search 不是一个工具,是一层路由
在 src/tools/finance/financial-search.ts 里,Dexter 把一组金融子工具(价格、三表、财务指标快照/历史、分析师预期、SEC filings 元数据与条目、新闻、内幕交易、分部收入、crypto 等)统一交给模型,让模型先决定该调哪些子工具;随后并行执行 tool calls,把结果合并成结构化 JSON 返回。
这其实很像我们做数据平台时的“统一入口 + 路由分发”,只是把路由逻辑交给了模型的 tool calling。
C. Scratchpad 做单一事实来源
循环阶段用摘要推进,最终回答阶段再加载全量结果。省上下文,也保留审计和复盘能力。研究写得越久,你越会觉得“可追溯”比“看起来聪明”更重要。
4)在 alpha / 因子研究里怎么用它(务实一点)
Dexter 不负责交易执行,所以别指望它直接跑高频链路;但在“研究生产力”上,它能放在策略链路的前半段:
- 因子假设 0→1:把一个模糊想法拆成要拉的数据项与对比维度
- 特征工程素材收集:价格序列 + 三表 + 估值指标 + 预期/内幕交易等,一次性集中拉取
- 复盘与协作:用 scratchpad 回看每一步“依据是什么”,方便团队复用研究过程
如果你的研究流程经常卡在“到处查、到处抄、到处对口径”,Dexter 这套思路值得试试。
配套资源
- Github 仓库:
github.com/virattt/dexter
- 数据 API:
financialdatasets.ai
- Rust 教程:
https://yunpan.plus/f/57
- TypeScript 教程:
https://yunpan.plus/f/18
alphaFind 的一句话结论
Dexter 值得关注,不是因为它“会回答”,而是它把金融研究里最难工程化的部分——工具路由、过程留痕、上下文压缩——做成了一条清晰的工程链路。
关注《alphaFind》,我会继续从 Faster Alpha Discovery 的角度,拆更多能真正落到研究与因子链路里的开源项目。
标签:#Dexter #Github #量化研究 #因子研究 #数据工程 #AIagent #金融工程 #Bun #TypeScript
来自圈子: alphaFind |