用 AI 写代码、做分析,最怕的就是它一条路走到黑。你让它写个函数,它可能一开始方向就错了,但还继续往下写,最后给你一个完全不对的结果。
Tree of Thoughts (ToT,思维树) 就是解决这个问题的。它让 AI 不再线性思考,而是像人一样,遇到问题先想几个方案,评估一下哪个靠谱,不行就换条路。
1. ToT 是什么?
ToT 是普林斯顿大学和 Google DeepMind 在 2023 年提出的一个方法。核心思想很简单:
ToT = 思维链 (CoT) + 搜索算法 + 自我评估
传统方式下,AI 是这样思考的:
问题 → 步骤1 → 步骤2 → 步骤3 → 答案
ToT 下,AI 是这样思考的:
问题
├─ 方案A → 评估 → 继续/放弃
├─ 方案B → 评估 → 继续/放弃
└─ 方案C → 评估 → 继续/放弃
如果方案A走到一半发现不对,AI 会回溯到分叉点,尝试方案B或C。
2. ToT vs CoT:有什么区别?
| 特性 |
思维链 (CoT) |
思维树 (ToT) |
| 思考方式 |
一条线走到底 |
多个分支,可以回溯 |
| 容错性 |
中间错一步,后面全错 |
发现错了可以换分支 |
| 适用场景 |
简单推理、步骤明确的任务 |
复杂问题、有多种可能性的任务 |
| 成本 |
低(一次推理) |
高(多次生成和评估) |
| 速度 |
快 |
慢 |
💡 提示:什么时候用 ToT?
- 问题有多种可能的解法
- 需要探索不同路径
- 容错率低,不能出错
- 有足够的时间和 Token 预算
3. ToT 的四个核心组件
要理解 ToT,需要知道这四个部分:
3.1 思维分解(Thought Decomposition)
把大问题拆成小步骤。
例子:写一篇技术文章
传统方式:直接开始写。
ToT 方式:
- 确定主题和受众
- 设计文章结构(大纲)
- 写每个章节
- 检查逻辑连贯性
每一步都可以有多个选择。
3.2 思维生成(Thought Generator)
在每个节点,生成多个可能的方案。
例子:设计文章大纲
- 方案A:按时间线组织(从历史到现状)
- 方案B:按问题-解决方案组织
- 方案C:按技术深度组织(从浅到深)
3.3 状态评估(State Evaluator)
评估每个方案的潜力,通常分为三类:
- Sure:这个方案很有希望,继续
- Maybe:不确定,但可以试试
- Impossible:这个方向走不通,放弃
3.4 搜索策略(Search Strategy)
决定怎么探索这些分支:
- 广度优先 (BFS):每层选几个最好的,同时往下探索
- 深度优先 (DFS):先走完一条路,不行再回溯
在实际的算法和搜索策略选择中,对于复杂问题,通常先用 BFS 快速排除明显不对的方向,再用 DFS 深入探索有希望的分支。
4. 优缺点:什么时候值得用?
优点
- 能纠错:发现方向错了可以换路
- 全局思考:不会因为第一步选错就全盘皆输
- 准确率高:在 24 点游戏测试中,GPT-4 用 CoT 只有 4% 成功率,用 ToT 达到 74%
缺点
- 慢:要生成多个方案、多次评估,响应时间明显变长
- 贵:Token 消耗可能是普通对话的 5-10 倍
- 实现复杂:通常需要写代码或使用专门的框架,单次对话很难完美模拟
⚠️ 警告:成本提醒
如果只是简单问题,用 ToT 就是杀鸡用牛刀。只有在问题足够复杂、值得花这个成本的时候才用。
5. 实战:怎么在对话中用 ToT?
虽然论文里用了复杂的系统,但日常对话中可以用简化版。下面是一个实用的模板:
假设你是一个由三名专家组成的思维委员会。
目标:[描述你的复杂任务]
步骤指导:
1. 第一阶段,每个人独立提出 3 个初步想法,并说明理由。
2. 第二阶段,评估这 9 个想法。指出哪些最有前途,哪些有逻辑漏洞。
3. 第三阶段,选择最优秀的 2 个想法进行深入推演。
4. 第四阶段,尝试结合两者的优点,给出最终方案。如果有逻辑僵局,回溯到第二阶段重新选择。
假设例子:设计一个用户登录系统
第一阶段:三个专家各自提出方案
专家A(安全专家):
- 方案1:使用 JWT + Refresh Token,安全性高
- 方案2:使用 Session + Redis,传统但稳定
- 方案3:OAuth 2.0 第三方登录,用户体验好
专家B(性能专家):
- 方案1:Redis 缓存用户信息,减少数据库查询
- 方案2:使用 CDN 加速静态资源
- 方案3:数据库读写分离,提高并发能力
专家C(产品专家):
- 方案1:支持手机号、邮箱、微信三种登录方式
- 方案2:记住登录状态 30 天
- 方案3:首次登录引导完善资料
第二阶段:评估
最有前途的组合:
- 安全:JWT + Refresh Token(方案A1)
- 性能:Redis 缓存(方案B1)
- 产品:三种登录方式(方案C1)
有问题的方案:
- 方案B3(读写分离):对于登录系统来说过度设计
- 方案C2(30天记住):安全风险较高
第三阶段:深入推演
选择方案A1 + B1 + C1,深入设计:
- JWT 过期时间:15 分钟
- Refresh Token 过期时间:7 天
- Redis 缓存用户信息,TTL 1 小时
- 支持手机号、邮箱、微信登录,统一用户体系
第四阶段:最终方案
结合所有优点,给出完整的技术方案和实现步骤。
6. 具体案例:2026年,如何从前端成为AI工程师
在 Cursor 或者其他 AI 工具中输入如下提示词:

得出结果如下:





这个例子展示了 ToT 的核心价值:当一条路走不通时,可以回溯尝试其他路径,而不是卡死在一个方向上。这种方法在人工智能的复杂学习和规划问题中尤其有用。
7. 案例:写小说的分支剧情
假设你要写一部悬疑小说,主角在第一章结尾发现了一个关键线索。接下来怎么写?
传统方式:直接写第二章,可能后面发现逻辑不通。
ToT 方式:
思维分解:
- 第一章结尾:主角发现凶手留下的物证
- 第二章:主角如何反应?
- 第三章:这个反应会导致什么结果?
生成多个分支:
分支A:主角报警
- 评估:符合常理,但剧情会变得简单
- 后续:警察介入,主角变成配角
- 评分:逻辑性 ⭐⭐⭐⭐⭐,悬念 ⭐⭐
分支B:主角独自调查
- 评估:增加悬念,但需要解释为什么不报警
- 后续:主角深入危险,发现更多秘密
- 评分:逻辑性 ⭐⭐⭐,悬念 ⭐⭐⭐⭐⭐
分支C:主角告诉朋友
- 评估:可以增加角色互动,但朋友可能不可靠
- 后续:朋友可能是内鬼,增加反转
- 评分:逻辑性 ⭐⭐⭐⭐,悬念 ⭐⭐⭐⭐
评估和选择:
如果要写悬疑小说,分支B(独自调查)悬念最强,但需要补充合理的动机(比如主角怀疑警察内部有内鬼)。
如果要写推理小说,分支A(报警)更符合逻辑,但需要设计更复杂的案件来保持悬念。
最终选择: 结合分支B和C
- 主角选择独自调查(增加悬念)
- 但告诉了一个信任的朋友(增加角色互动)
- 后续揭示这个朋友其实不可靠(反转)
这样既保证了逻辑性,又增加了悬念和反转。
8. 2026年的新选择:AoT 和 GoT
ToT 虽然强大,但成本高。现在又提出了两个改进版本:
AoT (Algorithm of Thoughts)
核心思想:在一个 Token 序列内模拟搜索过程,不需要多次调用模型。
优势:成本大幅降低(可能是 ToT 的 1/5)
适用场景:问题相对简单,不需要太深的搜索
GoT (Graph of Thoughts)
核心思想:超越树结构,允许思维节点之间互相连接、合并、形成回环。
优势:可以处理更复杂的问题,比如需要多个思维路径合并的情况
适用场景:需要综合多个领域知识的问题
[!info] 选择建议
- 简单问题:用 CoT
- 中等复杂:用 ToT 或 AoT
- 非常复杂:用 GoT
9. 什么时候该用 ToT?
总结一下,这些情况值得用 ToT:
- 问题有多种可能的解法,不确定哪个最好
- 容错率低,不能出错(比如写关键代码、做重要决策)
- 需要探索不同路径,而不是一条路走到底
- 有足够的时间和 Token 预算
这些情况不需要用 ToT:
- 问题很简单,步骤明确(比如格式化代码、翻译文本)
- 时间紧迫,需要快速得到结果
- Token 预算有限
- 问题只有唯一解,不需要探索
总结
ToT 的核心价值是让 AI 能够回溯和纠错,而不是一条路走到黑。对于复杂问题,这是一个强大的工具,但也要注意成本和复杂度。
记住:不是所有问题都需要 ToT。先用简单方法试试,不行再用 ToT。
💡 实践建议
- 从小问题开始练习,熟悉 ToT 的思维模式
- 在实际项目中,先用 CoT 快速验证想法,复杂部分再用 ToT
- 关注 Token 消耗,如果成本太高,考虑用 AoT 替代
掌握像 ToT 这样的高级 Prompt 工程技术,能显著提升你解决复杂问题的能力。如果你想深入探索更多 Prompt 技巧、AI 应用案例或与同行交流,欢迎来 云栈社区 的对应板块一起讨论。