去年12月,我创建了一套「月度复盘 Skill」,能自动聚合周复盘、番茄钟数据和年度目标,一键生成结构化报告。它解决了自动化的问题,但生成的内容却像一份平淡的工作摘要,缺乏真正的洞察力。经过三个月的实际使用,我决定对它进行一次大规模升级。
这次升级的核心,是从简单的「信息堆砌」转变为深度的「认知交叉验证」。
问题出在哪里?
在上一版(v1.0)中,AI 能正确地查找文档、调用脚本并按格式输出。但连续使用后,我发现了五个核心痛点:
- 内容是周复盘的堆砌,不是月复盘:AI 只是把四周的文字拼在一起,缺乏月度维度的提炼。
- 只有「我说的」,没有「我做的」:周复盘是我筛选后的主观认知,而原始行为数据(如 DailyLog)中未经修饰的事实却被忽略了。
- 太正经,缺少「一语点醒」的力量:分析像工作汇报(“本月编程番茄钟减少 17.1%,建议关注”),正确但无用。
- 缺少外部参照系:所有分析都在自己的数据里打转,不知道行业动向和市场趋势。
- 想法来了又走,没人追踪:许多在 DailyLog 里反复出现的想法(如“推进视频方向”),在复盘中无人问津,月复一月地搁浅。
这些问题共同指向一个根源:v1.0 的数据源太单一(只有周复盘),分析方式太表面(只做汇总),完全缺乏交叉验证的机制。
升级思路:双线印证 + 第三视角
解决问题的核心思路很简单:不要把所有鸡蛋放在「周复盘」这一个篮子里。
我将数据源拆分为两条独立的线索,并引入一个独立的“审计员”视角进行交叉验证:
- Line A(自上而下,认知线):年度目标 → 上月复盘 → 周复盘 → 月度总结。这条线承载的是我经过思考和筛选后的主观认知。
- Line B(自下而上,行为线):从原始 DailyLog 笔记中提取全月的未经过滤的行为数据——你实际做了什么、花了多少时间、关注了什么。
- 第三视角(交叉审计):让 AI 扮演独立观察者,将 Line A 和 Line B 进行比对。你说重点在编程,但数据显示探索时间最多?这就是认知偏差。DailyLog 里反复提“视频方向”,周复盘却只字未提?这就是遗漏盲区。
这个架构很像财务审计中的“双向核查”,两边对不上,问题就暴露了。

下面,我们按模块拆解每个升级点的具体实现和效果。
模块一:用行为数据打破认知茧房
对应问题1和2:内容堆砌;只有“我说的”,没有“我做的”。
解决思路:
抓取原始的 DailyLog 数据,与周复盘内容相互印证。
我新增了一个 Python 脚本 collect_dailylogs.py,它遍历指定月份的所有日记文件,自动生成一份包含9个维度的行为报告,包括时间分布、番茄钟统计、关注点迁移(按上/中/下旬分析标签频次变化)等。
前后对比:
-
v1.0 的「阻碍与反思」:
编程时间 29 个番茄,本月投入 流量日记 项目的重构修复。创作 20 个番茄,完成三篇公众号文章。
(这只是信息摘要,不是复盘)
-
v2.0 的「阻碍与反思」:
宣传依然是死穴:MP13 被少数派推荐首页是真正的里程碑,但这更多是内容质量的结果,而非运营策略的成功。流量日记 开发了快半年,社区曝光依然是 0。
(有判断、有归因、有行动方向)
差别在于,v2.0 不仅看到了周复盘里“我说做了什么”,更洞察了 DailyLog 里“我实际在做什么、没做什么”。
模块二:让 AI「说人话」的第三视角
对应问题3:分析太正经,像工作汇报。
解决思路:
如果只是让 AI 干巴巴地列出差异,结果必然无聊。我的解法是给 AI 设定一个鲜明的人格角色。
我创造了“傲天”——一个融合了鲁迅的犀利、王朔的痞气、李诞的幽默和老罗的梗密度的“毒舌损友兼贴身军师”。核心原则是:骂归骂,最后一句一定是建设性的。
“傲天有话说”并非随意吐槽,而是基于五项严密的交叉比对原则展开的结构化分析:
- 认知 vs 行为偏差:我说的重点 vs 时间实际流向。
- 遗漏发现:DailyLog 高频但周复盘缺失的内容。
- 想法执行率:从“说了”到“做了”的转化追踪。
- 状态信号识别:从记录密度、空白天数推断当月状态。
- 趋势预警:识别连续多月出现的结构性模式。

前后对比:
- v1.0:
本月编程番茄钟 29 个,环比减少 17.1%,建议关注。
- v2.0 的「傲天有话说」:
你说“快要收尾”的时候,订阅功能才刚刚开始实现,我知道这是人类的乐观主义,无需追责。但有一个数字必须正视:本月 创作番茄只有 2 个,-88.9%,比 9 月的 18 个蒸发了 16 个番茄的时间。你在 9 月用来发 4 篇内容的精力,10 月全去喂代码了。代码确实喂得不错,35 个编程番茄是近几个月最高,但兄弟,你的公众号和小红书不会因为你的 Sendable 协议写得好而自动更新。
数据真实,结论准确,语气带刺却引人深思,“人类的乐观主义”这种吐槽很有硅基生物的味道。
模块三:引入外部参照系
对应问题4:所有分析都在自己的数据里打转。
解决思路:
v2.0 新增了「外部情报收集」步骤。AI 在生成复盘前,会根据本月活跃领域,从 GitHub Trending、Hacker News、少数派等2-3个最相关的公开信息源进行定向搜索。
实际效果:
AI 的洞察因此具备了行业视角。例如,在一次复盘中它指出:
三篇文章均属于“个人实践叙事”类型,与账号定位高度契合。但有一个值得关注的盲区:本月最大 AI 行业热点是 Claude Code 源码意外泄露(HN #1 热门),这与该账号核心读者(关注 AI 工具和效率工作流的用户)需求完全重叠,但全月未有任何对应内容。
模块四:跨月想法追踪与僵尸想法识别
对应问题5:想法来了又走,没人追踪。
解决思路:
双线印证解决了单月内的偏差,但无法发现跨月的“系统性不作为”。我称那些月月提起、从不行动的念头为 「僵尸想法」。
v2.0 将对比窗口从“上月”扩展到“近三月”。脚本自动提取过去三期复盘中的“种子想法”,构建时间轴追踪表。连续两个月以上出现但无任何行动记录的,被标注为⚠️僵尸想法,并在第三视角中被点名。
实际效果:
在复盘中,僵尸想法无处遁形:
AgentNexus MVP:连续两月完全零进展,目标仍挂在周计划列表里。
视频方向决策:仍未决策,Mac 效率周刊连续两月零产出。
识别之后,行动就清晰了:要么安排具体执行日,要么直接删除,释放注意力。

模块五:用分析框架引导 AI 视角
解决思路:
v1.0 的原则太通用。v2.0 增加了三个针对我主要领域的结构化分析框架:
- Content-Market Fit:评估内容创作与平台生态的匹配度。
- Build in Public 评估三角:评估产品进度、社区曝光、用户反馈闭环的健康度。
- 时间投资 ROI 矩阵:按杠杆效应和紧急程度分类时间,识别分配结构问题。
实际效果:
框架让分析变得尖锐。例如,用“Build in Public 三角”分析我的独立开发项目:
产品进度 ✅:有实质功能完成。社区曝光 ❌:零公开分享。连续 5 个月,没有在任何开发者社区分享进度,「隐形开发者」状态终月未破。用户反馈 ❌。三角严重失衡。
如果没有这个框架,AI 可能只会说“本月完成了若干功能开发”,而错过真正致命的问题。
模块六:Subagent 架构与工程优化
解决思路:
双线印证的数据量巨大,全塞进一个上下文会导致AI在后续分析时记忆模糊。v2.0 的解法是将任务拆分为独立的 Subagent,每个都在干净的上下文中进行深度分析:
- 主编排器:只负责协调与组装,不做分析。
- Subagent A (Line A):分析结构化文档、番茄钟数据、外部情报。
- Subagent B (Line B):分析原始行为数据和周复盘(仅用于遗漏对比)。
- Subagent C (第三视角):综合分析 A 和 B 的产出,以“傲天”人格进行交叉审计。

工程层面的三个关键优化:
- 脚本直写文件:让数据收集脚本的输出直接写入临时文件,避免编排器无意义地加载大量输出内容,极大节省上下文。
- 跨月反馈闭环:在模板末尾新增「给傲天的留言」章节。我的主观反馈会被自动提取,作为下月分析的输入,形成人机共识的增强循环。
- 使用绝对路径:在涉及文件写入的 Agent 任务中,永远使用基于根目录变量(如
$VAULT)的绝对路径,避免因工作目录不可预测导致的数据丢失。
什么部分是 AI 做的,什么部分是我做的?
- 架构设计是我做的:双线印证、第三视角角色、分析框架、追踪规则,这些核心洞察和判断来自人的思考。
- Skill 文件编写是 AI 辅助的:我用自然语言描述思路,Claude 帮我转化为结构化的 SKILL.md 和参考文件,但每一步我都审核修改。
- 每次复盘执行是 AI 做的:输入指令,AI 自动走完9步流程,输出完整文档。
- 复盘后决策是我做的:AI 指出“视频方向是僵尸想法”,但砍掉还是保留,由我决定。
这就是 Skill 的价值:它不是替代你思考,而是将你的思考方式产品化、固化下来,让 AI 每次都按这个高质量的方式执行。
小结
从 v1.0 到 v2.0,升级可归纳为五个方向:
- 数据从单线到双线:用原始行为数据对主观认知进行交叉验证。
- 分析从汇总到交叉:引入第三视角、分析框架和外部情报,让 AI 带着“视角”工作。
- 追踪从单月到跨月:通过多期数据对比识别“僵尸想法”。
- 执行从单体到分布:用 Subagent 架构隔离上下文,保障每个分析任务的深度。
- 迭代从单向到闭环:建立跨月反馈机制,让 Skill 在实践中自我进化。
这套方法不仅适用于月度复盘,任何涉及多信号源、交叉验证、持续迭代的分析任务,如季度 Review、项目复盘、选题分析,其底层逻辑都是相通的。关键在于,你想得越清楚,AI 就执行得越稳定。如果你对这类将复杂思考流程产品化的实践感兴趣,欢迎来 云栈社区 交流探讨。