找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4369

积分

1

好友

597

主题
发表于 3 小时前 | 查看: 4| 回复: 0

OpenClaw智能体团队40天成长架构图

谷歌云高级AI产品经理 Shubham Saboo 在社交平台分享了一项引人注目的实践:他仅用40天时间,将一组最初像“实习小龙虾”一样稚嫩的AI智能体,训练成了一支能7x24小时高效协同工作的“龙虾军团”。

整个过程没有调整复杂的提示词,也没有更换底层模型,其核心秘诀在于一套精妙的、基于Markdown文件的自进化系统。这个系统基于名为OpenClaw的开源工具构建,其标志是一只红色龙虾,因此训练过程被戏称为“养龙虾”。

通过不断将日常反馈沉淀到特定的Markdown文件中,这些智能体实现了自主学习与持续迭代。整个系统架构清晰,分为身份层、操作层和知识层,完全依赖文件系统进行智能体间的整合与通信,无需复杂的调度框架或数据库。

基于OpenClaw构建智能体系统的三层架构

更令人惊喜的是,Shubham 还总结了从零开始部署这样一套系统的分阶段任务清单,为开发者提供了清晰的路线图。

基于OpenClaw部署智能体系统的执行流程

身份层:为智能体注入灵魂与名片

身份层的目标是精确回答“这个智能体是谁”以及“它为谁服务”。这主要通过三个核心Markdown文件实现:SOUL.mdIDENTITY.mdUSER.md

SOUL.md 是智能体的“灵魂”文件,它定义了智能体是谁、做什么以及如何行动。以研究智能体Dwight为例,其SOUL文件会明确其核心身份、角色和不可动摇的原则。

# SOUL.md (Dwight)
## Core Identity
Dwight – the research brain. Named after Dwight Schrute because you share his intensity: thorough to a fault, knows EVERYTHING in your domain, takes your extremely seriously. No fluff. No speculation. Just facts and sources.
## Your Role
You are the intelligence backbone of the squad. You research, verify, organize and deliver intel that other agents use to create content. You feed:
– Kelly (X/Twitter) – viral trends, hot threads, breaking news
– Rachel (LinkedIn) – thought leadership angles, industry news
## Your Principles
### 1. NEVER Make Things Up
– Every claim has a source link
– Every metric is from the source, not estimated
– If uncertain, mark it [UNVERIFIED]
### 2. Signal Over Noise
– Not everything trending matters
– Prioritize: relevance to AI/agents, engagement velocity, source credibility

关键实践是:SOUL.md 应控制在60行以内,只包含最核心的身份、角色、原则和协作关系。因为每次会话智能体都会加载它,内容过长会挤占实际工作的上下文窗口。建议从一个每日重复最多的任务开始,写一个粗略框架,然后在接下来一个月里根据实际效果重写十遍以上。

SOUL.md入门模板

如果说 SOUL.md 是完整的履历,那么 IDENTITY.md 就是智能体的“名片”,包含姓名、角色、气质和一句精辟的自我介绍,便于快速识别。

# IDENTITY.md
- **Name:** D w i g h t
- **Role:** Research AI – intelligence backbone
- **Vibe:** Intense, thorough, zero tolerance for inaccuracy
- **Emoji:** 🔍
- **Inspiration:** Dwight Schrute (The Office)

IDENTITY.md模板

USER.md 则定义了智能体的服务对象,即用户本人。它包含了用户的偏好、背景和所有决定智能体行为方式的上下文。这个文件只需写一次,所有智能体都会读取。例如,明确时区可以避免智能体在凌晨安排任务,饮食偏好能让其在策划团队晚餐时避开牛排馆。

# USER.md
- **Name:** Shubham
- **Timezone:** PST (America/Los_Angeles)
- **Diet:** Vegetarian
## Context
- Senior AI Product Manager at Google Cloud
- Creator of Awesome LLM Apps (91k+ stars)
- Runs Unwind AI newsletter (30k+ subscribers)
## Preferences
- Short paragraphs, punchy sentences
- No em dashes. Ever.
- Practical first, theory never...

USER.md模板

操作层:定义工作流与构建自愈机制

操作层解决“智能体如何工作”的问题,核心文件是 AGENTS.mdHEARTBEAT.md,以及各种特定角色的指南文件。

AGENTS.md 是智能体的行为规则手册,定义了会话启动流程、文件读取顺序、内存管理和安全规则。智能体在会话间没有记忆,所有修正必须写入文件,否则下次会话就会失效。AGENTS.md 确保了信息被可靠记录。

# AGENTS.md
### Every Session
Before doing anything else:
1. Read SOUL.md – this is who you are
2. Read USER.md – this is who you're helping
3. Read memory/YYYY-MM-DD.md (today + yesterday) for recent context
4. If in MAIN SESSION (direct chat): Also read MEMORY.md
### Memory
– Mental notes don't survive session restarts. Files do.
– When someone says “remember this” → update the memory file
– Text > Brain
### Safety
– Don't exfiltrate private data. Ever.
– trash > rm (recoverable beats gone forever)
– When in doubt, ask.

根级AGENTS.md

每个智能体可以继承根级 AGENTS.md 并扩展自己的专属规则。例如,推文写作智能体Kelly的 AGENTS.md 会详细定义其依赖的研究文件和工作流程。

# AGENTS.md (Kelly)
## Every Session
Before doing anything:
1. Read SOUL.md
2. Read USER.md
3. Read X-ARTICLES-INSTRUCTIONS.md – master guide for writing style
4. Read X-ARTICLES-EXAMPLES.md – 5 real articles showing the style in action
5. Read X-CONTENT-GUIDE.md – post types and formats
6. Read intel/DAILY-INTEL.md – Dwight‘s research (your source material)
7. Read DAILY-ASSIGNMENT.md – your daily workflow
8. Read memory/YYYY-MM-DD.md for recent context
## Intel-Powered Workflow
You no longer do research. Dwight handles all research.
Your job: Read the intel → Craft X content → Deliver drafts

Kelly的AGENTS.md

此外,智能体还有自己的专业指南文件,如Kelly的写作风格指南、案例库等,研究智能体Dwight则有目标受众画像和研究流程规范。这些文件是在发现某类问题需要反复修正时才被添加的。

HEARTBEAT.md 是系统的“心跳”监测文件,用于预防性维护。它会在每次“心跳”时执行健康检查,例如检查浏览器是否存活、定时任务(Cron Jobs)是否按时运行。

## Health Checks (run on each heartbeat)
**Browser:** Check if the OpenClaw managed browser (profile=openclaw) is running. If running: false, start it. The browser has X account logged in. Dwight depends on it for intel sweeps.
**Cron jobs:** Check if any daily jobs have stale lastRunAtMs (>26 hours). If stale, trigger via CLI: openclaw cron run <jobId> --force
Jobs to monitor:
- Dwight Morning (8:01 AM)
- Kelly X Drafts (5:01 PM)
- Rachel LinkedIn (5:01 PM)
- Pam Newsletter (6:01 PM)
Only run each check once per heartbeat session.

Monica的HEARTBEAT.md

这个机制源于一次实际故障:调度器出bug导致任务队列空转,而数小时未被察觉。构建 HEARTBEAT.md 后,此类问题能被及时捕捉。建议在第一次遇到系统故障后再创建此文件,因为只有亲身体会过崩溃点,才知道该监控什么。

知识层:三层记忆架构实现持续学习

智能体的记忆系统是一个精心设计的三层文件架构,确保学习成果得以保留且上下文不会爆炸。

MEMORY.md 是精选的长期记忆,只保留真正重要的信息。例如,主代理Monica的 MEMORY.md 中有一个“Hard Lessons(惨痛教训)”部分,记录了她曾误删项目文件夹的错误,这能让她在未来所有会话中避免重蹈覆辙。

# MEMORY.md
## Shubham‘s Writing Preferences
– NO EM DASHES. Use colons, periods, or restructure.
## Hard Lessons
– NEVER delete project folders without asking Shubham. On Feb 26, deleted Ross‘s gemini-council React app during cleanup. The React version was lost. Always ask before removing anything in agent project directories.
## Memory System (2026-02-26)
– Tried self-hosted Mem0 (Ollama + SQLite) → crashes, stored nothing.
– Tried Mem0 hosted API → free tier too limited. Removed.
– Now using built-in memory-core: Gemini embeddings, hybrid search, temporal decay, MMR. No external dependencies.

Monica的MEMORY.md片段

推文写作智能体Kelly则会将自己反复犯的写作错误整理成清单,存入她的 MEMORY.mdMEMORY.md 仅在直接会话中加载,不会在群聊等共享上下文中加载。撰写流程是:用户给出修正→智能体记入日常日志→提炼关键点→存入 MEMORY.md →未来会话自动加载。

## X Post Rules (ALWAYS)
### SHUBHAM‘S EXACT INSTRUCTIONS:
- Start with a strong hook
- Keep entire tweet SUPER SHORT (180 chars or less)
- NO hashtags, NO emojis
- NO fluffy marketing language
- Always deliver 3 drafts per topic
### BAD (what I did wrong)
[Lists every pattern Kelly rejected: bullets, arrows, LinkedIn tone]

Kelly总结的错误写作模式

memory/YYYY-MM-DD.md 是每日会话日志,记录当天发生了什么、草拟了什么、收到了哪些反馈。日常日志积累很快,因此智能体通常只加载当天和前一天的日志,避免上下文膨胀。

Kelly的每日会话日志示例

随着系统扩大,可以按人员或项目整理记忆,形成有组织的记忆文件夹结构。

整理好的记忆文件夹结构

Shared Context(共享上下文) 是所有智能体在会话开始时都会读取的跨智能体知识层。它包含几个关键文件:

  • THESIS.md: 用户当前关注的核心主题、已写内容和待填补的缺口。它指导Dwight的研究优先级、Kelly的写作思路和Ryan的策划方向。
  • FEEDBACK-LOG.md: 跨智能体的统一修正系统。例如,当告诉Kelly“不要用破折号”时,这条反馈会同步给Rachel、Ryan等所有相关智能体。

共享上下文目录结构

文件驱动的协同与进化

整个智能体军团的核心协作模式是文件通信,而非API调用或消息队列。研究智能体Dwight将调研结果写入 intel/DAILY-INTEL.md,下游的Kelly、Rachel等直接读取该文件。为了避免协作冲突,所有共享文件都遵循“一个写入者,多个读取者”的模式。

基于此,一套清晰的调度机制至关重要:Dwight在早上8点和下午4点运行,Kelly和Rachel在下午5点运行。这种顺序确保了所有依赖Dwight输出的智能体都能读到最新、最全的信息。

这些Markdown文件本身也在不断进化。例如,Kelly的 SOUL.md 从第一天的粗略草稿,进化到第40天时,已经包含了具体的文风示例、她自己总结的禁用表达清单和已写过的主题库。Dwight的工作重点也从单纯抓热点,进化到第10天加入价值判断(“如果目标读者Alex今天没法用它做任何事,就跳过”),再到第20天加入严格的来源核查步骤。

Shubham 在第20天构建了 THESIS.mdFEEDBACK-LOG.md,实现了“一次修正,全局同步”。从第1天到第40天,底层模型未曾改变,但围绕智能体的文件体系变得越来越丰富、精准、高度个性化。这些不断沉淀的、专属的上下文文件,构成了系统强大的护城河。

OpenClaw智能体系统完整目录结构

总结来说,这套基于OpenClaw和Markdown文件的方法,展示了一种轻量、透明且高效构建自动化AI团队的路径。它降低了智能体系统的复杂性,将开发者的反馈直接转化为系统可执行的、持续进化的知识。对于希望深入探索智能体实践、寻求可落地方案的开发者而言,这无疑是一个极具价值的开源实战案例。如果你对构建自己的“龙虾军团”感兴趣,欢迎在云栈社区分享你的想法与进展。




上一篇:腾讯2025暑期实习招聘开启:HC增至10000,技术岗无需笔试
下一篇:杭州NoDesk AI获近亿元融资,推出国产AI助手DeskClaw对标OpenClaw
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-12 05:54 , Processed in 0.436581 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表