你是否遇到过用大模型写代码时,上下文丢得快、费用控制不住、工具调用不顺手?尤其长会话里,token 消耗哗哗流走,模型也越来越“健忘”。
Reasonix 就是为了解决这些痛点而生的——本质上它是一个极致轻量的 harness 壳,核心用 Go 写成单一静态二进制。项目围绕 DeepSeek 的前缀缓存进行了深度优化:上下文只做追加,字节序列保持稳定,最大程度复用缓存。实测下来,长会话中超过 90% 的输入 token 都能命中缓存,费用大概压到原来的 1/5。

值得一提的是,凡是支持 OpenAI 兼容接口的模型均可使用,远不止 DeepSeek 一家。

核心亮点
1. 前缀缓存优化
这是 Reasonix 最硬核的地方。普通 agent 常常重排消息、插入时间戳,导致缓存频繁失效。Reasonix 序列化上下文时保持确定性,只追加内容不修改已有前缀。会话跑几个小时,新请求大部分仍然能命中缓存,成本和速度一起起飞。首页还有动态演示,看一眼就明白为什么「长会话依然便宜」。
2. 项目记忆机制
运行 /init 即可生成 AGENTS.md 或 REASONIX.md,把项目知识沉淀下来。后续会话可以随时调用 history 和 memory 工具按需拉取,不用把所有历史一股脑塞进 prompt。模型还能主动 remember/forget,但所有操作都会经过审批,保持可控。忘记也不是真删除,而是归档保留追溯性。
3. MCP 插件系统
这可能是最吸引人的部分。支持 stdio 子进程和 HTTP 两种方式,外部工具通过 JSON-RPC 通信。内置工具在编译期注册,扩展性极强。想加图像识别?配一个 image-vision-mcp 即可。已有的 .mcp.json 文件也能直接兼容。
工具调用有精细的权限控制:deny > ask > allow。写操作默认会询问,沙箱限制在 workspace 目录内,防止误改系统文件。macOS 上 bash 还会额外 jail,安全性考虑得相当周全。
4. 双模型协同与更多实用功能
可以配置执行器 + 规划器两个模型独立运行,各自的缓存保持稳定。斜杠命令丰富(/rewind、/branch、/memory 等),支持 @ 文件引用、图片粘贴、分支会话、checkpoint 快照回退。Esc-Esc 快速 rewind,写错了随时反悔。
围绕 Prefix Cache 设计
Reasonix 最有意思的一点,是对 DeepSeek prefix cache 的极端重视。
大模型每次请求都要处理一长串上下文:系统提示、工具定义、项目记忆、历史对话、文件内容、工具返回结果……如果前面一大段内容在多轮请求里完全相同,支持 Prefix Cache 的模型就能直接复用计算结果。后续请求的延迟和成本双双下降。
不少 Agent 项目会不断修改系统提示、工具列表和上下文拼装方式,结果每一轮请求都像全新 prompt,长会话成本很快飙上去。Reasonix 的选择相反:尽量让系统提示前缀保持 byte-stable。
它在启动时,把基础系统提示、语言策略、项目记忆、技能索引等内容拼成稳定前缀。中途如果新增记忆,不会立刻修改系统 prompt,而是先作为下一轮的临时尾部信息注入,等到下次会话再进入稳定前缀。
Plan mode 也遵循相同思路。它不是通过改系统提示或隐藏工具来实现,而是在工具执行阶段拦截写操作。这样切换计划模式时,不需要破坏模型已经缓存住的前缀。
只有当上下文靠近窗口上限时,Reasonix 才会做一次 compaction——把旧的 assistant/tool 工作摘要化,同时保留重要用户输入和近期上下文。也就是说,compaction 是少数“有意为之的 cache reset 点”,而不是每轮都重洗上下文。
安装使用
安装方式很友好:
- 一条 npm 命令:
npm i -g reasonix@next
- macOS 用户还能用 Homebrew:
brew install esengine/reasonix/reasonix
桌面端也提供原生应用,支持 macOS、Windows、Linux。下载即用,体验接近一个轻量 IDE + AI 助手。
第一次运行 reasonix setup,它会引导你配置 provider 和 API Key。Key 优先存储到系统凭据库,不会随便写入文件,安全又方便。进到项目目录,敲 reasonix 就能进入交互式 TUI 界面。
项目地址
项目已开源在 GitHub:
https://github.com/esengine/DeepSeek-Reasonix
更多技术资源与极客文化,欢迎访问 云栈社区。