一个基于视觉语言模型(VLM)的 Android 手机自动化工具,采用原生 Android Kotlin 开发,具有多 Agent 协作架构。
Github地址:https://github.com/Turbo1123/roubao

项目背景
- 2025年12月,字节跳动联合中兴发布了“豆包手机助手”,一款能够自动操作手机完成复杂任务的 AI 助手。其首批工程机定价3499元,上线当天即售罄,在二手市场的价格一度被炒至5000元以上。
- 由于“豆包手机助手”一机难求,作者决定开发一款功能相似的替代品“肉包”,并将其作为完全开源的项目发布。
项目特点
- 独立运行:无需连接电脑,应用直接在安卓手机上运行。
- 无硬件依赖:不需要购买额外的专用硬件设备。
- 开源免费:项目采用宽松的 MIT 许可证,代码完全开放。
- 先进架构:提供了类似 Claude Code 的 Tools/Skills 双层架构,支持多种任务执行模式。
- 模型兼容:支持接入多种主流视觉语言模型,例如阿里云通义千问、OpenAI GPT-4V、Claude 等。
- 精心设计的界面:提供了直观的 UI 界面,并支持中英文双语切换。
与同类项目的对比
| 特性 |
肉包 (roubao) |
豆包手机 |
其他开源方案 |
| 需要电脑 |
❌ 不需要 |
❌ 不需要 |
✅ 大多需要 |
| 需要购买硬件 |
❌ 不需要 |
✅ 需要 3499+ |
❌ 不需要 |
| 原生 Android 实现 |
✅ Kotlin |
✅ 原生 |
❌ Python 为主 |
| 开源 |
✅ MIT |
❌ 闭源 |
✅ 开源 |
| Skills/Tools 架构 |
✅ 完整 |
❓ 未知 |
❌ 通常无 |
| UI 设计 |
⭐⭐⭐½ |
⭐⭐⭐⭐ |
⭐⭐ |
| 支持自定义AI模型 |
✅ 支持 |
❌ 仅豆包 |
✅ 部分支持 |
通过对比可见,肉包项目在无需额外硬件、原生性能以及架构完整性方面,为希望进行手机自动化操作的开发者提供了一个强大且开源的选择。
|