引言:桌面的智能伙伴
在嵌入式开发与人工智能应用的交汇点,一款名为Moji 2.0的智能桌面机器人以其独特的定位吸引了开发者的目光。它不仅是一个栖息在桌面上、拥有动态表情的“电子宠物”,更是一个功能完备的AI语音助手。核心亮点在于,基于乐鑫ESP32-C5开发板,结合开源的小智AI 2.0系统,我们能够以极低的成本——物料成本可控制在75元左右——复刻出这款支持DeepSeek、通义千问等大模型的智能设备。
Moji 2.0的设计初衷是成为工作学习时的“有灵魂的伴侣”。当你感到枯燥时,它可以通过圆形屏幕上生动的表情包卖萌解压,提供情绪陪伴;同时,它也是一位强大的助手,支持像真人一样流畅的连续对话,随时为你查询天气、解答疑惑或闲聊解闷。对于极客玩家和嵌入式学习者而言,它更是一个绝佳的开源实践平台。
核心技术解析:从硬件升级到软件生态
硬件规格进化
Moji 2.0在硬件上进行了全方位升级,旨在提供更优的用户体验和更低的开发门槛。
- 主控芯片:从常见的ESP32升级为ESP32-C5。这款芯片支持双频Wi-Fi(2.4GHz和5GHz)及Wi-Fi 6标准,在网络复杂的智能家居环境中,能实现“快如闪电”的语音交互响应。其采用的RISC-V架构也为项目增添了开源色彩。
- 屏幕显示:屏幕尺寸跃升至1.5英寸,分辨率达360x360的圆形IPS高清屏。驱动接口采用高速QSPI协议,确保了动画显示的丝滑流畅,彻底告别视觉上的撕裂与拖影。
- 音频系统:音频电路经过重构,采用ES8311解码芯片与全差分走线设计。这种方案能有效抵消射频干扰,实现深邃宁静的背景底噪,提升语音收听和播放的清晰度。
- 供电与续航:内置500mAh电池,并搭配高效的DC-DC稳压电路。设备底部预留了无线充电线圈焊点,实现了“随手一放即可回血”的便捷充电体验。
- 组装友好性:全新设计了FPC插座连接屏幕,排线一插即锁,告别了手焊屏幕的繁琐,将复刻门槛降至最低。
软件生态与核心功能
该设备完美适配“小智 AI 2.0”软件系统。这是一套完整的语音交互解决方案,其系统架构清晰地分为三层:
- 硬件终端层 (ESP32开发板):运行在ESP-IDF/C/C++环境下,负责语音唤醒、音频流采集/播放、状态码上报等基础功能。
- 服务端层:作为核心智能处理中枢,基于DeepSeek等技术栈(可采用Python/Node.js开发),依次完成语音活动监测(VAD)、语音转文本(ASR)、说话人识别、大语言模型(LLM)推理和文本转语音(TTS)等任务。
- Web控制台层:采用Vue3或React框架,为管理员提供设备管理、对话角色配置、大模型切换以及TTS音色配置等功能。
基于此架构,Moji 2.0实现了丰富的核心功能:
- 全双工语音对话:支持唤醒词唤醒、手动触发对话,并可在对方说话时实时打断。
- 多语言识别:默认支持国语、粤语、英语、日语、韩语(基于FunASR引擎)。
- 灵活的LLM支持:可自由切换接入阿里通义千问、DeepSeek、OpenAI等多种大模型。
- 个性化体验:支持声纹识别、自定义对话角色(通过提示词)、短期记忆总结,并能根据对话情绪自动切换屏幕上的自定义图片或GIF表情。
硬件复刻指南:成本、组装与避坑
BOM成本分析
根据提供的物料清单,复刻一台Moji 2.0的成本可以根据获取配件的渠道灵活控制。以下是一个估算参考:
| 参数类别 |
规格 |
标准版估算(元) |
DIY版估算(元) |
| 主板 PCB‘A |
芯片/电阻/电容等物料(参考立创商城 5pcs 平均) |
58.88 |
58.88 |
| 面板 |
透明亚克力,46.3*46.3mm |
3.00 |
(可自备) |
| 外壳 |
哑光白外壳 + 半透明导光件 |
22.73 |
0 (自备) |
| 屏幕 |
1.5寸 QSPI 360*360 屏幕 |
11.50 |
11.50 |
| 喇叭 |
5XHXDZ-2828-4R3W-2P1.25 |
4.20 |
4.20 |
| 电池 |
602040 550mAh |
4.00 |
0.0 (可自备) |
| 螺丝/螺母/脚垫 |
M1.48, M2.66, M1.4贴片螺母,黑色脚垫 |
约 0.58 |
约 0.25 |
| 合计(估算) |
|
约104.89 |
约74.83 |
说明:标准版指所有物料均需采购的估算成本;DIY版指开发者已拥有外壳、电池等部分物料时的成本,可低至75元左右。实际价格会随采购渠道、数量波动。
组装步骤简述
整个组装过程可以分解为清晰的步骤,适合手工操作:
- 准备物料:清点所有零件,包括主板、外壳、屏幕、喇叭、电池、螺丝等。
- 安装导光柱:将半透明的导光件安装到外壳指定位置。
- 安装主板:将焊接好的主板小心放入外壳底座,对准螺丝孔位。
- 安装喇叭:将喇叭放入音腔位置并固定。
- 连接电池:特别注意电池极性,将电池插头接入主板的电池插座。
- 安装屏幕:将屏幕排线对准主板上的FPC插座,平稳插入并锁紧。
- 组装完成:合上外壳,贴上屏幕面板和底部的防滑垫。
核心焊接与操作注意事项
在硬件制作过程中,以下几个关键点直接关系到成功与否:
- 芯片焊接:音频芯片ES8311采用QFN封装,必须使用热风枪或加热台进行焊接,仅靠电烙铁无法可靠完成。
- 焊接顺序:强烈建议先焊接喇叭并验证声音输出正常,最后再焊接麦克风。因为麦克风易损,先焊其他部分可避免其损坏导致问题排查困难。
- 麦克风保护:麦克风元件极度怕热,使用热风枪时温度需≤300°C,且吹焊时间应小于10秒。清理焊盘时,严禁让洗板水或酒精渗入麦克风的拾音孔,否则会导致永久失效。
- PCB打板:下单制作PCB时,板厚务必选择1.6mm,否则Type-C接口的高度将与外壳不匹配。
- 屏幕安装:安装排线前先确认方向,对准插座后缓慢平推插入,切勿使用暴力,以免损坏插座或排线。
- 固件烧录:建议使用乐鑫官方的ESP Flash Download Tool。烧录时,需按住板上的BOOT按键再插入USB线,使设备进入下载模式。
开发展望与项目资源
Moji 2.0项目展示了如何将前沿的AI能力与低成本的嵌入式硬件相结合,为个人开发者和小型团队提供了宝贵的落地路径。它不仅是一个玩具或工具,更是一个可以深度定制和学习的开源平台。你可以修改它的“性格”,接入不同的大模型,甚至为其开发新的技能。
该项目所有硬件设计文件(原理图、PCB)和软件源码均已开源。对嵌入式开发、AI应用集成感兴趣的开发者,可以此为起点,探索智能硬件与人工智能的更多可能性。技术社区如云栈社区也是交流此类项目心得、获取灵感的良好平台。
参考资料
[1] 75元!复刻Moji 2.0 小智 AI 桌面机器人,基于乐鑫ESP32开发板,内置DeepSeek、Qwen大模型, 微信公众号:mp.weixin.qq.com/s/tkwdk9mfqbbRIR0I3Cu7qw
版权声明:本文由 云栈社区 整理发布,版权归原作者所有。
|