AionUi,它的核心思路很巧妙:把Gemini、Claude这类通常只能在命令行里用的AI工具,统一打包成一个跨平台的桌面应用,甚至还支持远程访问和多智能体协作。想象一下,出差时用手机直接调用AI助手整理报告,或者在家让它24小时自动跑定时任务,这种体验确实很爽。作为一名深度AI使用者,亲自体验后感觉这款工具并不比官方的Claude Cowork差,甚至在跨平台支持和免费开放这两点上更有优势。今天就来详细聊聊它的核心玩法和技术细节,帮你快速上手。
AionUi 到底是啥?它能解决啥痛点?
AionUi 本质上是一个开源的AI桌面助手,核心目标是把各种命令行的AI工具(比如Gemini CLI、Claude Code)整合到一个统一的图形界面里运行。它不是一个单纯的聊天机器人,而是聚焦于办公自动化场景:无论是文件整理、文档生成还是图像处理,都能覆盖。
传统CLI工具的痛点大家可能都遇到过:对话记录不保存、有单会话限制、进行文件操作很麻烦,而且通常只能用单一模型。AionUi 直接解决了这些问题,提供了本地存储、多会话并行、实时预览面板等功能,甚至还能通过WebUI或Telegram进行远程操控。简单来说,它让AI变成了你的7x24小时私人办公秘书,并且所有数据都存储在本地,隐私性得到了充分保障。
我个人就用它处理过Excel数据分析,让AI自动美化表格后,可以直接在预览面板里查看效果,省去了来回切换不同软件的麻烦。
核心功能亮点:不止聊天,还能自动化办公
AionUi 的亮点在于深度集成办公场景,而不仅仅是提供一个泛泛的AI聊天框。下面分享几个我个人非常喜欢的功能,并配上实际的使用解释:
-
多代理协作(Multi-Agent Mode)
支持Gemini、Claude、Codex等多个AI代理同时在线,并可以灵活切换。举个例子,我经常用Gemini来生成图像创意,同时用Claude来处理代码审查,效率直接翻倍。项目内置了Gemini CLI,开箱即用;其他代理如Claude Code也能自动检测,基本无需额外配置。
-
实时预览面板(Preview Panel)
支持超过9种格式的实时预览:包括PDF、Word、Excel、PPT、代码、Markdown、图像等。AI生成或修改文件后,预览面板会自动跟踪变化,你甚至还能在里面实时编辑Markdown或HTML。实际使用中,我让AI帮忙写PPT,直接在面板里调试布局和样式,非常省时省力。
-
智能文件管理(AI Cowork)
批量重命名、自动分类、文件合并这些操作都能一键搞定。只需要拖拽文件夹导入,AI就能智能地帮你整理乱七八糟的下载目录。典型场景:周末清理项目文件时,让AI根据内容自动分类,瞬间变得井井有条。
-
AI 图像生成与编辑
集成了Gemini的视觉模型,可以通过描述文字生成图像,还支持图像的识别与编辑。亲测用它生成产品原型图,质量不错,关键是免费。
-
定时任务(Scheduled Tasks)
可以用自然语言来设置类似cron的定时任务,比如“每天早上8点汇总销售报告”。AI会自动执行,非常适合用于数据聚合或定期提醒。我个人的扩展用法是让它定时拉取GitHub仓库数据,自动生成每周的开发周报。
-
远程访问(WebUI & Telegram)
可以通过浏览器或Telegram来访问你本地运行的AionUi,实现跨设备无缝使用。WebUI完美适配手机和平板,Telegram则通过Bot聊天的方式交互,通过配对码授权,安全性很高。为了实现更稳定的内网穿透,建议搭配像Tailscale这样的工具使用。
这些功能并非相互独立,结合多会话管理和本地存储的特性,让AionUi变成了一个完整的AI工作站。相比仅限于macOS平台且绑定Claude模型的Claude Cowork,AionUi的跨平台、多模型支持带来了更高的自由度。
技术架构解析:从代码结构看设计精髓
翻阅了AionUi的代码仓库(基于Electron + React + TypeScript构建),其结构非常清晰,模块化程度很高。目录树大致如下:
.aionui/ # 功能特性文档
.claude/ # Claude 相关配置
.gemini/ # Gemini 配置
.github/ # CI/CD 工作流
.husky/ # Git Hooks
.specify/ # 模板和规范
assistant/ # 内置助手脚本,如 PDF-to-PPT
config/ # Webpack 配置
docs/ # 文档
homebrew/ # macOS 安装公式
public/ # 静态资源
resources/# 图片和媒体
scripts/ # 构建脚本
skills/ # 技能模块,如 DOCX、PPTX 处理
src/ # 核心源码
adapter/ # 浏览器和常量适配
agent/ # 代理层:ACP、Codex、Gemini 等
channels/# 通道:Telegram、Lark 插件
common/ # 公共工具:API 客户端、转换器
process/ # 主进程:桥接、数据库、服务
renderer/# 渲染进程:UI 组件、Hooks、Pages
shims/ # 补丁
types/ # 类型定义
utils/ # 实用工具
webserver/# WebUI 服务:认证、路由、WebSocket
worker/ # Worker 线程:代理执行
tests/ # 单元测试
整体设计思路:采用了Electron经典的双进程架构(主进程 + 渲染进程),主进程负责桥接和后台服务,渲染进程专注于UI交互。其中代理层(agent/)是亮点,通过模块化设计支持多种AI代理,例如Gemini使用OAuth和流式响应,Codex则采用事件处理器。通道模块(Channels/)以插件化方式扩展远程接入能力,可以方便地添加如Slack等新平台。
数据库方面使用了SQLite(位于process/database/),用于本地存储对话记录。WebUI远程功能通过Express + WebSocket(webserver/)实现,并配备了JWT认证和速率限制来保障安全。
从代码质量看,全程使用TypeScript保证了强类型,通过自定义Hooks(如useAutoTitle、usePreviewHistory)很好地将UI逻辑解耦,易于维护。技能模块(skills/)集成了处理Word/PPT的OOXML schema,显得非常专业。整体架构有点像微服务,扩展性很强——如果你想加入一个新的AI代理,基本上直接插入一个模块就可以了。
安装与快速上手:跨平台零门槛
AionUi 支持 Windows、macOS、Linux,甚至在 Android 上也可以通过 Termux 运行。我个人亲测了 macOS 和 Windows 版本,基本能做到5分钟上手。
1. 系统要求
- macOS 10.15+ / Windows 10+ / Linux (如 Ubuntu 18.04+)
- 内存 4GB 以上,存储空间 500MB 以上
2. 下载安装
从项目的 GitHub Releases 页面下载最新版本。
- macOS:使用 Homebrew 安装非常方便:
brew install aionui
或者直接下载 .dmg 文件拖拽到应用程序文件夹。
- Windows:运行下载的
.exe 安装程序,安装过程中可以选择添加到系统 PATH。
- Linux:可以使用
.deb 包或 AppImage 格式:
sudo apt install ./AionUi_*.deb
AppImage 文件赋予执行权限后直接运行即可。
3. 首次运行与配置
首次启动,应用会引导你配置AI代理。如果已安装 Gemini CLI,它会自动检测。你也可以在设置中手动添加其他代理的API密钥或路径。
4. 启动 WebUI 模式(远程访问)
如果你想启用远程访问,可以在启动时加入相关参数(具体参数请参考官方文档),之后便可在浏览器中访问指定的本地地址。
5. 快速测试
一切就绪后,新建一个会话,输入“帮我生成一张猫在玩毛线球的图像”,然后观察右侧的预览面板——你的AI助手就开始工作了!
实际应用场景:从办公到创意,全覆盖
AionUi 不仅仅是一个工具,更是一个生产力放大器。这里分享两个我个人的使用场景:
场景一:程序员的多代理工作流。在开发时,我会同时开启多个代理:用Gemini进行头脑风暴和构思新功能,用Claude审查刚写的代码片段,用Codex执行一些小的补丁或脚本。这样协同工作的结果就是,整个项目的迭代速度感觉提升了至少30%。
场景二:内容创作者的自动化助手。利用定时任务功能,让它每天自动汇总我关注领域的热点新闻,并生成一份Markdown格式的周报;其图像生成能力可以直接用来制作文章封面图,在预览面板里就能实时调整风格,非常高效。
你还可以进行更多扩展:比如集成自定义技能(在skills/目录下开发),添加一个股票数据分析模块,自动拉取API数据并生成可视化报告。或者利用Channels机制开发一个Discord插件,方便团队内部协作使用同一个AI助手。
总的来说,AionUi 用清晰简洁的架构设计解决了传统CLI工具的诸多痛点,凭借其跨平台、多功能和开源免费的特性,堪称当前AI工具领域的一匹黑马。如果你也热衷于探索AI如何提升效率,不妨试试这款工具,也欢迎来云栈社区分享你的使用心得和技巧。