一、智能体的形态
当我们谈论AI的产品形态时,大模型只是底层的处理引擎。总需要一个应用层产品来对接用户的具体需求,这个AI的应用层,就是所谓的“智能体”(Agent)。
那么,问题来了:智能体应该以什么样的形态呈现?

早期的智能体主要表现为对话应用(如上图),随后加入了推理能力,使其能够思考并解决复杂问题。后来,智能体朝着专业化方向发展,演化出编程智能体、图像智能体、视频智能体等类别,或是通过接入MCP(模型上下文协议)来获得操作外部应用的能力,例如生成Office文件、控制浏览器。
这些形态已趋于成熟。于是,许多公司开始探索:智能体的下一阶段会是什么样子?

最近,我在体验MiniMax刚刚发布的 AI native Workspace(AI原生工作台)时,欣喜地感觉到,这或许就是答案。

二、Cowork 和 Skill
这款新产品同时融合了Anthropic公司近期提出的两个新概念:Cowork和Skill。
所谓Cowork,简单来说就是一个“计算机操作助手”。它本质上是编程智能体的图形界面版本,让不懂编程的用户能够用自然语言描述需求,再由AI生成底层代码并执行,从而自动操作本地计算机来完成指定任务。
而Skill则更为直接,它是一段预设的提示词,相当于一份“任务执行手册”,向AI详细描述如何完成某一类特定工作。可以这样理解:每一个Skill就是一位专家,它让AI具备了特定领域的专业技能。
这两者,一个是操作助手,一个是专家模式。前者利用AI来操控计算机,后者则为AI注入专门技能。
将它们结合起来会怎样?

MiniMax的AI native Workspace正是这样一款产品,它探索性地将Cowork和Skill结合在一起,同时具备两种能力,构成了一种全新的产品形态。它的桌面端提供Cowork能力,而专家模式则提供Skill能力。
三、桌面端操作助手
下面,我来展示它与传统智能体的差异究竟在哪里。
它的桌面客户端定位就是“AI原生工作台”,具备以下核心能力:
- 直接访问本地文件:能够读取、写入本地文件,并自动上传或下载文件。
- 自动化工作流程:能够分解复杂任务,并执行Web自动化操作。
- 交付专业成果:任务运行结束后可以生成高质量的交付物,例如Excel表格、PowerPoint幻灯片或格式规整的文档。
- 长时间运行任务:对于复杂任务,可以长时间持续运行,不受对话超时或上下文长度限制的影响。
需要注意的是,由于它具备操作计算机并与互联网通信的能力,在执行任务前,务必指定明确的工作目录,以防止其读写不应触及的系统区域。同时,建议对原始文件进行备份,以防被意外修改或删除。
首先,前往官网下载桌面客户端,Windows和macOS版本均有提供。新注册用户目前可以免费试用3天。

安装并运行后,会直接进入任务界面,这是一个传统的对话框。

此时指定一个运行目录,就进入了“工作台”模式,软件将可以对该目录进行操作。系统会弹出一个安全警告,提示相关风险。

接下来,就可以让它执行各种任务了。例如,我要求它整理目录中各种电子服务的发票PDF文件,然后生成一个汇总的Excel文档。

此时,它会在当前目录中自动安装一个Python虚拟环境,然后生成并执行相应的Python脚本。很快,Excel文件就生成完毕。

以此类推,各种文件整理工作,如整理照片、批量重命名等,都可以交给它处理。它还能进行网页自动化操作,例如自动浏览指定网页并提取、总结信息。
四、专家系统
上面展示了它作为“数字员工”的工作台功能,下面再来看看它的“专家系统”。
所谓“专家系统”,即通过注入特定的提示词文件,来扩展智能体的技能,这相当于进行了深度的知识和能力注入。用户还可以上传自己的私有知识库。
你可以打开它的网页端,点击左侧边栏的“探索专家”。系统内置了一些“预设专家”,可以直接使用。

我选择了系统提供的一个“Icon制作器”专家,即专门制作Logo的技能,来测试其效果。

我要求制作一个“熊猫吃冰淇淋”的Logo,系统提示需要选择一种设计风格。

最终,它生成了两个不同姿态(坐姿和站姿)的文件供选择,效果令人满意。

五、创建新技能
除了预设的专家,系统也允许你创建“我的专家”,即自定义技能。

你需要输入能力描述和详细指令,还可以添加对应的MCP(模型上下文协议)、子代理、环境变量、Supabase数据库连接等。

我尝试直接将Anthropic公司提供的 Skill文件 输入,看看效果。我选择了其中的 frontend-design(前端设计)技能,输入后即可在“我的专家”分页中看到。

需要注意的是,系统目前主要支持输入技能描述文件,尚未支持上传静态资源文件,期待后续能增加该功能。
选中这个专家后,我要求它生成一个算法可视化网站:
“生成一个排序算法可视化网站,列出常见排序算法的可视化动画。选中某个算法后,会展示该算法的动画效果。”

生成过程大约持续了十分钟,便得到了结果。系统生成了十种排序算法的动画演示,并直接完成了部署上线。

后来我还调整了一下动画的配色方案,你可以访问这个网站查看效果,相当酷炫。


六、总结
AI native Workspace 将AI智能体的能力引入了本地计算机环境,使其能够执行自动化操作,同时通过技能接口,允许注入外部的专业知识和能力。所有这些操作,都可以通过简单的自然语言对话来完成,对用户的技术门槛要求极低。
这极大地拓展了AI智能体的想象空间。它所能完成的任务,将不再仅仅受限于模型本身的能力,而更多地取决于我们的想象力。
我认为,这款产品代表了下一阶段AI智能体的一个重要发展方向,开启了众多全新的可能性,等待我们去探索和挖掘。对于这类前沿的人工智能应用实践,云栈社区将持续关注,为开发者提供交流与分享的平台。