云栈社区»论坛 › 回收站「 Recycle Bin 」 › AI原生工作台：结合Cowork与Skill的智能体新形态探索 ...

发回帖发新帖

4342 积分	1 好友	592 主题

发消息

AI原生工作台：结合Cowork与Skill的智能体新形态探索

发表于 2026-1-24 15:41:26 | 查看: 74| 回复: 0

一、智能体的形态

当我们谈论AI的产品形态时，大模型只是底层的处理引擎。总需要一个应用层产品来对接用户的具体需求，这个AI的应用层，就是所谓的“智能体”(Agent)。

那么，问题来了：智能体应该以什么样的形态呈现？

AI Agent与AI Chatbot在客户服务场景中的交互对比

早期的智能体主要表现为对话应用（如上图），随后加入了推理能力，使其能够思考并解决复杂问题。后来，智能体朝着专业化方向发展，演化出编程智能体、图像智能体、视频智能体等类别，或是通过接入MCP（模型上下文协议）来获得操作外部应用的能力，例如生成Office文件、控制浏览器。

这些形态已趋于成熟。于是，许多公司开始探索：智能体的下一阶段会是什么样子？

Next-Gen AI Agents宣传图

最近，我在体验MiniMax刚刚发布的 AI native Workspace（AI原生工作台）时，欣喜地感觉到，这或许就是答案。

MiniMax Agent宣传图

二、Cowork 和 Skill

这款新产品同时融合了Anthropic公司近期提出的两个新概念：Cowork和Skill。

所谓Cowork，简单来说就是一个“计算机操作助手”。它本质上是编程智能体的图形界面版本，让不懂编程的用户能够用自然语言描述需求，再由AI生成底层代码并执行，从而自动操作本地计算机来完成指定任务。

而Skill则更为直接，它是一段预设的提示词，相当于一份“任务执行手册”，向AI详细描述如何完成某一类特定工作。可以这样理解：每一个Skill就是一位专家，它让AI具备了特定领域的专业技能。

这两者，一个是操作助手，一个是专家模式。前者利用AI来操控计算机，后者则为AI注入专门技能。

将它们结合起来会怎样？

MiniMax Agent桌面端与专家模式功能示意图

MiniMax的AI native Workspace正是这样一款产品，它探索性地将Cowork和Skill结合在一起，同时具备两种能力，构成了一种全新的产品形态。它的桌面端提供Cowork能力，而专家模式则提供Skill能力。

三、桌面端操作助手

下面，我来展示它与传统智能体的差异究竟在哪里。

它的桌面客户端定位就是“AI原生工作台”，具备以下核心能力：

直接访问本地文件：能够读取、写入本地文件，并自动上传或下载文件。
自动化工作流程：能够分解复杂任务，并执行Web自动化操作。
交付专业成果：任务运行结束后可以生成高质量的交付物，例如Excel表格、PowerPoint幻灯片或格式规整的文档。
长时间运行任务：对于复杂任务，可以长时间持续运行，不受对话超时或上下文长度限制的影响。

需要注意的是，由于它具备操作计算机并与互联网通信的能力，在执行任务前，务必指定明确的工作目录，以防止其读写不应触及的系统区域。同时，建议对原始文件进行备份，以防被意外修改或删除。

首先，前往官网下载桌面客户端，Windows和macOS版本均有提供。新注册用户目前可以免费试用3天。

MiniMax Agent多平台客户端下载界面

安装并运行后，会直接进入任务界面，这是一个传统的对话框。

MiniMax Agent任务输入界面

此时指定一个运行目录，就进入了“工作台”模式，软件将可以对该目录进行操作。系统会弹出一个安全警告，提示相关风险。

信任工作区安全警告弹窗

接下来，就可以让它执行各种任务了。例如，我要求它整理目录中各种电子服务的发票PDF文件，然后生成一个汇总的Excel文档。

PDF发票转Excel任务执行过程截图

此时，它会在当前目录中自动安装一个Python虚拟环境，然后生成并执行相应的Python脚本。很快，Excel文件就生成完毕。

生成的发票汇总Excel表格内容截图

以此类推，各种文件整理工作，如整理照片、批量重命名等，都可以交给它处理。它还能进行网页自动化操作，例如自动浏览指定网页并提取、总结信息。

四、专家系统

上面展示了它作为“数字员工”的工作台功能，下面再来看看它的“专家系统”。

所谓“专家系统”，即通过注入特定的提示词文件，来扩展智能体的技能，这相当于进行了深度的知识和能力注入。用户还可以上传自己的私有知识库。

你可以打开它的网页端，点击左侧边栏的“探索专家”。系统内置了一些“预设专家”，可以直接使用。

专家社区与我的专家界面

我选择了系统提供的一个“Icon制作器”专家，即专门制作Logo的技能，来测试其效果。

Icon制作器专家配置界面

我要求制作一个“熊猫吃冰淇淋”的Logo，系统提示需要选择一种设计风格。

Logo风格选择界面

最终，它生成了两个不同姿态（坐姿和站姿）的文件供选择，效果令人满意。

生成的熊猫吃冰淇淋Logo效果图

五、创建新技能

除了预设的专家，系统也允许你创建“我的专家”，即自定义技能。

创建新专家表单界面

你需要输入能力描述和详细指令，还可以添加对应的MCP（模型上下文协议）、子代理、环境变量、Supabase数据库连接等。

专家配置模块：能力、子代理、环境变量等

我尝试直接将Anthropic公司提供的 Skill文件输入，看看效果。我选择了其中的 frontend-design（前端设计）技能，输入后即可在“我的专家”分页中看到。

我的专家列表中显示自定义的frontend-design专家

需要注意的是，系统目前主要支持输入技能描述文件，尚未支持上传静态资源文件，期待后续能增加该功能。

选中这个专家后，我要求它生成一个算法可视化网站：

“生成一个排序算法可视化网站，列出常见排序算法的可视化动画。选中某个算法后，会展示该算法的动画效果。”

与前端设计专家对话生成排序算法网站

生成过程大约持续了十分钟，便得到了结果。系统生成了十种排序算法的动画演示，并直接完成了部署上线。

排序算法网站生成成功提示及功能列表

后来我还调整了一下动画的配色方案，你可以访问这个网站查看效果，相当酷炫。

排序算法可视化网站主界面

排序算法可视化动画运行细节

六、总结

AI native Workspace 将AI智能体的能力引入了本地计算机环境，使其能够执行自动化操作，同时通过技能接口，允许注入外部的专业知识和能力。所有这些操作，都可以通过简单的自然语言对话来完成，对用户的技术门槛要求极低。

这极大地拓展了AI智能体的想象空间。它所能完成的任务，将不再仅仅受限于模型本身的能力，而更多地取决于我们的想象力。

我认为，这款产品代表了下一阶段AI智能体的一个重要发展方向，开启了众多全新的可能性，等待我们去探索和挖掘。对于这类前沿的人工智能应用实践，云栈社区将持续关注，为开发者提供交流与分享的平台。

上一篇：棱镜X网络安全工具：资产扫描与漏洞检测的跨平台单兵利器
下一篇：英伟达如何重仓AI推理市场？垂直整合与全栈协同战略解析

智能体, MiniMax, Python, React, 工作流自动化

相关帖子

收藏0 回复显示全部楼层举报

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-11 20:32 , Processed in 0.417696 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表