找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2765

积分

1

好友

377

主题
发表于 2 小时前 | 查看: 0| 回复: 0

一、智能体的形态

当我们谈论AI的产品形态时,大模型只是底层的处理引擎。总需要一个应用层产品来对接用户的具体需求,这个AI的应用层,就是所谓的“智能体”(Agent)。

那么,问题来了:智能体应该以什么样的形态呈现?

AI Agent与AI Chatbot在客户服务场景中的交互对比

早期的智能体主要表现为对话应用(如上图),随后加入了推理能力,使其能够思考并解决复杂问题。后来,智能体朝着专业化方向发展,演化出编程智能体、图像智能体、视频智能体等类别,或是通过接入MCP(模型上下文协议)来获得操作外部应用的能力,例如生成Office文件、控制浏览器。

这些形态已趋于成熟。于是,许多公司开始探索:智能体的下一阶段会是什么样子?

Next-Gen AI Agents宣传图

最近,我在体验MiniMax刚刚发布的 AI native Workspace(AI原生工作台)时,欣喜地感觉到,这或许就是答案。

MiniMax Agent宣传图

二、Cowork 和 Skill

这款新产品同时融合了Anthropic公司近期提出的两个新概念:CoworkSkill

所谓Cowork,简单来说就是一个“计算机操作助手”。它本质上是编程智能体的图形界面版本,让不懂编程的用户能够用自然语言描述需求,再由AI生成底层代码并执行,从而自动操作本地计算机来完成指定任务。

而Skill则更为直接,它是一段预设的提示词,相当于一份“任务执行手册”,向AI详细描述如何完成某一类特定工作。可以这样理解:每一个Skill就是一位专家,它让AI具备了特定领域的专业技能。

这两者,一个是操作助手,一个是专家模式。前者利用AI来操控计算机,后者则为AI注入专门技能。

将它们结合起来会怎样?

MiniMax Agent桌面端与专家模式功能示意图

MiniMax的AI native Workspace正是这样一款产品,它探索性地将Cowork和Skill结合在一起,同时具备两种能力,构成了一种全新的产品形态。它的桌面端提供Cowork能力,而专家模式则提供Skill能力。

三、桌面端操作助手

下面,我来展示它与传统智能体的差异究竟在哪里。

它的桌面客户端定位就是“AI原生工作台”,具备以下核心能力:

  • 直接访问本地文件:能够读取、写入本地文件,并自动上传或下载文件。
  • 自动化工作流程:能够分解复杂任务,并执行Web自动化操作。
  • 交付专业成果:任务运行结束后可以生成高质量的交付物,例如Excel表格、PowerPoint幻灯片或格式规整的文档。
  • 长时间运行任务:对于复杂任务,可以长时间持续运行,不受对话超时或上下文长度限制的影响。

需要注意的是,由于它具备操作计算机并与互联网通信的能力,在执行任务前,务必指定明确的工作目录,以防止其读写不应触及的系统区域。同时,建议对原始文件进行备份,以防被意外修改或删除。

首先,前往官网下载桌面客户端,Windows和macOS版本均有提供。新注册用户目前可以免费试用3天。

MiniMax Agent多平台客户端下载界面

安装并运行后,会直接进入任务界面,这是一个传统的对话框。

MiniMax Agent任务输入界面

此时指定一个运行目录,就进入了“工作台”模式,软件将可以对该目录进行操作。系统会弹出一个安全警告,提示相关风险。

信任工作区安全警告弹窗

接下来,就可以让它执行各种任务了。例如,我要求它整理目录中各种电子服务的发票PDF文件,然后生成一个汇总的Excel文档。

PDF发票转Excel任务执行过程截图

此时,它会在当前目录中自动安装一个Python虚拟环境,然后生成并执行相应的Python脚本。很快,Excel文件就生成完毕。

生成的发票汇总Excel表格内容截图

以此类推,各种文件整理工作,如整理照片、批量重命名等,都可以交给它处理。它还能进行网页自动化操作,例如自动浏览指定网页并提取、总结信息。

四、专家系统

上面展示了它作为“数字员工”的工作台功能,下面再来看看它的“专家系统”。

所谓“专家系统”,即通过注入特定的提示词文件,来扩展智能体的技能,这相当于进行了深度的知识和能力注入。用户还可以上传自己的私有知识库。

你可以打开它的网页端,点击左侧边栏的“探索专家”。系统内置了一些“预设专家”,可以直接使用。

专家社区与我的专家界面

我选择了系统提供的一个“Icon制作器”专家,即专门制作Logo的技能,来测试其效果。

Icon制作器专家配置界面

我要求制作一个“熊猫吃冰淇淋”的Logo,系统提示需要选择一种设计风格。

Logo风格选择界面

最终,它生成了两个不同姿态(坐姿和站姿)的文件供选择,效果令人满意。

生成的熊猫吃冰淇淋Logo效果图

五、创建新技能

除了预设的专家,系统也允许你创建“我的专家”,即自定义技能。

创建新专家表单界面

你需要输入能力描述和详细指令,还可以添加对应的MCP(模型上下文协议)、子代理、环境变量、Supabase数据库连接等。

专家配置模块:能力、子代理、环境变量等

我尝试直接将Anthropic公司提供的 Skill文件 输入,看看效果。我选择了其中的 frontend-design(前端设计)技能,输入后即可在“我的专家”分页中看到。

我的专家列表中显示自定义的frontend-design专家

需要注意的是,系统目前主要支持输入技能描述文件,尚未支持上传静态资源文件,期待后续能增加该功能。

选中这个专家后,我要求它生成一个算法可视化网站:

“生成一个排序算法可视化网站,列出常见排序算法的可视化动画。选中某个算法后,会展示该算法的动画效果。”

与前端设计专家对话生成排序算法网站

生成过程大约持续了十分钟,便得到了结果。系统生成了十种排序算法的动画演示,并直接完成了部署上线。

排序算法网站生成成功提示及功能列表

后来我还调整了一下动画的配色方案,你可以访问这个网站查看效果,相当酷炫。

排序算法可视化网站主界面

排序算法可视化动画运行细节

六、总结

AI native WorkspaceAI智能体的能力引入了本地计算机环境,使其能够执行自动化操作,同时通过技能接口,允许注入外部的专业知识和能力。所有这些操作,都可以通过简单的自然语言对话来完成,对用户的技术门槛要求极低。

这极大地拓展了AI智能体的想象空间。它所能完成的任务,将不再仅仅受限于模型本身的能力,而更多地取决于我们的想象力。

我认为,这款产品代表了下一阶段AI智能体的一个重要发展方向,开启了众多全新的可能性,等待我们去探索和挖掘。对于这类前沿的人工智能应用实践,云栈社区将持续关注,为开发者提供交流与分享的平台。




上一篇:棱镜X网络安全工具:资产扫描与漏洞检测的跨平台单兵利器
下一篇:英伟达如何重仓AI推理市场?垂直整合与全栈协同战略解析
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-24 17:47 , Processed in 0.280132 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表