找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4416

积分

1

好友

611

主题
发表于 2 小时前 | 查看: 4| 回复: 0

阿里云人工智能平台 PAI 现已支持在 PAI-DSW(交互式建模)中一键安装 OpenClaw(小龙虾)。通过将 OpenClaw 的智能体能力与 DSW 提供的 AI 算力、训练环境及文件存储深度集成,你的专属 AI 助手可以直接操控同一个环境,执行文件读写、GPU 状态监控乃至训练任务分发,实现真正意义上的云端智能化开发闭环。

针对注重数据安全的企业用户,PAI 依托其全链路模型能力,还支持用户直接接入在平台内自主微调的模型,帮助你打造一个安全可控、深度契合业务逻辑的私有化智能体!

OpenClaw 是什么?

OpenClaw 是一个功能丰富的 AI 智能体框架,它支持直接与操作系统交互、具备持久化记忆能力、可以定时主动推送消息,并通过 Web UI、钉钉等多种方式与你沟通。其内置的丰富 Skills 生态,让它能够胜任从日常助手到复杂自动化任务的各种角色。

为什么选择在 PAI-DSW 上部署?

在 PAI-DSW 上部署 OpenClaw,最大的优势在于将强大的云端算力与智能体的执行能力无缝结合:

  • 🖥️ 随开随用,免运维:无需自建服务器,按需创建 DSW 实例即可获得开箱即用的完整环境。
  • ⚡ 弹性算力,按需扩展:DSW 实例支持多种规格的 CPU/GPU 资源,满足从轻量测试到大规模训练的不同需求。
  • 🔗 与阿里云生态无缝打通:天然集成 OSS、NAS 等云存储,方便数据存取;可直接调用百炼、PAI EAS 等服务的大模型。
  • 🔒 安全访问,避免服务裸奔:通过 DSW Gateway 提供安全的内部服务访问,无需暴露公网端口。
  • 🤖 让智能体“住”在算力旁边:OpenClaw 与你的训练代码、数据、GPU 同处一个环境,操作延迟极低,响应更迅速。

PART 01: 一键部署 OpenClaw

只需简单的几步,你就能在 DSW 中拥有自己的 AI 助手。

第一步:打开 DSW 实例

在 PAI 控制台的 DSW 实例列表中,找到你已经创建好的实例,点击「打开」进入 JupyterLab 环境。

第二步:运行安装脚本

在打开的 DSW 实例中,你有两种方式启动安装:

  1. 通过启动台图标:在「启动台」页面,找到并点击“小龙虾”气泡图标(如果已预置)。
  2. 通过终端命令:点击「Terminal」图标打开终端,直接执行以下命令:
curl -fsSL https://pai-dsw-ai-machine.oss-cn-beijing.aliyuncs.com/agent/openclaw/openclaw_installer_dsw.sh -o openclaw_installer_dsw.sh && bash openclaw_installer_dsw.sh

执行后,你将看到一个交互式安装菜单。

OpenClaw Manager (PAI-DSW) 交互式安装菜单

选择操作 [1] 开始安装。脚本会引导你完成后续步骤,建议在版本选择时使用推荐版本,以确保与 DSW Gateway 的最佳兼容性。整个安装过程通常只需 2-5 分钟。

OpenClaw 核心版本选择界面

第三步:配置模型服务

安装核心程序后,需要为 OpenClaw 配置“大脑”——即大模型服务。脚本支持两种主流的阿里云模型服务:

◆ 配置 AI 模型

  [1] ○ 百炼 (DashScope) - 阿里云百炼模型服务
  [2] ○ EAS服务 - 阿里云机器学习 PAI EAS 服务

(↑↓ 导航 | 数字直选 | Enter 确认)

1. 配置百炼 (DashScope) 服务

如果你选择百炼,配置步骤如下:

  1. 配置 Base URL:脚本默认使用百炼 Coding Plan 的专用 URL。如果你使用的是普通百炼账号,请输入 https://dashscope.aliyuncs.com/compatible-mode/v1

    配置百炼(DashScope)模型 URL

  2. 配置 API KEY:粘贴从百炼控制台获取的 API Key。

  3. 选择 AI 模型:根据需要从列表中选择一个模型(如 Qwen、通义千问等)。

  4. 配置 Gateway 端口:通常保持默认即可。

2. 配置 PAI-EAS 服务

如果你想使用自己部署的模型,可以选择 EAS 服务。

  1. 部署模型:首先,你需要通过 PAI 的 Model Gallery 一键部署一个大语言模型服务(例如 Qwen)。具体步骤可参考快速开始文档

  2. 获取调用信息:模型服务部署完成后,进入服务详情页,在“调用信息”中获取公网调用地址Token

    PAI-EAS 服务详情与调用信息

  3. 在脚本中配置:根据脚本提示,依次输入获取到的基础访问地址和 Token。

    ◆ 配置 EAS 服务
    
      提示:请从 PAI-EAS 控制台获取基础访问地址和 Token
      基础地址示例:http://16********.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/test
      注意:只需输入基础地址(不含 /v1),脚本会自动添加
    
    ◆ EAS 基础访问地址: http://16xxxxxxxx.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/test
    ◆ EAS Token(可见输入): your-eas-token-here
  4. 工具调用配置:脚本会询问是否禁用工具调用功能。这个选项取决于你的 EAS 服务端是否启用了 --enable-auto-tool-choice 参数。

    • 如果 EAS 服务端已支持,选择“否”(启用工具调用)。
    • 如果不确定或遇到 400 错误,选择“是”(禁用工具调用)。
    ◆ 工具调用配置
      提示:如果 EAS 服务未启用 --enable-auto-tool-choice 参数
            会导致 400 错误,此时需要禁用工具调用
    
    ◆ 是否禁用工具调用?
    [1] ○ 否 - 启用工具调用(推荐,需 EAS 服务端支持)
    [2] ○ 是 - 禁用工具调用(适用于服务端未配置的情况)

第四步:完成配置

所有配置完成后,脚本会自动启动 OpenClaw 的 Gateway 服务,并在终端输出 Web UI 的访问地址。直接点击该 URL 即可进入 OpenClaw 的 Web 界面,开始与你的 AI 助手对话。

PART 02: 访问 OpenClaw 服务

部署完成后,你有多种方式与 OpenClaw 交互,最推荐的是通过 DSW Gateway 直接访问 Web UI。

1. 通过 DSW Gateway 访问 Web UI(推荐)

安装脚本成功运行后,会在终端输出类似以下的信息:

✓ Gateway 已成功启动并在后台运行

  服务信息
  ├─ 进程 PID: 12345
  ├─ 日志文件    ~/.openclaw/gateway.log
  └─ PID 文件    ~/.openclaw/gateway.pid

  访问地址
  └─ http://127.0.0.1:18789/?token=xxxxxxxxxxxxxxxxxxxx

直接点击这个访问地址链接。DSW 的内置 Gateway 代理机制会自动处理,你的浏览器将直接打开 OpenClaw 的 Web UI,无需任何额外的端口映射或网络配置。

说明:链接中的 127.0.0.1 是 DSW 实例内部的本地地址。DSW Gateway 会安全地将此服务暴露给当前已登录的阿里云账号,外部无法访问,确保了安全性。

访问要求

  • 使用拥有该 DSW 实例访问权限的阿里云主账号或子账号登录。
  • 在 PAI 控制台环境内点击链接,或直接在脚本输出的终端中点击。

验证状态:打开 Web UI 后,可以查看页面右上角的服务状态,显示 “Health: OK” 和 “Gateway: Connected” 即表示一切正常。

PART 03: 应用场景实践

拥有了住在算力旁边的 OpenClaw,你可以解锁许多高效的开发与训练场景。

基础场景

场景1:日常问答与代码助手

你可以让它直接在你的工作空间里写代码。

请帮我在/mnt/workspace下创建一个使用kaggle公开数据实现房价预测的ipynb代码

场景2:智能文件搜索

忘记文件放哪了?让它帮你找。

请帮我找一下DSW实例中所有包含“报告”关键词的 Markdown 文件

场景3:关注消息订阅

让它成为你的 AI 行业情报员。

每天早上9点,给我发送最新的AI行业新闻

AI行业日报订阅展示

训练场景(核心价值)

将 OpenClaw 部署在 PAI-DSW 上,对于需要长时间运行 模型训练 的任务来说,价值巨大:

  • 主动监控:无需人工盯屏,OpenClaw 可主动发现问题并通知你。
  • 远程操作:通过钉钉等渠道,随时随地用对话管理训练任务。
  • 智能记忆:自动整理实验记录,形成可查询的知识库。

场景1:任务状态查询

训练到一半,随时问进度。

我刚执行的训练任务GPU利用率怎么样?

训练任务进度与GPU状态查询结果

场景2:任务异常监控告警

用户痛点:跑通宵的深度学习训练任务,半夜因错误中断或GPU闲置,导致资源空转浪费,进度延迟。
解决思路:让 OpenClaw 定时检查 GPU 状态,异常时通过钉钉立刻告警。

你可以通过命令行直接给 OpenClaw 下发一个定时监控任务:

openclaw cron add \
--name "GPU训练监控" \
--cron "*/15 * * * *" \
--tz "Asia/Shanghai" \
--session isolated \
--message "请执行以下操作检查GPU训练状态:
1. 运行命令:python gpu_monitor.py
2. 如果返回 'HEARTBEAT_OK',说明一切正常,无需进一步操作
3. 如果返回异常报告,请:
   - 通过钉钉发送完整报告给我
   - 分析报告中提到的可能原因
   - 给出建议的解决方案
注意:只有检测到异常时才需要通知我。" \
  --announce

当 GPU 异常闲置时,你会立刻收到告警。
GPU监控异常告警报告

场景3:实验数据自动归档

用户痛点:手动整理模型训练的实验记录(超参数、结果、结论)费时费力,容易出错或遗漏。
解决思路:利用 OpenClaw 的记忆和定时任务功能,实现实验记录的自动化归档与分析。

你可以指示 OpenClaw 建立归档例行任务:

请每天晚上10点执行实验日志归档任务:
1. 运行归档脚本:
   python /gpu-training-tester/experiment_archiver.py
2. 如果返回 'HEARTBEAT_OK',说明今天没有新的实验,无需操作
3. 如果返回实验记录,请:
   - 将记录追加写入 /mnt/workspace/experiment_log.md
   - 记住这些实验结果(使用 memory 功能)
   - 发送一份摘要到钉钉
记住:后续我查询历史实验时,你要能从记忆中检索这些信息。

执行后,OpenClaw 会帮你维护一个结构化的实验日志文件。
实验日志自动归档结果展示

之后,/mnt/workspace/experiment_log.md 文件的内容会被自动更新,例如:

## 实验记录
### 2026-03-02
| 实验 | 模型 | 学习率 | Epochs | 最终Loss | Accuracy | 状态 | 耗时 |
|------|------|--------|--------|----------|----------|------|------|
| exp_20260302_143015 | qwen-7b | 2e-5 | 3 | 0.0234 | 92.1% | 完成 | 0:31:32 |
| exp_20260302_161522 | qwen-7b | 5e-5 | 3 | - | - | OOM | 0:04:23 |
### 2026-03-01
| 实验 | 模型 | 学习率 | Epochs | 最终Loss | Accuracy | 状态 | 耗时 |
|------|------|--------|--------|----------|----------|------|------|
| exp_20260301_091523 | qwen-7b | 1e-5 | 5 | 0.0312 | 91.8% | 完成 | 2h28m |
| exp_20260301_141035 | qwen-14b | 1e-5 | 5 | - | - | OOM | 12m |

你既可以在 JupyterLab 中直接查看这个文件,也可以随时对话询问 OpenClaw:“对比一下最近三天所有成功的实验,哪个参数组合效果最好?”

探索更多可能

OpenClaw 的可玩性极高。你可以为其配置更多的消息渠道(如 Slack、Discord),也可以通过安装丰富的 Skills(技能插件)来扩展其能力,让它变得更加强大。

云栈社区人工智能 板块,我们持续分享关于 模型训练 与 AI 应用开发的前沿实践与深度讨论。如果你在部署或使用 OpenClaw 的过程中有任何心得或疑问,欢迎来社区交流分享。




上一篇:vLLM Triton注意力后端实现解析:如何用800行代码实现跨GPU高性能推理
下一篇:当AI抢走你的键盘:思考的深度才是写作者最后的壁垒
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-15 19:07 , Processed in 0.570516 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表