找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4310

积分

1

好友

590

主题
发表于 3 天前 | 查看: 19| 回复: 0

就在前几天,OpenClaw 项目的 GitHub Star 数以惊人的速度突破 25 万,一举登顶 GitHub 历史第一。作为 Cowork、Manus 等自主执行 AI Agent 平台的开源替代方案,它从问世以来就热度不减,仅用不到四个月时间,其 Star 数便超越了 Linux、React 等耕耘了十多年的超大型基础设施项目。

这背后传递的信号再清晰不过:AI Agent 的时代已经到来。越来越多的开发者开始尝试在本地搭建自己的 Agent,并接入各类大模型来处理日常任务。但我们必须明白,无论 Agent 框架本身多么强大,其底层运行的基座模型才是根本。优秀的模型本就难得,而能够深度定制、灵活适配的模型更是凤毛麟角。

有趣的是,在 OpenClaw 登顶的第二天,阶跃星辰团队低调宣布了一项重磅消息:Step 3.5 Flash 全链路开源

阶跃星辰 Step 3.5 Flash 全链路开源宣传图

继之前开放 Step 3.5 Flash 模型本身之后,阶跃团队此次将预训练权重、中训练权重以及其内部训练框架全部公开。这一消息瞬间点燃了 开源社区 的热情。许多被这份毫无保留的诚意所打动的开发者,在评论区自发地刷起了“源神”的称号。

社区网友评论“源神”截图

要知道,目前大多数开源模型仅会开放经过后训练的最终权重。像这样将全链路训练的关键文件透明公开的做法,在整个开源领域都实属罕见。更何况,Step 3.5 Flash 本身就是阶跃当前能力最强的开源 Agent 基础模型,它专为 Agent 场景设计,具备强大的推理能力和智能体执行能力。

自今年二月开源以来,Step 3.5 Flash 在 Hugging Face 上的下载量已累计超过 30 万次。更引人注目的是,它近日已跃升至全球 OpenClaw 用户调用日榜的 Top 1,并稳居月度榜单 Top 4 的位置。

OpenClaw平台模型使用量排行榜截图

如此受欢迎的一款强力 Agent 基座模型,阶跃团队选择将其全链路开源,难怪有开发者直呼其为“源神”。

模型训练全链路,统统开源

大多数开源模型提供的是后训练完成的“成品”,开发者二次微调的空间有限,至于模型是如何被训练出来的,更是不得而知。而阶跃星辰的这次开源截然不同,其开放的三部分内容组合在一起,相当于将整个模型训练过程的关键阶段及其所使用的核心框架完全公之于众。

首先, Base 权重。这是最基础的预训练模型,适合希望从头开始进行全参数微调、实现深度定制的开发者。拿到它就像拿到一张白纸,你可以完全按照自己特定的业务需求进行塑造。

其次, Midtrain 权重。这是在 Base 权重基础上经过中间训练(Mid-training)后的版本,其推理能力更强。它非常适合用于 Agent 开发、工具调用等二次开发场景,让你无需从零开始,而是站在一个更高的起点上继续前进。

最后, Steptron 训练框架。这是阶跃团队内部自用的训练框架,涵盖了持续预训练、有监督微调(SFT)等完整环节。官方表示,后续还将逐步公开强化学习(RL)和评估模块。

Step 3.5 Flash全链路开源内容图示

简单来说,我们现在获得的,是一套与阶跃内部团队几乎完全一致的模型训练工具链。

数据说话,模型到底强在哪里?

在这套强大工具链的加持下,阶跃训练出的模型实力如何?我们直接来看 Step 3.5 Flash 在多项基准测试中的数据表现。

在推理(Reasoning)和代码(Coding)两大核心维度上,Step 3.5 Flash 的得分全面超越了同级别的开源模型,甚至在某些指标上可以与部分闭源模型媲美。

其在 Agent 能力测试中的表现尤为亮眼,在执行多步骤复杂任务的测试中,稳定性显著优于同等规模的模型。

Step 3.5 Flash 各项基准测试性能对比图

此外,该模型的本地部署硬件门槛也相对亲民。它拥有 110 亿激活参数,支持在 Mac Studio M4 Max 等消费级硬件上流畅运行,无需依赖数据中心级别的 GPU,同时确保了数据不出本地。其推理速度最高可达每秒 350 个 Token,在处理代码类任务时响应尤为迅速。

接入 OpenClaw,三步搞定

值得一提的是,目前 Step 3.5 Flash 模型在 OpenRouter 平台上限时免费提供调用,这意味着我们完全可以不进行本地部署,直接通过 API 使用。

只需以下三步,即可将 Step 3.5 Flash 模型接入到 OpenClaw 中投入使用。

第一步,安装 OpenClaw:

curl -fsSL https://openclaw.ai/install.sh | bash

第二步,运行初始化向导:

openclaw onboard

按照终端提示完成操作,最后打开 WebUI 进入控制台。

第三步,在 WebUI 中配置模型:

  1. 进入 Config -> Models -> Providers
  2. 点击 Add Entry 添加一个新的 Provider,并填入以下信息:
    • API Type 选择 openai-completions
    • Base URL 填写 https://api.stepfun.ai/v1(国内用户可改用 https://api.stepfun.com/v1,或使用 OpenRouter 的地址)
    • API Key 填入你在 StepFun 或 OpenRouter 平台申请的 Key
    • Model ID 填写 step-3.5-flash

OpenClaw网关模型配置界面截图

保存并刷新页面后,将 Primary Model 设置为 step-3.5-flash,即可开始使用。

OpenClaw网关聊天界面截图

总结与展望

回看此次事件,阶跃星辰将 Step 3.5 Flash 进行全链路开源,既展现了扎实的技术自信,也体现了十足的诚意。这实实在在地让普通开发者有机会上手,一步步训练出前沿模型,而不仅仅是拿到一个无法进行深度二次开发的“黑盒”结果。

过去,若想在垂直领域进行模型定制,要么依赖大厂的雄厚资源,要么只能在他人训练好的模型上进行有限的小修小补。现在,有了这套完整的工具链,开发者可以以 Step 3.5 Flash 为基座,进行更深层次的定制,从而打造出真正属于自己的智能体。

对于更广阔的开源生态而言,这套基础设施的价值更为长远。有了真实可操作、可复现的训练流程,社区成员可以在其基础上进行实验、改进与创新,而不再是永远围绕着闭源模型的 API 打转。这也恰好呼应了阶跃团队此前发出的、邀请开发者共同构建 Step 4 的承诺。大家为其冠以“源神”之名,现在看来确是实至名归。

据悉,阶跃团队后续还将继续开放强化学习模块、评估模块,相关的 SFT 数据也将陆续公开。对此感兴趣的朋友可以保持关注。




上一篇:AI裁员潮与职业安全重构:从算法工程师失业看2024年新技能体系
下一篇:神经网络如何学习?从“橡皮筋”比喻看懂反向传播与梯度下降
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-10 12:23 , Processed in 0.521408 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表