找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1593

积分

0

好友

205

主题
发表于 2026-2-15 20:09:09 | 查看: 36| 回复: 0

从2023年到2025年,快手在研发效能领域持续探索,逐渐找到了借助AI技术平滑通往“研发智能化”的可行路径。本文将系统性总结其在万人规模研发组织中推动AI研发范式升级的核心实践、关键洞察与演进路线。

AI研发提效陷阱:工具使用 ≠ 个人提效 ≠ 组织提效

早在2024年,快手就自研并全面推广了AI编程工具Kwaipilot,供超过10000名研发人员使用。经过持续的优化,在严格的度量口径下(AI生成并入库的代码行 / 新增代码行),整体AI代码生成率从1%提升至30%以上,部分业务线甚至达到40%以上。与此同时,智能代码评审(CR)、测试用例生成、单元测试等非编码环节的AI工具也相继涌现。

然而,大量的调研和数据分析揭示了一个反直觉的“不等式”:使用AI开发工具 ≠ 个人提效 ≠ 组织提效

  • 对研发工程师而言:深度使用AI工具的开发人员,其个人主观体感编码效率提升了20-40%,但个人承担的需求交付数量并未显著增加。
  • 对组织而言:部分善用AI的工程师确实能更快完成任务,但组织整体的需求吞吐量和交付周期并未出现明显改善。

这一现象在行业报告中亦有印证。例如,《2025年DORA报告:人工智能辅助软件开发现状调查报告》中的数据显示,各企业对AI提升个人效能的预估效应值(标准化后)约为0.15,而对团队效能的预估效应值仅为0.05左右,对组织效能的提升预估则更低。这清晰地表明,个人效率的提升未能有效传导至组织层面。

快手在实践中发现,若仅推广单点AI提效工具,将偏离企业研发效能提升的核心目标,最终可能导致两个问题:

  1. 投入产出比低:虽然个人反馈积极,但组织整体的研发效率提升并不明显。
  2. 平台生态割裂:传统的DevOps平台与新兴的AI编程工具各自为战,无法协同演进,难以构建下一代一体化的智能研发平台。

总览:快手研发效能演进的三阶段路线

面对上述挑战,快手进行了系统性变革,其演进路径可清晰地划分为三个阶段:

第一阶段:平台化、数字化、精益化(2023-2024)
这一阶段的收益目标包括:研发数据覆盖度>90%、研发活动覆盖率>90%、研发工具渗透率>80%。解决方案的核心是建设三重一站式研发平台(需求+交付+运维),涵盖需求管理、IDE、项目协作、三端(后端KDev/前端KFC/客户端Keep)研发交付平台、运维与质量平台,并通过效能度量平台对项目级指标进行监控。当时面临的挑战是研发交付流程散乱,缺少标准化工具和研发指标。

第二阶段:智能化1.0(2024.6-2025.6)
目标是通过AI工具的使用,提升个人开发效率,进而推动业务需求响应率和研发周期优化。解决方案是建设AI研发成熟度模型效能实践,推广AI编码等工具。核心挑战在于,如何将已验证的个人效率提升,转化为可支撑组织级效能提升的专家能力。

第三阶段:智能化2.0(2025.7以后)
目标是实现需求交付周期缩短70%以上,人均需求吞吐量提升25%以上。解决方案演进为效能度量(度量AI)效能平台(AI x 研发平台),旨在构建一站式智能研发平台。其核心挑战是:如何让产品形态与AI效率随大模型升级、企业知识丰富而持续进化,并为各业务线带来持续的效能提升。

接下来,我们将深入每个阶段的关键实践。

第一阶段:夯实基础——平台化、数字化与精益化

这一阶段的成功是后续AI范式跃迁的重要基石。以快手核心的主站技术部(负责快手APP研发,规模超千人)的实践为例,其依托公司级的研发效能基建,分三步走:

第一步:流程标准化与工具落地
通过推广三端一站式研发平台(KDev后端、KFC前端、Keep客户端),将需求管理和研发交付流程全面标准化。关键目标与结果如下:

目标 指标 结果
在线化&标准化 研发工具渗透率 三端均超过95%
自动化 研发流程自动化翻转率 三端均超过94%
用户体验 产品用户NPS 良好

推广过程注重用户体验,通过高频需求交付、专项问题日结、密集培训与激励,在短时间内完成了大规模迁移。数据驱动是关键,每周同步各团队的落地数据,例如某团队在2023年6月的KDev渗透率达100%,关联率和自动翻转率也达到100%,有效推动了工具普及。

第二步:建设效能度量体系
在流程数据线上化后,快手构建了一套全面的效能度量指标体系。其核心是以“人均交付产品需求数”为北极星指标,并建立了“红军”(正向洞察和牵引)与“蓝军”(逆向证伪和防作弊)的双向分析框架。

  • 红军(正向):围绕“人均产品需求交付量”展开,拆解为“需求生产”、“资源投入”和“交付速度”等维度,下设“需求生产量”、“产品需求2周交付率”、“人均交付SP(故事点)”等指标。
  • 蓝军(逆向):用于防范数据作弊和指标失真,监控“需求颗粒度波动性”、“请求积压率”、“个人交付SP异常过量”等情况,确保度量结果的真实可靠。

第三步:数据驱动的效能分析与改进
凭借可信的度量数据,团队可以进行深度“体检”和精准改进。

  • 案例一:通过“研发活动在线化率”深挖架构问题。数据显示某团队产品需求投入占比(59%)偏低,而缺陷占比(14%)和体验优化占比(11.44%)偏高。调研发现根因在于客户端架构分层不合理、模块耦合度高,导致开发效率低、bug多。后续通过专项架构升级,使产品需求投入占比提升至64%。
  • 案例二:通过“需求积压率”优化评审流程。通过监控各团队需求积压率(积压数/近3个月平均需求吞吐)的趋势图,识别出积压率持续高企的团队,进而驱动业务方优化需求预评审流程和排期节奏。

经过系统化提效,主站技术部的人均交付产品需求数在一年内同比增长超过80%。

第二阶段:单点突破——智能化1.0的探索与矛盾

此阶段聚焦于将AI能力融入研发全流程,核心是自研AI编程工具Kwaipilot。其产品矩阵包括:

  • IDE插件 / AI原生编辑器 / CLI:覆盖开发者主流工作环境。
  • 智能问答引擎:支持企业知识库问答、联网搜索、多模态问答等。

Kwaipilot提供了以IDE为中心的智能编程生态系统,覆盖编码前、中、后全场景。例如:

  • 编码前:支持研发智能问答、仓库级代码解读、架构设计。
  • 编码时:提供代码续写、编辑预测、编码智能体(支持仓库级上下文感知、工具使用、命令执行)。
  • 编码后:具备代码诊断、智能生成提交信息/分支名、智能生成单元测试和代码评审能力。

推广过程分为三步:

  1. 导入:鼓励全员使用各类AI编程工具(包括允许使用第三方工具),培养AI使用习惯。
  2. 优化:聚焦解决真实业务开发中的两大门槛:(1)让AI工具“懂”业务和系统,通过自研代码大模型KAT-Coder、构建企业知识库来实现;(2)沉淀《AI x 开发指南》,将“AI开发高手”的最佳实践(如AI辅助开发、AI协同开发)标准化、课程化,赋能全员。
  3. 固化:通过“热AI计划”等全员培训、设立“AI样板间”评选机制、举办AI编程挑战赛等活动,将AI能力固化为组织机制和文化。

结果上,AI代码生成率持续增长,开发人员主观体感效率提升显著。然而,一个根本矛盾浮现:AI代码生成率持续攀升,但需求交付效率基本停滞

深度调研发现,问题在于开发方法的局限。当时主流是 “AI辅助编码” ,即在传统开发流程中,用AI完成代码续写、基础代码生成等。这种方式仅节省了碎片化的编码时间,但联调、测试、排期评估等环节耗时不变,因此对整体交付周期缩短帮助有限。

第三阶段:范式革命——智能化2.0与AI研发范式升级

智能化2.0阶段回归元问题:如何用AI提升需求端到端的交付效率? 答案是进行“AI研发范式”升级,其核心框架包含三个支柱:AI x 效能实践、AI x 研发平台、AI x 效能度量。

核心定义:需求AI研发成熟度模型
快手根据AI在需求交付中的参与程度,定义了三个等级:

  • L1 AI辅助(Copilot):人主导,AI主要在编码环节提供辅助。
  • L2 AI协同(Agent):人与AI深度协同,AI在研发全流程的多个环节(如分析、设计、编码、测试)完成任务,人进行审核与调整。
  • L3 AI自主(Agentic):AI近乎自主完成从需求澄清到代码生成、测试、部署的全流程,人类角色类似产品经理,负责最终验收。

第一步:AI x 效能平台——建设下一代智能研发平台
目标是打造一个能同时支撑L1-L3不同研发模式、并可随技术和知识持续进化的平台。快手提出了“Flow(工作流)”产品形态,将需求交付的全流程节点(如需求分析、技术设计、编码、测试、发布)可视化、可配置。开发者可以根据自身能力和需求特点,在同一个Flow中选择不同模式:

  • 选择标准开发或AI辅助编码,节点由人工完成。
  • 选择AI辅助/协同开发,关键节点由AI驱动,上下文在节点间自动传递。
  • 对于L3级需求,Flow可接近全自动运行。

第二步:AI x 效能实践——以需求为中心的范式导入
在个人、团队、业务线三个层面系统性推进:

  • 个人级:推广《AI x 开发指南》,将开发方法从“AI辅助编码”升级到“AI辅助开发”和“AI协同开发”。数据显示,掌握高阶方法的开发者,其需求交付周期缩短比例显著更高。
  • 团队级:鼓励团队探索适合自身的AI研发模式,例如改变前后端分工、利用AI进行全栈开发以减少协作节点等。标杆团队通过实践,实现了L2/L3级需求占比超过20%,需求交付周期下降58%的显著效果。
  • 业务线级(如主站技术部):Top-Down战略驱动,发布AI DevOps白皮书,成立重点项目。核心实践是 “按需分级,逐级推进”:先让所有需求达到L1级,再让大部分需求升级至L2级,同时筛选小部分独立需求探索L3级。

第三步:AI x 效能度量——建设AI研发成熟度度量体系
在原有效能度量体系上,新增“需求AI研发成熟度”度量模型,用于追踪L1、L2、L3级需求的占比变化。这为组织级的AI范式升级提供了清晰的量化指引和结果验证。

总结与展望

快手的实践印证了行业洞察:AI对于研发效能而言,不是“万能药”,而是“透视镜”和“放大器”。它首先会暴露组织在流程、数据、协同上的既有短板,然后将已有的效能基础(无论是优势还是劣势)进一步放大。

快手的成功关键在于,没有急于求成,而是遵循了清晰的演进路径:

  1. 先打好地基(平台化、数字化、精益化),确保流程可控、数据可信。
  2. 再验证单点AI能力对个人的提效效果,并解决工具“本土化”问题。
  3. 最终回归组织效能目标,通过定义AI研发成熟度模型、升级研发平台与度量体系,系统性推动研发范式从“AI辅助编码”向“AI协同开发”乃至“AI自主开发”跃迁

这场由AI驱动的生产力与生产关系变革仍在继续。快手将其智能化2.0阶段的探索成果,持续融入其对外发布的开发者工具CodeFlicker中,并与业界共享其“AI研发范式”的实践经验。对于任何寻求通过AI实现研发效能跃迁的大型组织而言,快手的这条“先夯实基础、再单点突破、最终进行范式革命”的路径,提供了极具价值的参考。

参考资料

[1] 快手:万人组织AI研发范式跃迁之路, 微信公众号:mp.weixin.qq.com/s/I_VpBEktknviXi1kWvt8GA

版权声明:本文由 云栈社区 整理发布,版权归原作者所有。




上一篇:深度解析C语言指针解引用:从代码到内存芯片的全链路硬件细节
下一篇:前端用MQTT玩转物联网:温湿度监控全栈实战
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 10:27 , Processed in 0.738690 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表