
1968年,安迪·格鲁夫与罗伯特·诺伊斯、戈登·摩尔共同创立了一家芯片公司,也就是后来的英特尔。
当时没人能预见它的未来,格鲁夫自己也未必清楚。但他非常明确一点:半导体制造极为复杂,需要成百上千名工程师步调一致地工作。任何一个人的微小偏差,都可能导致整条生产线报废。
格鲁夫面临的并非单纯的技术难题,而是一个管理问题:在一个充满不确定性、高速运转的组织中,如何确保每个人都知道自己该做什么,并且真正付诸行动?
当时的主流管理方法是MBO(目标管理),由彼得·德鲁克在1954年的《管理的实践》中提出。这套理论听起来很完美:上级设定目标,逐层分解,人人负责。但格鲁夫发现,MBO在英特尔根本行不通——它太慢、太官僚。等到目标层层传递到一线工程师手中,市场风向早已改变。
于是,格鲁夫动手改造了它。他将目标拆解为两件事:你想去哪儿(Objective),以及你如何知道自己到达了那里(Key Results)。目标要富有野心,关键结果必须可以量化。
其中最关键、也最反直觉的设计是:OKR不与薪资直接挂钩。一旦目标与金钱绑定,人们就会倾向于设定保守、安全的目标,整个体系的激励作用也就失效了。所以,OKR最初的模样并非考核工具,而是一种对齐工具。
1999年,风险投资人约翰·杜尔将这套方法带进了成立不到一年的谷歌办公室。此后二十多年,OKR深深融入了谷歌的基因。联合创始人拉里·佩奇后来在杜尔的《Measure What Matters》序言中写道,OKR帮助谷歌实现了“十倍速”增长。
谷歌实践OKR时有一个不常对外提及的细节:完成率在60%到70%之间,才是健康的。100%完成反而意味着目标设定得太低。 这一设计背后透露出一种组织哲学:目标不是用来完成的,而是用来突破的。
这套方法论随后从硅谷扩散开来,进入领英、推特、优步等公司,最终也来到了中国。在中国,将OKR贯彻得最为彻底的要数字节跳动。张一鸣做出了一个在当时国内企业文化中堪称异类的决定:所有人的OKR,全公司透明可见。
入职第一天的实习生,如果想查看张一鸣的OKR,敲几下键盘就能做到。这种极致的透明本身成为了一种管理手段。当你的目标被全员审视,社会压力便在一定程度上替代了考核压力,往往能产生更好的驱动效果。字节从几百人迅速扩张到超过十万人,OKR堪称这一过程中最重要的组织基础设施之一。
从英特尔的车库到字节的狂奔,OKR用五十年时间证明了自己的价值,它切实解决了一个核心问题:在由人构成的大型组织中,如何让所有人的力量指向同一个方向。
但它始终有一个未能根除的痛点。
1、OKR的阿喀琉斯之踵
在绝大多数公司,OKR推行两三年后,都会出现同一种现象:目标越写越保守,关键结果越来越像琐碎的任务清单,季度复盘则演变成一场精心准备的汇报表演。
在大型组织待过的人对这种场景都不陌生。季度初的目标设定会上,大家在撰写OKR时,心里盘算的往往不是“我能做到多好”,而是“怎么写能让自己看起来更出色”。到了季度末,“超额完成”皆大欢喜。
格鲁夫最担心的事情发生了:OKR变成了另一种形式的KPI。
原因很简单。尽管格鲁夫强调OKR不与绩效挂钩,但在大多数公司的实际运作中,你的完成率最终还是会以某种隐性方式影响年终评价。人都不傻,最优策略显而易见:设定一个“跳一跳能够到”的目标,然后漂亮地超额完成,以此证明自己的能力。
还有一个更隐蔽的问题。OKR通常按季度或半年度设定周期,但创新从不按时间表发生。许多真正有价值的探索,可能第一个月毫无起色,第二个月依然不见进展,等到季度末复盘时,就很可能以“不在OKR范围内”为由被悄无声息地砍掉。OKR的节奏,天生不利于孵化那些需要长期积累、慢热型的工作。
但这还不是最根本的局限。OKR最根本的局限性在于:它只管“意愿”,不管“能力”。 它默认人们知道该怎么做,只需要被对齐方向、被激励去行动。然而,很多时候,一个团队面临的真实问题是“能力不足”,而非“方向不对”。写得再漂亮的OKR,也无法让一个不会的人突然变得精通。
这个局限性,五十多年来无人能解。人有惰性、有私心、存在信息不对称、也有本能的自我保护倾向。OKR的全部设计,说到底都是在与人性弱点博弈。 而与人性博弈,胜算几何?
2、一种不需要被管理的“组织成员”出现了
2024年2月,瑞典金融科技公司Klarna公布了一组数据。该公司上线了一套AI客服系统,运行一个月后,该系统完成了相当于700名人工客服的工作量。平均问题解决时间从11分钟降至2分钟,客户满意度不降反升。CEO塞巴斯蒂安·西米亚特科夫斯基随后宣布,公司正在重新评估招聘计划。
这不仅仅是一个关于效率提升的故事,更是一个关于组织构成发生根本改变的故事。那700个工作岗位并非被“优化”了,而是被一个不需要传统管理的存在替代了。
无独有偶,当时成立不到半年、估值已达20亿美元的AI初创公司Cognition发布了Devin,这是第一个能够独立完成完整软件工程任务的AI智能体。Devin不仅能写代码,还能理解需求、查阅技术文档、发现并修复Bug、在测试环境中验证结果,直至将代码部署上线。整个过程无需人类介入。
当时的Devin远非完美,复杂任务处理能力有限。但重点不在此处。关键在于:一种新的“组织成员”出现了,它可以自主感知任务、拆解步骤、执行并汇报结果。
Klarna和Cognition只是更早期的案例。随着2026年OpenClaw“小龙虾”带动智能体应用大爆发,字节、腾讯、阿里等国内大厂开始在内部大规模研发和部署智能体(Agent),用于处理数据分析、内容生成、用户运营、代码审查等工作。
有公司内部甚至已经为这些智能体分配了“工号”,称它们为“AI同事”。
管理学界对此的反应似乎慢了半拍,但早有敏锐者洞察了方向。被《华尔街日报》称为“世界上最具影响力的商业思想家之一”的加里·哈默尔,在其著作《人本主义》中提出一个核心论点:现代管理系统的核心设计,是为了解决“人的不可靠性”。
打卡、汇报、审批、考核……这些机制存在的根本理由,是因为人会撒谎、会懈怠、会犯错、会偏离轨道。一旦执行层的主体不再是人,那么整套管理系统存在的理由便开始动摇。
麻省理工学院2023年发表于《科学》杂志的一项研究显示:在写作类知识工作中,使用ChatGPT可将任务完成时间平均缩短40%,同时产出质量提升18%。但与此同时,一个新问题浮出水面:产出的边界变得模糊,越来越难以判断一个结果究竟应归功于人,还是AI。 传统的绩效考核逻辑,正在因此失效。
德鲁克有句名言:“管理的本质,是让普通人做出不普通的事。” 这句话统治管理学界数十年。但当团队中有一半“成员”是智能体时,这个命题就需要重写。智能体既非“普通人”,也非“不普通的人”,它是一种全新的存在,需要一套全新的管理逻辑。
而OKR,是上一套逻辑下的产物。
3、OKR的三根支柱,正在逐一松动
OKR在过去五十年中主要解决了三个实际问题。现在看来,这三个问题的前提假设,正在被智能体一个接一个地抽走。
首先是 “对齐” 。OKR进行对齐的前提,是每个人都有自己的利益诉求,与公司目标天然存在偏差。季度初的目标设定会,本质上是一场管理者与员工之间的谈判,管理者试图让员工相信,公司的目标就是他们自己的目标。这个过程耗费时间、需要技巧、依赖信任,且成功率未必理想。
智能体没有这个问题。你用一段系统提示词定义它的任务和边界,它便会朝着那个方向运行。不需要说服,不需要谈判,也无需检查它是否“真心认同”。它的“目标”就是其定义本身,两者之间严丝合缝。当一个团队中智能体的比例越来越高,“对齐”这个动作的对象就越来越少,OKR最核心的应用场景随之萎缩。
其次是 “透明” 。字节跳动OKR的有效性,很大程度上源于其全公司可见性所制造的社会压力。但这个设计本身,是在弥补一个人性缺陷:人在默认状态下倾向于隐藏信息,尤其是不利信息。
智能体没有这种倾向。它的所有行动都可被记录,每一步在做什么、完成与否、结果如何,全部实时可查。你无需等待季度复盘,打开日志便能一目了然。透明度不再是一种需要努力达成的文化目标,而是变成了工程上的默认状态。
最后是 “激励” 。这是OKR设计中最精妙的部分。所谓“完成率60%-70%才健康”,本质上是为了对抗人类寻求安全的本能行为。格鲁夫深知,在没有外力推动的情况下,人们会本能地选择保护自己,不敢设定高远目标。
智能体不存在这种“本能”。你给它一个高难度任务,它不会因为“担心完不成、影响绩效”而保守行事;它只会因为“能力不足”而失败——这是一个纯粹的工程问题,而非管理问题。OKR所依赖的激励杠杆,对智能体无从下手。
三根支柱被抽走后,一个更深层的问题暴露出来:OKR的节奏设计,是为了匹配人类的注意力周期。
人需要阶段性的节点来聚焦精力、复盘得失、重新出发。但智能体没有“注意力周期”,它可以不知疲倦地持续运行,不需要季度复盘,不需要年中检查,更不需要年终打分。你在用一个为人类生理与心理节律设计的框架,去管理一个没有这种节律的存在。框架本身,就构成了错配。
格鲁夫当年提出的问题是:如何让人朝同一个方向奔跑? 他的答案是OKR。
智能体带来的,是一个截然不同的问题:当执行层不再是人时,管理者到底该管理什么?
这个问题,OKR给不出答案。
4、从组织到个人,无人能够置身事外
这不仅仅是公司管理层需要思考的课题。每一个在组织内工作的人,都必须直面它。
智能体进入组织,改变的远不止效率,更是每个人在组织中的价值定位。当客服、数据分析、内容生产、代码审查等越来越多的工作被交给智能体,人的价值该锚定在何处?
答案或许指向三个层面:
-
定义与提示工程:为智能体撰写一段清晰、精准的任务定义,远比为员工撰写一份漂亮的OKR要困难。智能体的能力上限,几乎完全由定义(Prompt)的质量决定。定义模糊,它就在模糊中打转;定义精确,它可以无限逼近那个精确点。过去,管理者的权力可能来源于信息差或资源分配权;未来,管理者的核心权力或将源于一项更朴素的能力:能否把一件事彻底想清楚,并清晰无误地表述出来。(延伸阅读:轮到理科生焦虑了)
-
判断与决策:智能体可以高速执行,但它通常不知道“该往哪个方向跑”。什么值得做、什么不值得做、什么样的结果才算“好”,这些判断依赖于经验、直觉以及对复杂人性的深刻理解,恰恰是当前智能体难以给出的东西。
-
编排与系统设计:未来的组织管理,可能不再是单纯地管理人,而是调度一个“人机混合”的复杂系统。如何设计规则、分配任务、确保协同,这件事没有现成的历史经验可以套用。能想明白并设计出高效人机协作模式的人,将变得极为稀缺。
对于个人而言,这意味着一个可能不那么舒适的真相:如果你当前在组织中的核心价值,主要体现在“执行与交付”——即按时完成任务、达成OKR、完成既定指标。那么,这部分价值正在被智能体迅速稀释。
不是遥远的未来,而是现在。
管理大师彼得·德鲁克曾说,二十世纪最重要的管理成就,是将体力劳动者的生产率提升了五十倍。他在晚年时指出,二十一世纪最重要的管理挑战,是提升知识工作者的生产率。
他未能等到智能体时代的全面降临。但如果他看到了今天的变化,他或许会再次修正自己的观点:二十一世纪真正的管理挑战,或许不再是提升知识工作者的生产率,而是需要重新厘清,当智能体逐步接管大量知识工作后,人类应该扮演何种角色、创造何种独特价值。
这个问题,OKR回答不了。我们现有的绝大多数管理工具,似乎都难以给出圆满的解答。
但它正迫切地要求每一个组织与个人,开始寻找属于自己的答案。在云栈社区这样的技术交流平台,关于未来工作模式与管理变革的讨论也日益增多,这反映了整个行业正在经历的深刻思考与探索。