2024年底至2025年底,两个消息在科技圈炸开了锅。
第一颗炸弹: HeyGen创始人徐卓公开分享——从产品上线到年收入1亿美金,只用了18个月,第9个月起持续盈利。 更让人深思的是:HeyGen初期仅5名工程师,没有专职架构师,2天就要交付MVP,产品架构“又糙又快”,却能随着AI模型升级自动进化。
第二颗炸弹: 2025年底,AI Agent领域的明星创业公司Manus被科技巨头Meta收购。 这家成立不到两年、团队规模不足30人的公司,凭借其颠覆性的AI代理产品,引发了硅谷巨头的疯狂争抢。最终,Meta以近亿美金的价格将其收入囊中。
这两个案例有什么共同点?
答案是:它们都打破了传统技术管理的“常识”。
反观某金融科技公司:3个月精心设计的“完美微服务架构”,上线后只有1000个用户,12个微服务在空转,任何新功能都要改动5-6个服务。当GPT-4 Turbo发布时,竞争对手3天完成模型切换,他们还在“评估技术方案”。
这不是个例。在过去一年里,我与几十位技术管理者深入交流后发现一个惊人的事实:那些在传统互联网时代积累的“最佳实践”,在AI时代正在变成“最大陷阱”。
今天,我们将结合HeyGen和Manus的实战案例,深度解析架构师和技术管理者必须完成的7大思想转变。
转变一:从“稳定基础”到“动态架构”—— 架构师的生存危机
传统架构师的“死亡螺旋”
我见过太多这样的场景:
场景一:微服务的“过度设计”陷阱
某金融科技公司,首席架构师老王是从阿里出来的P9。产品要做AI客服,老王说:“这个要做好,架构必须稳。”于是设计了:

3个月后,架构搭完了,开始写业务代码。又过了2个月,第一版上线,只有50个内测用户。
最要命的是: GPT-5发布了,推理速度快3倍,价格便宜一半。但要切换过去,需要改6个服务的代码,评估下来要2周。
结果: 竞争对手3天就切换完了,他们还在“改造架构”。
场景二:Manus的“反常识”成功
与之形成鲜明对比的是Manus。这家被Meta收购的AI Agent公司,创始团队来自OpenAI和Google DeepMind。他们在成立之初就确立了一个原则 :“架构服从速度,速度决定生死。”
Manus的早期架构简单到令人发指:
- 单体Python应用
- 直接调用多个LLM API(GPT-4、Claude、Gemini)
- PostgreSQL单库
- 部署在AWS Lambda上(甚至不是自建K8s)
当有人质疑“这架构能扩展吗”时,Manus的CTO回应:
“当你只有1000个用户时,谈可扩展性就是在浪费生命。真正的问题是:你的AI Agent能不能解决用户的问题?”
架构师的“演进哲学”
HeyGen的架构演进更是教科书级别的“动态架构”范例。
阶段一:单体应用(Day 1 - 3个月):
- Next.js全栈应用(前后端不分离)
- 直接调用OpenAI API( 没有中间层)
- PostgreSQL单库(没有分库分表)
- Vercel部署(甚至不是自建K8s)
创始人徐卓说了一句影响深远的话:
“当你只有100个用户时,谈可扩展性就是在浪费时间。真正的问题是:还没人爱上你的产品。”
阶段二:智能中间层(3-9个月)
当用户到了1万,他们才加了一个关键设计:AI能力中间层。
以下是HeyGen AI能力层的核心架构图:

这个中间层的精妙之处:
- 模型可插拔:GPT-5换成Claude 4.5,只需改配置
- 能力可组合:同时调用3个模型对比结果
- 质量可保证:自动选择当前最优模型
架构师必须完成的第一个思想转变

❌ 旧思维:先设计完美架构,再写业务代码
第1个月:架构设计、技术选型
第2个月:搭建基础设施
第3个月:开发脚手架、公共库
第4个月:终于开始写业务...
✅ 新思维:业务优先,架构随需演进
第1天:最简单的方式实现核心功能
第1周:上线,获取真实反馈
第2周:基于真实痛点优化
第3周:只重构真正的瓶颈
转变二:从“完美主义”到“快速验证”—— 技术管理者的速度革命
为什么技术团队总是“慢半拍”?
采访过架构师同盟的技术管理者,“多久发布一次新功能”
答案让我震惊:
- 30天一个版本(50%)
- 14天一个版本(40%)
- 7天一个版本(10%)
HeyGen呢?每天都有新版本上线。 Manus呢?高峰期一天发布5-6次。
这反映了一个根本差异:传统技术管理者把“完美”当目标,HeyGen和Manus把“学习”当目标。
“完美主义陷阱”的三种表现
表现一:需求评审的“无限循环”
第1次评审:产品说要做AI视频生成
技术说:需求不够细化,要补充边界条件
第2次评审:产品补充了10页PRD
技术说:有些技术点需要调研,给我们1周
1周后第3次评审:技术说可以做,但工期要6周
产品说:太久了,能不能4周?
开发到第3周:产品说竞品上线了类似功能,我们要调整方向...
Manus的做法截然不同:
在被Meta收购前的内部分享中,Manus创始人透露了他们的“2-2-2法则”:
Day 1-2:想法讨论 + 原型开发
Day 3-4:内部测试 + 快速迭代
Day 5-6:小范围用户测试 + 数据收集
Day 7:基于数据决策——继续做还是换方向
表现二:上线前的“综合征”
星期三:代码开发完成,准备上线
Tech Lead:“今天上线太赶了,万一有问题影响用户怎么办?”
星期四:继续测试
测试工程师:“发现一个小bug,不影响核心功能,但还是修一下吧”
星期五:bug修完了
Tech Lead:“周五上线不安全,万一出问题周末没人修。下周一再发布吧。”
下周三:终于上线
竞争对手的类似功能已经迭代3个版本了...
HeyGen的发布哲学:
“如果你总是等到‘完美’才发布,你永远不会知道什么是真正的完美。”
以下是HeyGen发布决策流程图:

技术管理者必须完成的第二个思想转变
❌ 旧思维:追求100分的完美产品
特征:
- 功能完整才上线
- 没有bug才发布
- 性能优化到极致
- 文档完善齐全
结果:
- 上线周期长(4-8周)
- 市场反馈滞后
- 经常做无用功
✅ 新思维:追求快速获取真实反馈
特征:
- 核心功能能用就上线
- 关键bug修复,小bug可以容忍
- 性能够用就行
- 边做边写文档
结果:
- 上线周期短(2-7天)
- 快速验证假设
- 资源投入精准
实战建议:建立“MVP质量标准”而非“Production质量标准”
质量分级体系:
【探索级(MVP)】- 目标:验证假设
- 可用性:核心流程能跑通
- 性能:能承载测试用户量(100-1000人)
- 稳定性:允许偶尔出错
- 上线周期:2-3天
- 适用场景:新功能验证、市场测试
【成长级(Beta)】- 目标:优化体验
- 可用性:功能相对完整
- 性能:能承载初期用户量(1000-1万人)
- 稳定性:偶尔出错但不影响核心流程
- 上线周期:1-2周
- 适用场景:已验证需求,扩大用户范围
【产品级(GA)】- 目标:规模化
- 可用性:功能完整,边界情况考虑周全
- 性能:能承载大规模用户(1万-100万人)
- 稳定性:高可用,有降级方案
- 上线周期:2-4周
- 适用场景:核心功能,面向全部用户
Manus的真实数据:
在被收购前6个月,Manus团队完成了:
- 47个实验(平均每周2个)
- 12个转化为正式功能
- 35个被快速放弃(但只消耗了30%的资源)
如果按传统方式做,这47个实验需要2年时间。而Manus只用了6个月,这让他们比所有竞争对手快了4倍。
转变三:从“规避风险”到“拥抱试错”—— 决策模式的范式革命
为什么技术Leader总是“怕出事”?
场景:产品提了一个新需求
产品:“我们想做一个AI自动化工作流功能”
传统Tech Lead的第一反应:
“这个风险很大啊!”
“AI结果不可控,万一执行错了怎么办?”
“我们要充分评估风险”
“需要制定详细的测试方案”
“我觉得至少需要3个月”
Manus的Tech Lead反应:
“听起来很酷,我们这周能做个原型吗?”
“先给50个用户试试看效果”
“设置好熔断机制,出问题就自动停止”
“如果不好就关掉,如果好就继续做”
表面上看,传统Lead很“负责任”,Manus的Lead很“草率”。
但3个月后:
- 传统公司:还在设计方案,0个用户体验到
- Manus:已经测试了8个不同的工作流策略,找到了最优方案,5000用户在使用
重新定义“风险”:最大的风险是不承担风险
HeyGen创始人徐卓的一段话让我印象深刻:
“在AI时代,最大的风险不是技术失败,而是学习太慢。你做100件事情,99件失败了,但只要那1件成功,并且成功得足够大,你就赢了。关键是:你能不能快速做完这100件事?”
Manus被Meta收购的真正原因,也印证了这个观点。
根据业内人士透露,Meta看中Manus的不是他们的代码,不是他们的架构,而是他们验证和迭代AI Agent产品的能力。在短短18个月内,Manus团队尝试了超过200个产品方向,最终找到了AI自动化办公这个爆发点。

亚马逊的“双向门”决策框架升级版
HeyGen和Manus都采用了亚马逊贝佐斯提出的“双向门”决策模型,并做了AI时代的升级。
以下是决策分类的可视化流程:

关键洞察:在AI时代,99%的技术决策都是双向门!
很多技术管理者把双向门当成单向门来决策,这就是速度杀手。
技术管理者必须完成的第三个思想转变
实战建议:建立“实验记录卡”制度
实验卡模板:
【基本信息】
实验名称:AI自动生成视频标题
负责人:@张三
开始时间:2025-01-15
预计周期:1周
【假设】
我们相信:用户手动写视频标题很麻烦
所以:如果我们提供AI自动生成标题功能
用户会:使用这个功能,并提高视频发布率
【成功指标】
核心指标:使用率 > 30%
次要指标:生成的标题采纳率 > 50%
期望影响:视频发布量提升 > 10%
【风险控制】
最坏情况:用户不用这个功能
应对方案:直接下线,无影响
资源浪费:3天开发时间
【实验结果】(实验结束后填写)
实际数据:使用率45%,采纳率62%
学到的:用户需要更多创意标题选项
下一步:加入“创意标题”功能
转变四:从“技术深度”到“业务理解”—— 能力模型的重构
传统技术Leader的能力困境
我问过很多技术负责人:“你招人最看重什么?”
90%的回答是:
- 技术能力(算法、系统设计、代码质量)
- 工作经验(大厂背景、知名项目)
- 学习能力(新技术掌握速度)
只有10%的人提到:业务理解能力
这就是问题所在。
Manus被Meta收购后的一个内部故事:
Meta在收购尽调时发现,Manus的工程师有一个独特的习惯:每个工程师每周至少花4小时直接和用户对话。
当Meta的HR问:“这不是产品经理的工作吗?”
Manus的CTO回答:
“工程师如果不了解用户,写出的代码就是无根之木。我们的工程师不是代码机器,是价值创造者。”
HeyGen工程师的“全栈思维”
HeyGen有个令人震惊的要求:每个工程师都要参加用户访谈。 不是可选的,是必须的。每个月至少3次。
HeyGen工程师的一天:
9:00 - 10:00 查看用户数据Dashboard
- 哪些功能使用率高?
- 哪里有异常流失?
- 用户反馈了什么问题?
10:00 - 12:00 写代码(开发新功能或修bug)
12:00 - 13:00 午饭 + 和产品聊天
14:00 - 15:00 用户访谈(每周2-3次)
15:00 - 17:00 继续写代码
17:00 - 18:00 Team Sync

技术管理者必须完成的第四个思想转变
❌ 旧思维:技术专家就应该专注技术
团队文化:
- PM负责需求,工程师负责实现
- 边界清晰,各司其职
结果:
- 工程师不理解业务
- PM不懂技术边界
- 做出来的东西用户不买账
✅ 新思维:工程师是产品的共同创造者
团队文化:
- 每个人都理解业务
- 每个人都可以提想法
- 一起对结果负责
结果:
- 更好的技术方案
- 更少的沟通成本
- 更好的产品
实战建议:改变Code Review的重点
【业务理解】(必填)
- 这个PR解决什么问题?
- 预期影响哪些用户?
- 成功的标准是什么?
【技术方案】(必填)
- 为什么选择这个方案?
- 考虑过哪些替代方案?
- 有什么trade-off?
【风险控制】(必填)
- 最坏情况是什么?
- 如何监控?如何回滚?
【代码细节】(可选)
- 命名、格式等
转变五:从“团队规模”到“团队效能”—— 组织设计的重构
为什么人越多越慢?
一个让无数组织管理者困惑的问题:为什么团队规模翻倍,产出没有翻倍?
《人月神话》早就说过:软件开发的人月成本不是线性的。
- 10人团队:沟通路径 = 10×9/2 = 45条
- 50人团队:沟通路径 = 50×49/2 = 1225条
- 复杂度增加27倍!
Manus的“极简组织”秘诀
Manus在被收购时只有不到30人,但他们的产出令Meta震惊。
Manus的组织设计原则:
原则1:3人战斗小组
- 1个全栈工程师
- 1个AI工程师
- 1个产品/设计(可能是兼职)
原则2:小组自治
- 有明确的指标
- 可以独立决策
- 直接对结果负责
原则3:平台支撑
- 提供通用的AI能力
- 提供数据分析工具
- 提供基础设施
原则4:信息透明
- 所有数据全员可见
- 所有决策背景公开
以下是Manus的组织架构图:

HeyGen的“小团队集群”模式
HeyGen采用了类似的“Pizza Team”原则:每个团队的规模应该控制在“两个披萨能喂饱”的程度(约6-8人)。
如果需要更多人怎么办?
❌ 错误做法:
把团队扩大到10人、20人
✅ 正确做法:
拆分成多个小团队,每个有明确分工
例子:“AI视频生成”项目拆分:
- 小组1:文本转视频(3人)
- 小组2:图片转视频(3人)
- 小组3:视频优化(2人)
- 小组4:用户界面(3人)
每个小组独立运作,通过API协作
技术管理者必须完成的第五个思想转变
实战建议:实施“单线程负责人”制度
❌ 多线程负责人:
- 张三:负责项目A、B、C
- 每个项目分配33%的精力
- 结果:3个项目都做不好
✅ 单线程负责人:
- 张三:只负责项目A
- 100%的精力投入
- 结果:项目A做得很好
转变六:从“技术债管理”到“学习速度优化”——价值观的根本转变
“技术债务”是真正的问题吗?
HeyGen创始人徐卓提出了一个颠覆性观点:
“在AI时代,最大的浪费不是技术债务,而是时间债务——你花了3个月写完美的代码,却错过了市场机会,这才是真正的债。”
Manus的“战略性债务”案例:
2025年中,Manus要做“AI自动写代码”功能。
方案A(完美方案):
- 自研代码生成引擎
- 支持20种编程语言
- 高度可定制化
- 评估工期:3个月
方案B(快速方案):
- 调用Claude API + GPT-4 API
- 支持5种主流语言
- 功能简单
- 评估工期:1周
他们选择了方案B。为什么?
因为:
- 1周就能验证用户是否需要这个功能
- 如果不需要,节省了3个月开发时间
- 如果需要,可以边用边优化
结果:
- 1周上线
- 用户反馈强烈需要
- 但发现用户最需要的是Python和JavaScript,其他语言需求很少
- 最终只深度优化了2种语言,节省了大量资源
对比传统方式: 如果一开始就做方案A,3个月后才知道用户真正需要什么,还浪费了大量资源在“不需要”的语言支持上。
技术管理者必须完成的第六个思想转变
❌ 旧思维:消除所有技术债务
价值观:
- 技术债务是罪恶
- 重构是美德
- 代码质量第一
结果:
- 代码确实很漂亮
- 但市场机会错过了
✅ 新思维:优化学习速度
价值观:
- 学习速度是关键
- 快速验证假设
- 业务价值第一
结果:
- 学习比竞争对手快5倍
- 抓住市场机会
实战建议:用“学习ROI”替代“代码质量”作为考核指标
工程师绩效评估(新方式):
- 完成了多少个有效实验?(数量)
- 学习到了什么?(质量)
- 有哪些转化为正式功能?(影响)
- 帮助团队避免了什么坑?(贡献)
鼓励的行为:
✓ 快速尝试新想法
✓ 分享失败经验
✓ 提出技术改进建议
转变七:从“技能培养”到“思维重塑”——人才发展的深层逻辑
为什么培训总是没效果?
传统培训关注“技能”(Skills),但AI时代真正需要的是“思维”(Mindset)。
技能培训:
- 教你怎么写Python → 3个月后技术可能就过时了
思维培养:
Manus的“第一周震撼教育”
据透露,Manus新人入职第一周会经历“思维重塑”:
Day 1:CEO亲自聊1小时
核心讲3件事:
- 忘掉你之前学的“最佳实践” ——“你之前公司的方法可能不适合这里”
- 拥抱不确定性 ——“你不可能有完整信息才做决策”
- 失败是常态 ——“我们70%的实验会失败,如果你的实验都成功了,说明你不够大胆”
Day 2-3:实战洗礼
任务:“做一个你认为用户需要的功能,2天时间”
要求:
- 不要问“这个需求对不对”
- 不要问“应该怎么做”
- 自己判断,自己做,自己测试
- 第3天给10个真实用户试用
大部分新人的反应: “天啊,我第2天才意识到需求可能有问题” “来不及重做了,硬着头皮上了” “用户反馈果然不太好,但我学到了”
这就对了!这就是AI时代的日常。
技术管理者必须完成的第七个思想转变
❌ 旧思维:培养技能熟练的执行者
培养目标:
- 精通某种编程语言
- 掌握某个技术栈
- 能够独立完成任务
结果:
- 技能提升,但思维模式没变
- 遇到新情况还是不会判断
- 离开公司技能很快过时
✅ 新思维:培养具备AI时代思维的创造者
培养目标:
- 快速学习新技术的能力
- 在不确定中做判断的能力
- 独立思考和创新的能力
结果:
- 具备底层能力
- 能够应对未知挑战
- 能力可迁移到任何场景
写在最后:致每一位在AI时代求生的技术人
HeyGen从5个工程师到年入1亿美金,用了18个月。 Manus从0到被Meta收购,用了不到2年。
他们的成功不是偶然,而是必然——当你的管理哲学和时代节奏对齐时,成功是自然的结果。
AI时代已经来临。技术每2-3个月就会重大突破。用户需求快速演化。竞争格局瞬息万变。
在这个时代,“稳定”本身就是最大的不稳定。
唯一的稳定,来自你快速学习、快速适应、快速进化的能力。
作为技术管理者,你的职责不是建造一艘“永不沉没的巨轮”,而是训练一支“能在任何海况都能冲浪的团队”。
浪来了,不要躲,迎上去。