云栈社区»论坛 › 开发者广场「Dev Plaza」 › 2026年AI发展趋势：从推理模型、Agent Team到个人职业转型策略 ...

发回帖发新帖

5708 积分	0 好友	754 主题

发消息

2026年AI发展趋势：从推理模型、Agent Team到个人职业转型策略

发表于 2026-2-25 01:45:04 | 查看: 223| 回复: 0

最近几个月，陆续有同事朋友找我聊天。话题不外乎几种：对工作现状的迷茫、想了解外面AI到底发展到什么程度了，或者纯粹是半夜情绪上来需要聊聊。我发现大家的感受出奇地一致，是一种强烈的割裂感。

一边是自媒体上铺天盖地的“炸裂”、“震惊”、“颠覆”，仿佛明天世界就要天翻地覆；另一边是回到日常工作和生活，AI的作用似乎依然有限，该开的会还是在开，该协调的流程还是要协调。

我自己从大厂出来后，离开了过去那个成熟精密但节奏偏慢的体系，对这种割裂感的体会比以往更强烈。如果说2025年是AI应用层的元年，那么到了2026年，AI应用的爆发已经真切地发生了。说实话，连我自己都时常感到焦虑，因为这变化实在太快。

有点像坐在一辆不断加速的火箭上——推背感不是在启动的瞬间最强，而是随着速度提升变得越来越强，快到让你心生一丝恐惧。23到24年时，我的注意力还能覆盖住大部分行业信息；到了26年，信息量已经大到几乎无法覆盖，有大量动态我其实也并不了解。

本文源自一次内部分享，主要分为几个部分：先探讨模型进化的底层逻辑——大语言模型的智力线和多模态生成线各自如何发展，为什么会越来越强；然后分析应用层的机会在哪里；最后，在这个大背景下，探讨个人应如何进行职业选择和能力准备。

希望大家能基于这套逻辑，再去审视那些铺天盖地的信息，学会分辨哪些是噪声，哪些是对你而言真正重要的信号。构建自己的认知框架，远比盲目追逐每一个热点更有价值。

一、模型进化：两条主线，一个飞轮

我们先从模型的发展讲起。很多人觉得大模型离自己很远，是算法和研究员才关心的事。但实际上，理解模型如何进化，是你判断行业趋势和做出个人选择的基础。这就像移动互联网早期，你需要理解4G、GPS、智能手机和摄像头意味着什么，才能抓住后面的机会。否则，你可能只会想着把PC网页塞进一个4英寸的小屏幕，然后发愁怎么在小屏里塞广告位。

模型的发展清晰地分为两条主线：一条是大语言模型（LLM）的智力线，另一条是多模态生成线。两条线背后的逻辑是相通的——数据飞轮驱动模型持续变强，而技术门槛则不断被内化到模型之中。我们先讲智力这条线。

大语言模型的智力线

1. 三个关键节点

这条进化路线有三个关键节点，每一步都在为下一步积累至关重要的数据和能力。

第一个节点是推理模型的突破。2024年9月，OpenAI的o1模型发布，让模型在回答问题前能“先自己想一想”，即思维链（CoT）。接着是2025年1月的国产平替DeepSeek R1，以及后续的Claude 3.7、Gemini 2.5等，这些都是推理模型。

推理模型催生了第一批AI Agent产品，如Manus、Genspark、Lovart等。基于用户的提示（prompt），模型会思考、规划，然后调用手头的工具去执行任务，而非简单地回答问题。这可以说是AI原生应用层真正开始的起点。

但那时很多Agent产品其实做了大量补丁工作，用户体验不佳，执行能力也差强人意，因此在2025年上半年引发了诸多争议。

第二个节点是Agentic能力的实质性提升。到了2025年11月Claude 4.5发布后，使用“氛围编程”（vibe coding）的人群大大增加。此前用Claude 3.7做vibe coding还挺麻烦，但到了4.5明显好用了很多。再加上Codex 5.2、以及在前端表现突出且无需安装即可在线使用的Gemini 3（通过AI Studio），AI编程开始进入更广泛的人群。

这里很核心的一点是，模型的Agent能力开始真正显现。为什么？因为之前的推理模型催生了Agent产品，这些产品去调用工具、思考规划、并获取用户反馈，形成了一个闭环，从而积累了大量高质量的数据。基于这些数据再去训练模型，模型便将Agent的能力内化进去了。

第三个节点是Agent Team的出现。早期做Agent的同学应该都经历过一个讨论：到底做Single Agent还是Multi Agent？如果任务对上下文（context）要求极高、需要强共享，一般做Single Agent；如果任务可以拆解成多个步骤，Multi Agent架构则更合理。

但到了现在——以Claude 4.6、Codex 5.3、o3等模型为代表——它们把Multi Agent架构内化到模型里面去了。之前那套“脚手架”是我们人为界定的，Agent干完活何时交给另一个Agent，配合不一定好。而且，为每个任务都分配N个带有固定角色的子Agent，也显得过于机械，纯属浪费Token。

当这套脚手架被内化到模型之后，模型能够基于具体的任务和上下文，来判断是否需要创建子Agent来执行单独的子任务，需要创建多少个子Agent。子Agent之间的上下文通信、互相协作变得更加自然，真的很像人类团队一样在协作。用过Claude 4.6、Codex 5.3做vibe coding的人，应该能明显感受到这次提升有多大。

从这三个节点，你能看到一个核心规律：模型与脚手架的关系是一个循环——模型先诞生，然后被用作Agent去干活；单个Agent能力不够，就发展出Multi Agent；接着，这套Multi Agent协作模式又被内化到新一代模型中，形成“Agent Team”。在这个循环之下，模型变得越来越强。

模型与脚手架的协作关系示意图

2. 数据飞轮：模型自我进化的引擎

如果把上面这个规律放到更大的范围来看，你会看到一个清晰的飞轮。

模型变成Agent之后，被置于一个环境中，并配备许多工具。它去执行任务，执行后获得反馈。这个反馈可能是“代码能不能跑起来”，也可能是基于人的反馈——用户是否满意。做过vibe coding的朋友都知道，经常会“骂”AI干得不行。

你这种“骂”，其实就是在生产环境中产生高质量数据：用户的起始prompt是什么、Agent做了什么、它思考了什么、它规划了什么、调用了什么工具、产生了什么结果、用户在过程中做了哪些纠正——所有这些，都是极其真实的训练数据。

基于这些数据再去训练模型，模型就会变得更强。然后再用更强的模型打造更强的Agent、去完成更复杂的任务、从而拿到更多样化的数据，如此迭代循环。这个飞轮的路径，现在已经看得非常清晰了。

模型、数据、Agent与环境的飞轮循环图

我们最开始讲模型训练时，总提算力、算法、数据三要素。发展到现在，数据已成为最重要的因素。

更进一步说，AI的自我迭代已经开始了。现在，大量的Claude Code代码是用Claude Code自己去迭代的；OpenClaw的很多代码也是用AI写的。产品经理的许多需求单让AI来撰写，甚至调校Agent的system prompt也可能是AI完成的。

我记得2025年上半年问了一圈大厂里的程序员，AI编程在他们工作中的占比大概在30%左右；到了下半年，在一些初创公司里，这个占比可能达到了99%以上。甚至连高端的科研领域，如孙天祥团队做的FARS，也开始让AI自己搜集信息、设计实验、撰写论文了。

最近大家如果用OpenClaw（小龙虾）应该有感受，它的自我迭代是另一种模式——你给它一个目标，它能7×24小时不间断运行，拥有非常长的记忆（memory）。因此，它可以自我迭代，变成一个越来越懂你、越来越强大的个人助理。不像我们之前的产品，给一个任务，完成了就结束，下一个任务又得从头开始。

我们正在看到一个明确的趋势：物理世界的事件和数字流程正在被“Token化”。Agent基于这些Token作为上下文，进行规划，调用工具完成一个个任务，拿到更多的数据，再喂回模型。这条路在编程领域已经跑得非常通了，接下来会逐渐向其他行业泛化。

3. 从Coding到一切：智力的泛化

这个泛化进程已经在发生。最开始模型是聊天，聊天成熟后开始编程，编程能力变强后，它又能操控更多工具、完成更多任务，现在已经泛化到其他白领工作。

举几个具体的例子。AI写的产品需求单，程序员看起来会感觉更好——结构更清晰、边界条件考虑得更周全。AI写的需求单，AI自己理解起来也更容易。比如登录组件的需求单，这是产品经理最不想写的部分——非常枯燥但又极其复杂：登录支持哪些接口、报错时显示什么样子、各种边界条件……这些AI写得比我们好非常多。

未来三年，各种更基于文本的工作，会逐渐被AI增强甚至替代。岗位本身不会消失，但对能力模型的要求会截然不同。三年后依然有产品经理这个岗位，只不过我们过去花大量时间做的许多工作——竞品分析、写需求单、做数据分析——都可以让AI来完成，而且做得更好、更快。

与此同时，服务Agent的基建正在快速搭建。API、MCP（Model Context Protocol）、Skills（有种说法是Skills是给Agent用的APP）……这些都在完善。Agent的智力在许多纯粹的任务上已经超越人类，但它要想在这个世界上高效地干活，还需要底层基建的支撑。

这有点像，在座各位都非常聪明，但如果把你丢到一个完全陌生的行业，你不一定能干出什么名堂来，因为你不知道这里的门道（know-how）是什么，工具也不知道在哪用。

现在Agent也一样。我们人类的物理世界和软件系统全都是为人而设计的，Agent只能通过“浏览器模拟使用”之类的迂回方式去操作，效率极低且容易出错，还经常被当成机器人拦截。

从Coding到广泛领域的技能泛化路径图

接下来，为Agent服务的基建会快速兴起。今年有大量公司专注于这方面。你会看到一些传统软件公司股价大跌，而为Agent服务的基础设施公司（比如Cloudflare）股价却在上涨。

按照这个路径推演，大量的工作任务会被Agent完成，围绕Agent会出现大量的服务、工具、数据供给。Token消耗量在今年可能会呈几十倍、几百倍地增长。我了解到有些团队，人均一天的Token消耗量能达到10亿，这是一个非常惊人的数字。

Agent带来的Token消耗指数级增长趋势图

多模态生成线：当技术门槛消失之后

前面讲的是大语言模型的智力线，接下来讲模型进化的另一条线——多模态生成。这部分大家从日常感受上会更直观一些。

1. 各模态都在加速，且速度超出预期

在图像生成领域，Midjourney、Nanobanana等已经是超大规模的应用了。大家平时在电商、海报、各种营销场景中应该大量在使用，不再需要手绘或招聘大量模特、布光、棚拍。

视频模型的进步比我想象的更快。最近的Seedance 2.0，其效果达到了让人震惊的程度——不是AI圈内的震惊，而是让好莱坞的一些导演都感到震惊。

我看到一个评论特别有意思，说它让影视行业的人也体会到了程序员被AI支配的“痛苦”。我之前在剪映、醒图负责图像和视频生成模型的应用，完整经历了整个行业的演变过程，每个版本发布效果都有明显提升，速度真的非常快。

至于音乐，现在Spotify上有很多热门歌曲，虽然没有标注是AI生成，但实际上就是，其水平已经超过了大部分音乐人。音色克隆、TTS（文本转语音）技术都已经到了真假难辨的程度。

2. 核心变化：工具和技术正在被模型“吃掉”

在这些模态加速的背后，有一个共同的关键变化：很多过去的专业工具和技术不再那么重要，因为它们已经被内化到模型里面了。

比如大家用Seedance 2.0时能感受到，你不需要像之前做AI视频那样——对每个分镜讲究特别多，不断打磨分镜、反复“抽卡”。2023年我们培养AI创作者时做过测算，当时全世界能把ComfyUI用得非常溜的也就几千人，门槛太高了。

现在大家也不需要去学ComfyUI了，因为分镜设计、运镜节奏、动作连接这些导演的“门道”，已经被内化到模型里面去了。你写个简单的prompt，模型就懂你想要什么。

这意味着什么？创作的门槛正在消失。以前做一个15秒的视频，你要先生成分镜、修图、处理关键帧、“开卡”、再剪辑，整个流程走下来很累。现在可能一段提示词反复调几次就行了。门槛降低，创作群体就会扩大，内容会越来越“卷”，用户对最终结果的要求也会水涨船高。

传统影视工业里很多岗位会被压缩——舞美、灯光、布景、群演……他们本身的工作可能跟AI没什么直接关系，但因为AI在这块变得更强，导致他们的工作机会无形中减少了。

但对于导演来说，这反而可能是件好事。你不再需要去融很多钱、招演员、搞场地，可以直接把你的想法变成一部短片。很多时候，想法才是最重要的。

电影是技术非常复杂的工业，需要很多角色、很多资源。所以你看到演员、明星、导演，有名有姓的就那么几个，而且来来回回就是那么几个。但全国真的就只有他们几个人有才华吗？不是的，是技术的门槛限制了外部人员的进入。你有再多的才华，没有机会和资源也没用。

短剧把技术资源门槛降了下来，几万、几十万就可以拍一部，不像电影动辄几千万、上亿投资。短短几年，短剧市场规模已破千亿，而电影市场这么多年也只有500亿左右。

3. 往下推演：内容行业会发生什么？

技术门槛消失，产能就会爆炸。这是一场内容行业的生产力革命——小作坊也能做出电视剧和电影级别的内容了。

推演下去，一方面利好抖音、番茄小说这类平台。大量的电影、动画片、电视剧，内容质量越来越好，用户的阈值越来越高，越来越沉浸。但另一方面，内容创作者会面临前所未有的内卷。

跟朋友讨论，这有点类似于当年流行音乐“爆炸”的过程。以前大部分人听的歌是同样的歌，就像以前大部分人看的电影是同样的电影。后来流行音乐产能爆炸了，大家听的歌都不一样了，头部爆款不再像过去那样频繁出现。

其实自媒体已经让类似的变化开始了——以前是电视上的大众明星，现在是无数个小博主。现在AI带来的这波生产力革命，真正让电影级的内容也走向碎片化和去中心化。

但这里有一个更根本的问题——现代人已经越来越无法集中注意力了。甚至连电影学院的学生，都很难坐在教室里看完一整部电影而不去刷手机。这个现象越来越普遍。当观众变了，电影这种艺术形式可能就不会再维持现在的形态。

所以最终受益的可能还是做供给、分发、消费的内容平台。只要视频这个媒介、这个载体不变，最后获利的一定是载体背后的平台。现在的短视频形态有可能已经接近终局了，但我个人希望看到一种新的内容平台形式出现。

对创作者来说，技术门槛消失之后，考验的将是你到底要拍什么、给谁看。审美、创意、故事——这些底层的东西不会变，反而因为技术不再稀缺而变得更加重要。

二、应用层的机会地图

前面讲的是模型两条线各自的进化——大语言模型从推理到Agent Team，多模态从单点突破到技术门槛消失。这些变化落到应用层，具体在哪些方向形成了机会？

这里并非全局扫描，更多是基于我自己关注到的几个方向，大家也可以与自己关注的地方做一些对照。

1. 生产力Agent：最明确的主航道

Agent是今年最明确的主航道，也是机会最多、团队最多、资金最密集的方向。

通用Agent这边，从去年的Manus崛起，到现在的Claude Code、OpenClaw、Claude Cowork，国产的也有阶跃的桌面助手、Cherry Studio等等。这是一个已经形成共识的赛道，因此也会非常拥挤，但它可能会成为一个偏入口级的机会。

按照前面的逻辑，很多工作任务都会被Agent完成，那么我们每个人都会需要一个自己的Agent——它获取你的上下文、你的意图、你的偏好，然后带领一堆工具和服务帮你去做事。这个领域，大厂和创业公司都不想放弃，尤其是在Manus被Meta以几十亿美金收购之后，完成了从想法到落袋为安的闭环，会吸引更多人涌入。

垂直Agent是我看到机会最多的方向。因为这个世界上有多少个岗位，可能就有多少个垂直Agent；有多少个行业，就有多少个Agent。招聘、市场调研、旅行规划、合规审查、猎头……这些垂直Agent的流程相对明确，数据也比较结构化，AI提效后带来的收益很直接。

很有意思的是，美国这波AI创业，真正从C端跑出来的其实不多，大量都是B端的机会。这些垂类Agent的ARR（年度经常性收入）增长非常快，做起来也没有想象中那么难。甚至，资本会大量收购传统的中介或服务公司（Agency）。这些公司有渠道、有数据、有行业经验（know-how），但受限于人力，很难规模化。被收购后，通过AI进行改造，规模能迅速扩大。虽然天花板不一定非常高，但这是明确的收入来源。

这里有一个认知上的转变需要发生：过去我们做的很多Agent，本质上是在补模型的不足——模型不够强，就用Agent的“脚手架”去弥补，做的都是些非常工程化、基建性质的事情。但现在模型变强了之后，你应该思考一些更大胆、更有想象力的事情，而不是还停留在“补丁思维”里。但这个转变其实很难，因为向前看可能仍是一片迷雾。

Agent Infra（基础设施） 是新的基础设施层。如果Agent变成新的入口，那如何服务这些入口？过去抖音是流量入口，你在上面供给内容和商品。现在AI变成入口，它是要干活的，所以供给不一样——不是娱乐视频，而是工具、服务和数据。

具体来说：

怎么给Agent提供数据？（API vs 爬虫，各有各的问题）
怎么提供更好的工具？（Agent用的工具跟人用的软件不是一回事）
怎么处理上下文？（比如最近GitHub前CEO做的Entire，利用Git协议来协助Agent处理coding的上下文）
怎么做记忆（Memory）管理？

这些都是Agent的Infra，存在很多机会，但门槛也有一定要求。

这里有一个关键认知：不同行业之间的AI渗透差距极大。Coding领域Agent已经极强了，但很多传统行业连基础的信息化都还没做好。我最近去一些企业做咨询，发现他们很多任务其实可以被AI完整且很好地完成，但他们不知道，顶多问问“豆包”。

比如帮金融、律师行业做咨询，我做的事情就是帮他们安装一个Claude Code，然后把文档、文本任务按需求让Claude去干。当他们看到结果时是真的震惊——震惊到他们开始认真思考组织优化的问题了。

你可以这么想：大厂已经是人才密度最高的地方了，但你经常会发现身边很多同事其实没那么“聪明”。那再想想其他行业，人才密度是远低于大厂的，老板很难给出大厂一样的工资，人才质量参差不齐，干活效果经常让老板不太满意。AI在任务层面已经可以比很多行业的大部分从业者做得更好了，但这些行业对此并不知情。这种信息差，本身就意味着巨大的机会。

2. AI互动平台：寻找消费侧的增量

前面讲的Agent更多是在供给侧——生产力提升带来生产关系的变化。但按照历史经验，更大的机会照理来说应该在消费侧。消费侧带来极大的增量之后，又会在供给侧引发更大的增量，这是移动互联网验证过的逻辑。

但我们目前在AI的消费侧，还没有看到一个类似微信、抖音、美团那样的平台级超级机会。我目前关注到两个方向。

第一个是AI陪伴。2022年Character.AI就做出来了，当时数据极好，但后面又下去了。字节做了“猫箱”，MiniMax做了“星野”，但好像也没有做大。我不是目标用户，没有直观感受。从产品经理视角，我曾以为这个赛道不太成立了。

但其实现在有非常多AI陪伴类的小应用，生意非常赚钱——规模不大但非常赚钱。我了解到，乙女陪伴类应用的付费率能达到20%-30%，这是超乎想象的。在移动互联网时代，付费率超过5%就非常了不起了。

不过，合规是个大问题——做大了就要面临严格的合规审查，而一旦完全合规，产品又容易变得“无聊”。所以现在是大量小而美的机会，很多极小的团队在做，能养活团队、能赚钱。

第二个是AI互动平台——这可以理解为在博一个更大的机会。一个不太恰当的比喻，就是做“AI版的抖音”。目前看到天使轮融资超过1000万美金的非模型公司，大概率就是在做这个方向。

这里涉及到几条技术路径。一种是做实时视频生成。异步生成（像Seedance那样写prompt等结果出来）还是在抖音的短视频范式内。但如果生成速度足够快，零点几秒就出结果，那就变成实时交互了，可能催生全新的交互方式和平台形态。另一种路径是通过AI编程来生成互动内容——比如最近的Loopit，写个prompt直接生成一个可以玩的小游戏。

从我对模型的推演来说，纯粹的多模态生成效果天花板应该更高，但技术成熟的时间还没到。最终出来的形态是直播、游戏、短视频，还是它们的综合体，目前还不清楚。大家都在探索，故事都好讲，但最难的是“上手玩”到底好不好玩。用户不会为故事买单——就像最开始抖音，大家也觉得它就是个一阵风的小东西，但它就是好玩，简单直接的好玩。

3. AI硬件：Context的物理入口

AI硬件也是我聊了一些团队后觉得很有意思的方向。

Plaud的成功是个标杆。现在它一年大概有2-3亿美金的收入，而且是盈利的。它做的事情非常简单——在手机背面贴一个像充电宝一样的录音壳，想录音的时候直接一按就好了，不需要你打开一个软件再去操作。硬件在获取物理世界的上下文，以及在用户交互的简单性上，有极大的优势。

而且Plaud打了一个很好的样板——AI让硬件从“一锤子买卖”变成了“订阅制”。它的软件付费率和续费率非常高，对营收贡献极大。所以现在带动了大量的人在做语音转录相关的AI硬件。

还有视频领域的可穿戴设备。美团出来的孙洋做了Looki，一个挂在身上的设备，全天候把你看到的场景（context）记录下来，然后给Agent做分析和记录。字节背景的潘宇扬做了OdyssLife，一个带摄像头的项链，拍摄你吃饭的内容来做营养分析。

这些都是在用硬件帮你收集真实生活的context。因为AI很多时候表现不好，恰恰是因为给它的context不够。目前主要依赖人的prompt和电脑里已有的文件，这些context相比用户的真实生活，其实是非常匮乏的。

还有一些展示和交互类硬件：智能镜子做美学分析，客厅屏幕展示AI管理的日历，智能挂画能把亲人照片生成写真还能聊天。这些东西技术不难，但卖得还挺好，用户的付费意愿比软件强很多。

AI硬件的门槛和机会在于：做AI的人不懂硬件，做硬件的人不懂AI。像大疆这种硬件巨头，对软件和用户体验的理解可能比互联网公司要差很多。两者结合有天然的壁垒。做几台Demo，做1万台试水，做10万台量产，对供应链的要求完全不一样，对团队的要求也不同。这个圈子不是你随随便便跑到深圳就能轻易进入的。

如果你有硬件的经验和供应链的资源，可以考虑做AI硬件，尤其是出海——美国人是很难做好硬件的，因为供应链的核心在深圳。

三、个人在这个时代如何不掉队

前面讲的是趋势，接下来讲大家最关心的——在这个大的局势下，你应该怎么办？

先总结一下前面的趋势：AI在吞噬工具，也在吞噬“工具人”。

你来想一下，假如你现在做的事情，很多任务是不是可以让Claude Code帮你完成？它完成的效果是不是还不错？如果你的大部分任务都能被完成，那你就处于一个比较危险的位置。

以及，我们身边的很多同事，说实话，很多公司里面存在着大量的“工具人”。每个公司的老板都不希望组织变得臃肿——增加一个人的成本不只是工资，工位、社保这些都是显性成本，更重要的是隐性的管理成本：管10个人跟管100号人难度完全不一样。如果AI逐渐在任务层面完成得更好，组织就会变得更加精干。这对老板来说是好事，但对部分打工人来说可能就是个需要警惕的信号。

有一个简单的判断方式：如果你的工作过程数据已经高度线上化、数字化，那么AI大概率会干得比你更好。程序员最先受到冲击就是这个原因——代码全都在线上，AI把这些数据一学，就可以做得比大部分人更好。关键就在于，数据是模型进步的最大要素。

人与人之间的能力差距会急剧拉大。以前手写代码的时代，程序员之间的效率差距顶多两三倍。但在AI时代，可能是几十倍甚至上百倍的差距——这种差距在大厂里可能看不出来，但一旦出来独立做事，感受就会非常深刻。

我前段时间认识一个人，他同时让30个Agent帮他写代码，为此内存买了128G，因为16G根本不够用。每个月在Claude上的支出是几万块，一天能发布十几个版本。字节已经算是移动互联网里迭代非常快的了，一周一个版本，但人家能做到一天十几个版本。

用AI已经不是用一个工具了，而是在驱动一个“团队”帮你干活。那谁用AI用得好？我观察到两类人特别突出：一类是非常年轻的人，没有思想包袱，本身就很“AI native”；另一类是技术出身的团队管理者——懂技术架构同时也懂项目管理，驱动AI干活的效果就非常好。

AI会变得极强，成为很厉害的放大器，但对人的要求也越来越高，“人+AI”组合带来的产出差距也越来越大。

还有一点：个人喜不喜欢，在这个时代还是挺重要的。变化太快了，有很多机会涌现，如果你不喜欢，硬“卷”也卷不出什么名堂。不是所有人都要往同一个方向挤，找到你自己有热情的切入点，才能持续走下去。

1. 大厂：去高浓度AI业务

如果你还在大厂，我的建议是尽可能去AI是其核心的业务团队。字节的豆包、剪映、Coze、飞书里的AI业务，阿里的通义千问，腾讯的元宝等等。虽然这些地方也会很卷、可能很乱，但你在一个AI是业务最核心的团队里，能拿到更多的第一手信息，团队内部对AI的共识更容易达成，实践机会也更多。

如果你过往没有很好的AI背景，我非常推荐去这些业务。咬牙坚持至少半年或一年，你会比在一个传统业务里自己琢磨有效得多。

进不去核心AI业务怎么办？你要尝试在自己的业务里主动做一些AI项目。这一点很重要——如果你不做，首先你是没有第一手认知的。你会看到大量信息，包括今天我分享的这些，但这些不是你自己的信息，对做决策没有太大帮助。有点像读书的时候，上课听讲感觉都会了，一做题就不会了。看遍巴菲特、查理·芒格的书，但自己不在股市里真金白银地下注，永远学不会投资。

你还可以自己做side project——无论是帮业务提效，还是纯粹自己觉得好玩就做。看AI信息、自己动手build产品、做一个有用户规模的AI产品——这三个层次对人的认知要求完全不一样，不能只停留在第一个层次。

移动互联网已经没有新故事了。去年的外卖大战算是最后一波“回光返照”，已经没有任何新的、令人兴奋的东西了。现在的行业共识就是要去做AI，AI又是一片蛮荒之地，很多领域刚刚开始。能做AI，就尽量去做AI。

如果考虑城市选择：深圳偏AI硬件，杭州偏AI与商业结合（做生意类），上海偏大型AI业务，北京偏模型研发和前沿应用。不同城市的AI生态差异很大，选对城市也是选对生态。

2. AI初创公司：一个非标准化的世界

如果你在大厂核心AI业务进不去、自己业务里做AI方案也推不动，可以考虑去AI初创公司。但大部分从大厂出来的人没有AI初创公司的经历，可能会踩一些坑。

我讲几个简单的判断标准。

第一个：这家公司有没有提供“无限量”的Token？ 如果不提供，说明这个公司可能不是真正的AI native。无限量Token非常贵，但如果它是AI native公司，这些Token可以高效地转化为公司的生产力和效益，所以它才愿意提供。

第二个：如果“梯子”挂了，这个公司还能不能正常运行下去？ 如果所有人都发现没办法干活了，说明这是一个非常依赖国际模型和生态的、AI浓度极高的公司。

求职方式也跟大厂不同。不一定是标准化的写简历、投递、走面试流程，更多可能是通过熟人介绍、信任背书，或者你的作品（如GitHub项目）背书。人的介绍很重要，因为在更不确定、更开放的早期阶段，对一个人的人品和综合素质要求更高。简历会“骗人”，面试也会“骗人”。你的GitHub主页或side project可能比一份光鲜的简历更重要——因为创业公司做的事情跟大厂太不一样了，你在大厂把投放系统做得多精细，在初创公司不一定用得上，那里可能连这些系统都没有。

AI初创公司的真相是：外面看起来很高端——创始团队是Meta、Google、字节背景，但实际上内部也很“草台班子”。有很厉害、很前沿的地方，也有非常粗糙、需要摸索的地方，这是一个更加真实的状态。大厂有很多标准和流程，让你有时感到难受，但实际上它保证了工作的下限。创业公司没有这些流程，人和文化就变得特别重要。

日常节奏也完全不同。大厂里一天可能有20个deadline追着你；但创业公司有时候一天只专注做一两件大事，有时候又忙到疯。没有没完没了的“价值证明”会议，没有“没有问题要制造问题”的内耗。这种节奏感跟大厂完全不一样，有的人会非常不适应这种“没人管你，但你必须高度自驱”的状态。

薪资不一定降。现在有些字节系出来创业的，融资额很高，你甚至还能涨薪。但大部分情况可能是需要降低现金薪资，以换取更多的期权。需要清醒认识的是，期权在大部分情况下是“废纸”，公司最终能上市或被收购的概率极低，可能1%都不到。像字节、小红书这样有成熟回购机制的公司也极其罕见。但你在这过程中收获的经验和成长速度是真实的——因为你在大量地做你从来没做过的事情。

3. 创业：拿钱相对容易，团队最难

现阶段，拿钱是相对好拿的时候，VC（风险投资）依然存在FOMO（害怕错过）的情绪。如果你有一定的履历（比如在字节的剪映、豆包、抖音等核心业务待过），加上你对想做的事情想得比较清楚——有一定的市场天花板，故事不错，有靠谱的切入点——那么钱是比较好拿的。

如果一开始拿不到红杉、高瓴、IDG这些顶级机构的钱，可以先做一轮“亲友轮”。跟认识你、信任你的人聊聊你想做什么，大家觉得可以就投个几万或几十万，就当支持朋友、打水漂的心态。但如果做成了，这几万块可能换来了公司1%的股份，后面拿到机构投资时估值翻了几十上百倍，回报非常可观。亲友轮的几十万，其实足够你做出一个像样的Demo了。

但最难的是团队。互相信任、彼此互补——这八个字我有极深刻的感受。没有信任的话，遇到困难团队一下就分崩离析了。如果按大厂里那种常见的、彼此防备的关系模式，是不可能一起创业的，一遇到问题就会互相甩锅。

怎么找联合创始人（Co-founder）？最靠谱的方式是找以前合作过的人——字节的人找字节的熟人，腾讯的找腾讯的，或者找你在项目里紧密配合过、深知对方能力项和人品的人。只有真正一起干过活、打过仗，才知道对方到底行不行。

但也要注意：很多早期的“元老”或同学，过了5-10年，能力可能跟不上了。上下铺兄弟、室友同学不一定是最优选择——找人要看当下能力的匹配度，而不仅仅是关系的远近。

创业方向大概率会换。你看到很多AI公司现在产品做得挺好，但实际上之前已经换了好几个方向了。这不是例外，而是常态。张一鸣最开始也换了好几个方向。

创始人的核心工作：找钱、找人、找方向、为团队降噪。因为团队会接收到外界大量的噪声（杂音），创始人需要把这些信息收敛下来，让大家在一个相对清晰的范围内专注做事。另外，创始人会非常孤单——压力太大时，有些话不能跟团队讲，讲多了人心就慌了。最好有自己的创始人圈子，很多你遇到的问题网上没有答案、AI也没有答案，但问一下其他创始人可能就知道了。

如果要选方向创业，一定要认真考虑出海。国内市场，个人用户付费能力有限，企业客户预算紧张，大厂又太强，做国内市场非常艰难。出海的世界很大——美国市场做不了还有东南亚，东南亚做不了还有拉美、中东，还有日本（用户付费能力强）。能拿美元基金的钱就拿美元——国内有些VC的钱附带比较苛刻的条款，其本质更像是“债”而不是纯粹的投资。

4. 一人公司：小而美的可能

“一人公司”现在很火，但已经被有点神话了，需要真实、理性地看待。

首先，你要有Build的能力。Vibe Coding + 基本的工程化能力，是必须掌握的基本技能。有了这个能力，你可以做一些“小生意”——市场上有很多小需求，对公司来说不值得专门投入资源去做，但对个人来说，其收益已经足够了。比如月收入几千到1万美金，在大厂里有多少人月薪能达到1万美金（约7万人民币）？其实没多少。

具体形态可以是：小工具、浏览器插件、AI工具导航站（接Google Ads赚广告费）等等。这跟大厂做的事情完全不一样，我自己也不太擅长。因为我们太习惯依附于一个大体系，去做宏观的、规模大的生意了，对这种“小而美”的生意，要么看不上，要么不知道怎么做。它其实没有那么难，但关键是你要能敏锐地挖掘到那个真实、具体的需求点。

品牌和自媒体变得非常重要。现在AI编程门槛降低之后，很多工具类产品的复制成本极低，大家可以快速复刻。有多夸张？你花几周做一个APP出来，可能已经有专门的Agent能在两三天内就把你的APP核心功能复刻出来。那用户为什么还要用你的？因为你有品牌。有时候，内容就是品牌。在打磨产品的同时经营自媒体——产品本身不一定赚钱，但通过影响力可以触达更多人，甚至通过知识付费、课程等方式获得收入。

为什么自媒体在AI时代变得更重要？因为供给侧（产品开发）的门槛降低之后，产品本身的壁垒越来越弱。内容就是品牌，品牌就是影响力，影响力就是你在“注意力经济”里的核心杠杆。创始人亲自做自媒体，相当于为公司省下了一大笔市场推广费用。做内容的关键，不是追求每一篇都是精品，而是持续输出——持续输出本身就是一种筛选和积累。对于想做一人公司的人来说，一定要做自媒体，这可能说得有点绝对，但确实非常非常重要。

四、能力转型与冷静判断

1. 每个岗位都需要的四种能力

很多人问我：AI时代，设计师怎么转型？运营怎么转型？产品经理怎么转型？做AI测评做久了，会不会自己也变成“工具人”？

大家都逐渐看到，AI时代岗位的边界正在变得模糊。同一件事，算法、产品、设计、运营其实都能干；也有些事，目前谁都干不好，大家都在边学边干。

那什么能力是共通的？我总结了四个：

第一，Build的能力。至少能动手做出一个可演示的Demo。过去的专业积累门槛太高，限制了许多人的尝试。但现在这个门槛降低之后，一些底层学习能力、逻辑思维能力更好的人反而会脱颖而出。

第二，对模型的理解。模型是什么、能做什么、不能做什么、怎么让它表现更好。这个认知不是看几篇论文或评测文章就行的，必须亲自动手去用、去调、去感受它的边界。

第三，对用户需求的理解。无论产品形式怎么变，满足用户价值这个商业本质没有变。需求是什么、用户是谁、如何更好地满足、如何归因、如何优化——这些核心逻辑没变，只不过实现的具体技能和工具变了。

第四，对行业趋势的把握。即信息获取和独立判断的能力。大厂很容易形成“信息茧房”。你身边如果都是算法研究员，你可能不知道外部世界的技术应用参差不齐到了何种地步，不同行业之间的差距是非常大的。能看到不同世界之间的差距，并能理解其原因，这本身就是一种稀缺的能力。

关于“测评”这个问题很多人问到。做测评是非常好的AI产品入门方式，是练基本功。但如果你长期一直只做测评，从职业发展的实际角度来看，确实有变成“工具人”的风险。模型越来越强，强到你用普通任务可能已经评测不出明显差异了——现在已经是这样，很多时候你得设计非常刁钻、复杂的任务才能区分高下。测评是入门，但最终你还是要往业务深处走——思考这个应用怎么能变得更好、吸引更多用户、有更好的留存和付费，你个人能为此带来什么贡献。

2. 几个冷静的判断

最后讲一些相对冷静的观点。在FOMO情绪之外，我们需要一些更接近真实的判断。

裁员不会一夜之间发生，但招聘会持续收紧。不会是一夜之间所有公司大规模裁员（当然现在也有亚马逊一夜裁员上万人这样的案例）——但从更宏观的层面看，不会那么剧烈。对很多公司来说，变化在于不再倾向于招聘那么多人了，会招更少、更精的人。对个人来说，最直接的感受就是工作更难找了。

大家可以问自己一个问题：大厂里那么多年薪百万的人，你实际做出的工作产出、投入的精力，有多少是真正“值得”年薪百万的？坦白说，大部分人日常做的工作内容其实非常单薄。我们应该主动让AI去帮我们处理那些机械性、重复性的工作，解放自己，去做那些更有创造性、判断性和策略性的价值。一个业务里，真正提供不可替代核心价值的人往往没有几个，大部分人做的是支撑性的基础工作。

目前Agent直接ToC盈利仍有困难，但趋势向好。为什么难？因为运行Agent太“贵”了，Token消耗量非常高。但也要看到，模型本身的成本在持续下降，三年来百万Token的成本下降了多少大家有目共睹。同时，芯片、存储、电力、数据中心等底层基础设施都在快速铺开。

这里涉及到定价逻辑的根本性转变——到底应该基于“工具”定价，还是基于“人力替代”定价？工具逻辑是几美元或几十美元一个月，但现在已经出现个人用户月消耗几千美元的案例了。几千美元其实是“人的逻辑”——同样的服务，如果你认为它只是一个工具，50美元/月你觉得好贵；但如果它是一个“人”（或一个高度拟人的智能体）在帮你全职干活，100美元、200美元/月你反而觉得不贵。

在非常成熟的组织里推动AI提效，收效可能有限。在一个分工固化、流程锁死、每个环节的输入输出要求都已固定的成熟组织里，你会发现跟AI的“野路子”很不匹配。更有效的方式，往往是单独划出一个封闭的AI创新项目，在这个项目里，每个人的职责边界被暂时打破，大家都尝试做一些自己不擅长的、不确定的事情，反而能碰撞出火花。

这里有个很有意思的规律：当你做自己不太擅长的事情时，你会更加依赖和善于利用AI；当你做自己非常熟练、已成肌肉记忆的事情时，你反而会觉得AI不大行、碍手碍脚。所以，要让自己主动进入“不舒适区”，你才会真正体会到AI作为“能力延伸”的价值。

如果你是团队管理者，想让团队用上AI，最好的方式非常简单——给那些真正想用、愿意尝试的人提供“无限量”的Token，就够了。Token确实很贵，但只有用起来才有感觉。让一部分人先用起来，做出成绩，自然能带动其他人。这是成本最低、效果最好的AI赋能和培训方式。

真正的认知获取，只有通过付出成本的决策。看资料、听分享——包括阅读今天这篇文章——你投入的成本太低了，投入几十分钟、几个小时就结束了，所以吸收的信息往往非常浅层。如果你的成本是因为做错了一个关键决策，导致了用户流失、数据下跌，那么你才会被迫去思考最本质、最核心的问题。在云栈社区这样的开发者平台上交流实践，也是一种宝贵的认知提升途径。

写在最后

这是一个比移动互联网浪潮演进更快的时代。

我问过一些经历过PC互联网和移动互联网完整周期的人，他们普遍认为AI这波浪潮比之前两个都要更快、更“可怕”。行业共识形成的速度也在急剧加快——从需要半年到一两个月，再到一周，现在有时候几个小时就能在一个小圈子里达成共识。

短期来看，我们可能高估了AI，因为整体的FOMO情绪非常严重，这会带来强烈的割裂感。中期来看，我们大概率是低估了AI能带来的深远影响。长期来看，我不知道这个社会最终会演变成什么样子。

AI的渗透极度不均匀——编程领域已经翻天覆地，但很多传统行业还浑然不觉。这既是当下普遍感到割裂的来源，也意味着存在大量未被发掘的机会。

总结一下，对于我们个人而言：

尽可能投身于高浓度AI业务，或者在自己现有业务中主动发起AI项目。
如果在大厂无法实现，可以考虑加入AI初创公司，但要提前理解其“非标准化”的运行模式。
如果有志创业，当前拿钱相对容易，但组建“互相信任、彼此互补”的团队最难。
如果探索一人公司，Build能力是基础，而经营品牌和自媒体是重要的增长杠杆。
无论身处什么岗位，都要有意识地培养Build能力、深化对模型的理解、夯实对用户需求的洞察，并保持对行业趋势的敏锐把握。

奇点临近，浪潮已来。与其陷入焦虑，不如静心构建自己的认知框架，找到自己在这场变革中的独特位置。

说一句实在话：我专注AI领域三年，之前做的大部分东西，现在回头看都没什么太大意义了。但不要紧——你的认知是在真实成长的，每个阶段都有每个阶段该做的事。如果你总想着“我现在做的东西必须是终局、必须永不过时”，那心态就不太对了。接受过去的工作和经验可能会被快速迭代甚至淘汰，然后保持开放心态继续往前走，这本身就是一种需要锻炼的重要能力。

AI作为一次深刻的生产力变革，长远来看会带来极大的社会繁荣，但也必然伴随着短期的技术性阵痛和结构性调整。不确定这个调整期是3年还是10年。对于个体而言，要么积极拥抱这波红利，争取迅速起飞；要么就要调整心态，储备能量，让自己在变化中活得足够久。

回归根本，吃好喝好，保持身心健康，活下去比什么都重要。关于未来的职业规划，更需要我们在行动中不断探索和调整。

上一篇：网曝公司用GLM-5+初级研发替代中高级Java程序员，引发AI替代潮担忧
下一篇：悬空指针陷阱与根治：从free(NULL)到堆栈差异的C语言内存管理指南

人工智能, 智能代理, 大语言模型, 职业发展, 技术趋势