最近几个月,陆续有同事朋友找我聊天。话题不外乎几种:对工作现状的迷茫、想了解外面AI到底发展到什么程度了,或者纯粹是半夜情绪上来需要聊聊。我发现大家的感受出奇地一致,是一种强烈的割裂感。
一边是自媒体上铺天盖地的“炸裂”、“震惊”、“颠覆”,仿佛明天世界就要天翻地覆;另一边是回到日常工作和生活,AI的作用似乎依然有限,该开的会还是在开,该协调的流程还是要协调。
我自己从大厂出来后,离开了过去那个成熟精密但节奏偏慢的体系,对这种割裂感的体会比以往更强烈。如果说2025年是AI应用层的元年,那么到了2026年,AI应用的爆发已经真切地发生了。说实话,连我自己都时常感到焦虑,因为这变化实在太快。
有点像坐在一辆不断加速的火箭上——推背感不是在启动的瞬间最强,而是随着速度提升变得越来越强,快到让你心生一丝恐惧。23到24年时,我的注意力还能覆盖住大部分行业信息;到了26年,信息量已经大到几乎无法覆盖,有大量动态我其实也并不了解。
本文源自一次内部分享,主要分为几个部分:先探讨模型进化的底层逻辑——大语言模型的智力线和多模态生成线各自如何发展,为什么会越来越强;然后分析应用层的机会在哪里;最后,在这个大背景下,探讨个人应如何进行职业选择和能力准备。
希望大家能基于这套逻辑,再去审视那些铺天盖地的信息,学会分辨哪些是噪声,哪些是对你而言真正重要的信号。构建自己的认知框架,远比盲目追逐每一个热点更有价值。
一、模型进化:两条主线,一个飞轮
我们先从模型的发展讲起。很多人觉得大模型离自己很远,是算法和研究员才关心的事。但实际上,理解模型如何进化,是你判断行业趋势和做出个人选择的基础。这就像移动互联网早期,你需要理解4G、GPS、智能手机和摄像头意味着什么,才能抓住后面的机会。否则,你可能只会想着把PC网页塞进一个4英寸的小屏幕,然后发愁怎么在小屏里塞广告位。
模型的发展清晰地分为两条主线:一条是大语言模型(LLM)的智力线,另一条是多模态生成线。两条线背后的逻辑是相通的——数据飞轮驱动模型持续变强,而技术门槛则不断被内化到模型之中。我们先讲智力这条线。
大语言模型的智力线
1. 三个关键节点
这条进化路线有三个关键节点,每一步都在为下一步积累至关重要的数据和能力。
第一个节点是推理模型的突破。2024年9月,OpenAI的o1模型发布,让模型在回答问题前能“先自己想一想”,即思维链(CoT)。接着是2025年1月的国产平替DeepSeek R1,以及后续的Claude 3.7、Gemini 2.5等,这些都是推理模型。
推理模型催生了第一批AI Agent产品,如Manus、Genspark、Lovart等。基于用户的提示(prompt),模型会思考、规划,然后调用手头的工具去执行任务,而非简单地回答问题。这可以说是AI原生应用层真正开始的起点。
但那时很多Agent产品其实做了大量补丁工作,用户体验不佳,执行能力也差强人意,因此在2025年上半年引发了诸多争议。
第二个节点是Agentic能力的实质性提升。到了2025年11月Claude 4.5发布后,使用“氛围编程”(vibe coding)的人群大大增加。此前用Claude 3.7做vibe coding还挺麻烦,但到了4.5明显好用了很多。再加上Codex 5.2、以及在前端表现突出且无需安装即可在线使用的Gemini 3(通过AI Studio),AI编程开始进入更广泛的人群。
这里很核心的一点是,模型的Agent能力开始真正显现。为什么?因为之前的推理模型催生了Agent产品,这些产品去调用工具、思考规划、并获取用户反馈,形成了一个闭环,从而积累了大量高质量的数据。基于这些数据再去训练模型,模型便将Agent的能力内化进去了。
第三个节点是Agent Team的出现。早期做Agent的同学应该都经历过一个讨论:到底做Single Agent还是Multi Agent?如果任务对上下文(context)要求极高、需要强共享,一般做Single Agent;如果任务可以拆解成多个步骤,Multi Agent架构则更合理。
但到了现在——以Claude 4.6、Codex 5.3、o3等模型为代表——它们把Multi Agent架构内化到模型里面去了。之前那套“脚手架”是我们人为界定的,Agent干完活何时交给另一个Agent,配合不一定好。而且,为每个任务都分配N个带有固定角色的子Agent,也显得过于机械,纯属浪费Token。
当这套脚手架被内化到模型之后,模型能够基于具体的任务和上下文,来判断是否需要创建子Agent来执行单独的子任务,需要创建多少个子Agent。子Agent之间的上下文通信、互相协作变得更加自然,真的很像人类团队一样在协作。用过Claude 4.6、Codex 5.3做vibe coding的人,应该能明显感受到这次提升有多大。
从这三个节点,你能看到一个核心规律:模型与脚手架的关系是一个循环——模型先诞生,然后被用作Agent去干活;单个Agent能力不够,就发展出Multi Agent;接着,这套Multi Agent协作模式又被内化到新一代模型中,形成“Agent Team”。在这个循环之下,模型变得越来越强。

2. 数据飞轮:模型自我进化的引擎
如果把上面这个规律放到更大的范围来看,你会看到一个清晰的飞轮。
模型变成Agent之后,被置于一个环境中,并配备许多工具。它去执行任务,执行后获得反馈。这个反馈可能是“代码能不能跑起来”,也可能是基于人的反馈——用户是否满意。做过vibe coding的朋友都知道,经常会“骂”AI干得不行。
你这种“骂”,其实就是在生产环境中产生高质量数据:用户的起始prompt是什么、Agent做了什么、它思考了什么、它规划了什么、调用了什么工具、产生了什么结果、用户在过程中做了哪些纠正——所有这些,都是极其真实的训练数据。
基于这些数据再去训练模型,模型就会变得更强。然后再用更强的模型打造更强的Agent、去完成更复杂的任务、从而拿到更多样化的数据,如此迭代循环。这个飞轮的路径,现在已经看得非常清晰了。

我们最开始讲模型训练时,总提算力、算法、数据三要素。发展到现在,数据已成为最重要的因素。
更进一步说,AI的自我迭代已经开始了。现在,大量的Claude Code代码是用Claude Code自己去迭代的;OpenClaw的很多代码也是用AI写的。产品经理的许多需求单让AI来撰写,甚至调校Agent的system prompt也可能是AI完成的。
我记得2025年上半年问了一圈大厂里的程序员,AI编程在他们工作中的占比大概在30%左右;到了下半年,在一些初创公司里,这个占比可能达到了99%以上。甚至连高端的科研领域,如孙天祥团队做的FARS,也开始让AI自己搜集信息、设计实验、撰写论文了。
最近大家如果用OpenClaw(小龙虾)应该有感受,它的自我迭代是另一种模式——你给它一个目标,它能7×24小时不间断运行,拥有非常长的记忆(memory)。因此,它可以自我迭代,变成一个越来越懂你、越来越强大的个人助理。不像我们之前的产品,给一个任务,完成了就结束,下一个任务又得从头开始。
我们正在看到一个明确的趋势:物理世界的事件和数字流程正在被“Token化”。Agent基于这些Token作为上下文,进行规划,调用工具完成一个个任务,拿到更多的数据,再喂回模型。这条路在编程领域已经跑得非常通了,接下来会逐渐向其他行业泛化。
3. 从Coding到一切:智力的泛化
这个泛化进程已经在发生。最开始模型是聊天,聊天成熟后开始编程,编程能力变强后,它又能操控更多工具、完成更多任务,现在已经泛化到其他白领工作。
举几个具体的例子。AI写的产品需求单,程序员看起来会感觉更好——结构更清晰、边界条件考虑得更周全。AI写的需求单,AI自己理解起来也更容易。比如登录组件的需求单,这是产品经理最不想写的部分——非常枯燥但又极其复杂:登录支持哪些接口、报错时显示什么样子、各种边界条件……这些AI写得比我们好非常多。
未来三年,各种更基于文本的工作,会逐渐被AI增强甚至替代。岗位本身不会消失,但对能力模型的要求会截然不同。三年后依然有产品经理这个岗位,只不过我们过去花大量时间做的许多工作——竞品分析、写需求单、做数据分析——都可以让AI来完成,而且做得更好、更快。
与此同时,服务Agent的基建正在快速搭建。API、MCP(Model Context Protocol)、Skills(有种说法是Skills是给Agent用的APP)……这些都在完善。Agent的智力在许多纯粹的任务上已经超越人类,但它要想在这个世界上高效地干活,还需要底层基建的支撑。
这有点像,在座各位都非常聪明,但如果把你丢到一个完全陌生的行业,你不一定能干出什么名堂来,因为你不知道这里的门道(know-how)是什么,工具也不知道在哪用。
现在Agent也一样。我们人类的物理世界和软件系统全都是为人而设计的,Agent只能通过“浏览器模拟使用”之类的迂回方式去操作,效率极低且容易出错,还经常被当成机器人拦截。

接下来,为Agent服务的基建会快速兴起。今年有大量公司专注于这方面。你会看到一些传统软件公司股价大跌,而为Agent服务的基础设施公司(比如Cloudflare)股价却在上涨。
按照这个路径推演,大量的工作任务会被Agent完成,围绕Agent会出现大量的服务、工具、数据供给。Token消耗量在今年可能会呈几十倍、几百倍地增长。我了解到有些团队,人均一天的Token消耗量能达到10亿,这是一个非常惊人的数字。

多模态生成线:当技术门槛消失之后
前面讲的是大语言模型的智力线,接下来讲模型进化的另一条线——多模态生成。这部分大家从日常感受上会更直观一些。
1. 各模态都在加速,且速度超出预期
在图像生成领域,Midjourney、Nanobanana等已经是超大规模的应用了。大家平时在电商、海报、各种营销场景中应该大量在使用,不再需要手绘或招聘大量模特、布光、棚拍。
视频模型的进步比我想象的更快。最近的Seedance 2.0,其效果达到了让人震惊的程度——不是AI圈内的震惊,而是让好莱坞的一些导演都感到震惊。
我看到一个评论特别有意思,说它让影视行业的人也体会到了程序员被AI支配的“痛苦”。我之前在剪映、醒图负责图像和视频生成模型的应用,完整经历了整个行业的演变过程,每个版本发布效果都有明显提升,速度真的非常快。
至于音乐,现在Spotify上有很多热门歌曲,虽然没有标注是AI生成,但实际上就是,其水平已经超过了大部分音乐人。音色克隆、TTS(文本转语音)技术都已经到了真假难辨的程度。
2. 核心变化:工具和技术正在被模型“吃掉”
在这些模态加速的背后,有一个共同的关键变化:很多过去的专业工具和技术不再那么重要,因为它们已经被内化到模型里面了。
比如大家用Seedance 2.0时能感受到,你不需要像之前做AI视频那样——对每个分镜讲究特别多,不断打磨分镜、反复“抽卡”。2023年我们培养AI创作者时做过测算,当时全世界能把ComfyUI用得非常溜的也就几千人,门槛太高了。
现在大家也不需要去学ComfyUI了,因为分镜设计、运镜节奏、动作连接这些导演的“门道”,已经被内化到模型里面去了。你写个简单的prompt,模型就懂你想要什么。
这意味着什么?创作的门槛正在消失。以前做一个15秒的视频,你要先生成分镜、修图、处理关键帧、“开卡”、再剪辑,整个流程走下来很累。现在可能一段提示词反复调几次就行了。门槛降低,创作群体就会扩大,内容会越来越“卷”,用户对最终结果的要求也会水涨船高。
传统影视工业里很多岗位会被压缩——舞美、灯光、布景、群演……他们本身的工作可能跟AI没什么直接关系,但因为AI在这块变得更强,导致他们的工作机会无形中减少了。
但对于导演来说,这反而可能是件好事。你不再需要去融很多钱、招演员、搞场地,可以直接把你的想法变成一部短片。很多时候,想法才是最重要的。
电影是技术非常复杂的工业,需要很多角色、很多资源。所以你看到演员、明星、导演,有名有姓的就那么几个,而且来来回回就是那么几个。但全国真的就只有他们几个人有才华吗?不是的,是技术的门槛限制了外部人员的进入。你有再多的才华,没有机会和资源也没用。
短剧把技术资源门槛降了下来,几万、几十万就可以拍一部,不像电影动辄几千万、上亿投资。短短几年,短剧市场规模已破千亿,而电影市场这么多年也只有500亿左右。
3. 往下推演:内容行业会发生什么?
技术门槛消失,产能就会爆炸。这是一场内容行业的生产力革命——小作坊也能做出电视剧和电影级别的内容了。
推演下去,一方面利好抖音、番茄小说这类平台。大量的电影、动画片、电视剧,内容质量越来越好,用户的阈值越来越高,越来越沉浸。但另一方面,内容创作者会面临前所未有的内卷。
跟朋友讨论,这有点类似于当年流行音乐“爆炸”的过程。以前大部分人听的歌是同样的歌,就像以前大部分人看的电影是同样的电影。后来流行音乐产能爆炸了,大家听的歌都不一样了,头部爆款不再像过去那样频繁出现。
其实自媒体已经让类似的变化开始了——以前是电视上的大众明星,现在是无数个小博主。现在AI带来的这波生产力革命,真正让电影级的内容也走向碎片化和去中心化。
但这里有一个更根本的问题——现代人已经越来越无法集中注意力了。甚至连电影学院的学生,都很难坐在教室里看完一整部电影而不去刷手机。这个现象越来越普遍。当观众变了,电影这种艺术形式可能就不会再维持现在的形态。
所以最终受益的可能还是做供给、分发、消费的内容平台。只要视频这个媒介、这个载体不变,最后获利的一定是载体背后的平台。现在的短视频形态有可能已经接近终局了,但我个人希望看到一种新的内容平台形式出现。
对创作者来说,技术门槛消失之后,考验的将是你到底要拍什么、给谁看。审美、创意、故事——这些底层的东西不会变,反而因为技术不再稀缺而变得更加重要。
二、应用层的机会地图
前面讲的是模型两条线各自的进化——大语言模型从推理到Agent Team,多模态从单点突破到技术门槛消失。这些变化落到应用层,具体在哪些方向形成了机会?
这里并非全局扫描,更多是基于我自己关注到的几个方向,大家也可以与自己关注的地方做一些对照。
1. 生产力Agent:最明确的主航道
Agent是今年最明确的主航道,也是机会最多、团队最多、资金最密集的方向。
通用Agent这边,从去年的Manus崛起,到现在的Claude Code、OpenClaw、Claude Cowork,国产的也有阶跃的桌面助手、Cherry Studio等等。这是一个已经形成共识的赛道,因此也会非常拥挤,但它可能会成为一个偏入口级的机会。
按照前面的逻辑,很多工作任务都会被Agent完成,那么我们每个人都会需要一个自己的Agent——它获取你的上下文、你的意图、你的偏好,然后带领一堆工具和服务帮你去做事。这个领域,大厂和创业公司都不想放弃,尤其是在Manus被Meta以几十亿美金收购之后,完成了从想法到落袋为安的闭环,会吸引更多人涌入。
垂直Agent是我看到机会最多的方向。因为这个世界上有多少个岗位,可能就有多少个垂直Agent;有多少个行业,就有多少个Agent。招聘、市场调研、旅行规划、合规审查、猎头……这些垂直Agent的流程相对明确,数据也比较结构化,AI提效后带来的收益很直接。
很有意思的是,美国这波AI创业,真正从C端跑出来的其实不多,大量都是B端的机会。这些垂类Agent的ARR(年度经常性收入)增长非常快,做起来也没有想象中那么难。甚至,资本会大量收购传统的中介或服务公司(Agency)。这些公司有渠道、有数据、有行业经验(know-how),但受限于人力,很难规模化。被收购后,通过AI进行改造,规模能迅速扩大。虽然天花板不一定非常高,但这是明确的收入来源。
这里有一个认知上的转变需要发生:过去我们做的很多Agent,本质上是在补模型的不足——模型不够强,就用Agent的“脚手架”去弥补,做的都是些非常工程化、基建性质的事情。但现在模型变强了之后,你应该思考一些更大胆、更有想象力的事情,而不是还停留在“补丁思维”里。但这个转变其实很难,因为向前看可能仍是一片迷雾。
Agent Infra(基础设施) 是新的基础设施层。如果Agent变成新的入口,那如何服务这些入口?过去抖音是流量入口,你在上面供给内容和商品。现在AI变成入口,它是要干活的,所以供给不一样——不是娱乐视频,而是工具、服务和数据。
具体来说:
- 怎么给Agent提供数据?(API vs 爬虫,各有各的问题)
- 怎么提供更好的工具?(Agent用的工具跟人用的软件不是一回事)
- 怎么处理上下文?(比如最近GitHub前CEO做的Entire,利用Git协议来协助Agent处理coding的上下文)
- 怎么做记忆(Memory)管理?
这些都是Agent的Infra,存在很多机会,但门槛也有一定要求。
这里有一个关键认知:不同行业之间的AI渗透差距极大。Coding领域Agent已经极强了,但很多传统行业连基础的信息化都还没做好。我最近去一些企业做咨询,发现他们很多任务其实可以被AI完整且很好地完成,但他们不知道,顶多问问“豆包”。
比如帮金融、律师行业做咨询,我做的事情就是帮他们安装一个Claude Code,然后把文档、文本任务按需求让Claude去干。当他们看到结果时是真的震惊——震惊到他们开始认真思考组织优化的问题了。
你可以这么想:大厂已经是人才密度最高的地方了,但你经常会发现身边很多同事其实没那么“聪明”。那再想想其他行业,人才密度是远低于大厂的,老板很难给出大厂一样的工资,人才质量参差不齐,干活效果经常让老板不太满意。AI在任务层面已经可以比很多行业的大部分从业者做得更好了,但这些行业对此并不知情。这种信息差,本身就意味着巨大的机会。
2. AI互动平台:寻找消费侧的增量
前面讲的Agent更多是在供给侧——生产力提升带来生产关系的变化。但按照历史经验,更大的机会照理来说应该在消费侧。消费侧带来极大的增量之后,又会在供给侧引发更大的增量,这是移动互联网验证过的逻辑。
但我们目前在AI的消费侧,还没有看到一个类似微信、抖音、美团那样的平台级超级机会。我目前关注到两个方向。
第一个是AI陪伴。2022年Character.AI就做出来了,当时数据极好,但后面又下去了。字节做了“猫箱”,MiniMax做了“星野”,但好像也没有做大。我不是目标用户,没有直观感受。从产品经理视角,我曾以为这个赛道不太成立了。
但其实现在有非常多AI陪伴类的小应用,生意非常赚钱——规模不大但非常赚钱。我了解到,乙女陪伴类应用的付费率能达到20%-30%,这是超乎想象的。在移动互联网时代,付费率超过5%就非常了不起了。
不过,合规是个大问题——做大了就要面临严格的合规审查,而一旦完全合规,产品又容易变得“无聊”。所以现在是大量小而美的机会,很多极小的团队在做,能养活团队、能赚钱。
第二个是AI互动平台——这可以理解为在博一个更大的机会。一个不太恰当的比喻,就是做“AI版的抖音”。目前看到天使轮融资超过1000万美金的非模型公司,大概率就是在做这个方向。
这里涉及到几条技术路径。一种是做实时视频生成。异步生成(像Seedance那样写prompt等结果出来)还是在抖音的短视频范式内。但如果生成速度足够快,零点几秒就出结果,那就变成实时交互了,可能催生全新的交互方式和平台形态。另一种路径是通过AI编程来生成互动内容——比如最近的Loopit,写个prompt直接生成一个可以玩的小游戏。
从我对模型的推演来说,纯粹的多模态生成效果天花板应该更高,但技术成熟的时间还没到。最终出来的形态是直播、游戏、短视频,还是它们的综合体,目前还不清楚。大家都在探索,故事都好讲,但最难的是“上手玩”到底好不好玩。用户不会为故事买单——就像最开始抖音,大家也觉得它就是个一阵风的小东西,但它就是好玩,简单直接的好玩。
3. AI硬件:Context的物理入口
AI硬件也是我聊了一些团队后觉得很有意思的方向。
Plaud的成功是个标杆。现在它一年大概有2-3亿美金的收入,而且是盈利的。它做的事情非常简单——在手机背面贴一个像充电宝一样的录音壳,想录音的时候直接一按就好了,不需要你打开一个软件再去操作。硬件在获取物理世界的上下文,以及在用户交互的简单性上,有极大的优势。
而且Plaud打了一个很好的样板——AI让硬件从“一锤子买卖”变成了“订阅制”。它的软件付费率和续费率非常高,对营收贡献极大。所以现在带动了大量的人在做语音转录相关的AI硬件。
还有视频领域的可穿戴设备。美团出来的孙洋做了Looki,一个挂在身上的设备,全天候把你看到的场景(context)记录下来,然后给Agent做分析和记录。字节背景的潘宇扬做了OdyssLife,一个带摄像头的项链,拍摄你吃饭的内容来做营养分析。
这些都是在用硬件帮你收集真实生活的context。因为AI很多时候表现不好,恰恰是因为给它的context不够。目前主要依赖人的prompt和电脑里已有的文件,这些context相比用户的真实生活,其实是非常匮乏的。
还有一些展示和交互类硬件:智能镜子做美学分析,客厅屏幕展示AI管理的日历,智能挂画能把亲人照片生成写真还能聊天。这些东西技术不难,但卖得还挺好,用户的付费意愿比软件强很多。
AI硬件的门槛和机会在于:做AI的人不懂硬件,做硬件的人不懂AI。像大疆这种硬件巨头,对软件和用户体验的理解可能比互联网公司要差很多。两者结合有天然的壁垒。做几台Demo,做1万台试水,做10万台量产,对供应链的要求完全不一样,对团队的要求也不同。这个圈子不是你随随便便跑到深圳就能轻易进入的。
如果你有硬件的经验和供应链的资源,可以考虑做AI硬件,尤其是出海——美国人是很难做好硬件的,因为供应链的核心在深圳。
三、个人在这个时代如何不掉队
前面讲的是趋势,接下来讲大家最关心的——在这个大的局势下,你应该怎么办?
先总结一下前面的趋势:AI在吞噬工具,也在吞噬“工具人”。
你来想一下,假如你现在做的事情,很多任务是不是可以让Claude Code帮你完成?它完成的效果是不是还不错?如果你的大部分任务都能被完成,那你就处于一个比较危险的位置。
以及,我们身边的很多同事,说实话,很多公司里面存在着大量的“工具人”。每个公司的老板都不希望组织变得臃肿——增加一个人的成本不只是工资,工位、社保这些都是显性成本,更重要的是隐性的管理成本:管10个人跟管100号人难度完全不一样。如果AI逐渐在任务层面完成得更好,组织就会变得更加精干。这对老板来说是好事,但对部分打工人来说可能就是个需要警惕的信号。
有一个简单的判断方式:如果你的工作过程数据已经高度线上化、数字化,那么AI大概率会干得比你更好。程序员最先受到冲击就是这个原因——代码全都在线上,AI把这些数据一学,就可以做得比大部分人更好。关键就在于,数据是模型进步的最大要素。
人与人之间的能力差距会急剧拉大。以前手写代码的时代,程序员之间的效率差距顶多两三倍。但在AI时代,可能是几十倍甚至上百倍的差距——这种差距在大厂里可能看不出来,但一旦出来独立做事,感受就会非常深刻。
我前段时间认识一个人,他同时让30个Agent帮他写代码,为此内存买了128G,因为16G根本不够用。每个月在Claude上的支出是几万块,一天能发布十几个版本。字节已经算是移动互联网里迭代非常快的了,一周一个版本,但人家能做到一天十几个版本。
用AI已经不是用一个工具了,而是在驱动一个“团队”帮你干活。那谁用AI用得好?我观察到两类人特别突出:一类是非常年轻的人,没有思想包袱,本身就很“AI native”;另一类是技术出身的团队管理者——懂技术架构同时也懂项目管理,驱动AI干活的效果就非常好。
AI会变得极强,成为很厉害的放大器,但对人的要求也越来越高,“人+AI”组合带来的产出差距也越来越大。
还有一点:个人喜不喜欢,在这个时代还是挺重要的。变化太快了,有很多机会涌现,如果你不喜欢,硬“卷”也卷不出什么名堂。不是所有人都要往同一个方向挤,找到你自己有热情的切入点,才能持续走下去。
1. 大厂:去高浓度AI业务
如果你还在大厂,我的建议是尽可能去AI是其核心的业务团队。字节的豆包、剪映、Coze、飞书里的AI业务,阿里的通义千问,腾讯的元宝等等。虽然这些地方也会很卷、可能很乱,但你在一个AI是业务最核心的团队里,能拿到更多的第一手信息,团队内部对AI的共识更容易达成,实践机会也更多。
如果你过往没有很好的AI背景,我非常推荐去这些业务。咬牙坚持至少半年或一年,你会比在一个传统业务里自己琢磨有效得多。
进不去核心AI业务怎么办?你要尝试在自己的业务里主动做一些AI项目。这一点很重要——如果你不做,首先你是没有第一手认知的。你会看到大量信息,包括今天我分享的这些,但这些不是你自己的信息,对做决策没有太大帮助。有点像读书的时候,上课听讲感觉都会了,一做题就不会了。看遍巴菲特、查理·芒格的书,但自己不在股市里真金白银地下注,永远学不会投资。
你还可以自己做side project——无论是帮业务提效,还是纯粹自己觉得好玩就做。看AI信息、自己动手build产品、做一个有用户规模的AI产品——这三个层次对人的认知要求完全不一样,不能只停留在第一个层次。
移动互联网已经没有新故事了。去年的外卖大战算是最后一波“回光返照”,已经没有任何新的、令人兴奋的东西了。现在的行业共识就是要去做AI,AI又是一片蛮荒之地,很多领域刚刚开始。能做AI,就尽量去做AI。
如果考虑城市选择:深圳偏AI硬件,杭州偏AI与商业结合(做生意类),上海偏大型AI业务,北京偏模型研发和前沿应用。不同城市的AI生态差异很大,选对城市也是选对生态。
2. AI初创公司:一个非标准化的世界
如果你在大厂核心AI业务进不去、自己业务里做AI方案也推不动,可以考虑去AI初创公司。但大部分从大厂出来的人没有AI初创公司的经历,可能会踩一些坑。
我讲几个简单的判断标准。
第一个:这家公司有没有提供“无限量”的Token? 如果不提供,说明这个公司可能不是真正的AI native。无限量Token非常贵,但如果它是AI native公司,这些Token可以高效地转化为公司的生产力和效益,所以它才愿意提供。
第二个:如果“梯子”挂了,这个公司还能不能正常运行下去? 如果所有人都发现没办法干活了,说明这是一个非常依赖国际模型和生态的、AI浓度极高的公司。
求职方式也跟大厂不同。不一定是标准化的写简历、投递、走面试流程,更多可能是通过熟人介绍、信任背书,或者你的作品(如GitHub项目)背书。人的介绍很重要,因为在更不确定、更开放的早期阶段,对一个人的人品和综合素质要求更高。简历会“骗人”,面试也会“骗人”。你的GitHub主页或side project可能比一份光鲜的简历更重要——因为创业公司做的事情跟大厂太不一样了,你在大厂把投放系统做得多精细,在初创公司不一定用得上,那里可能连这些系统都没有。
AI初创公司的真相是:外面看起来很高端——创始团队是Meta、Google、字节背景,但实际上内部也很“草台班子”。有很厉害、很前沿的地方,也有非常粗糙、需要摸索的地方,这是一个更加真实的状态。大厂有很多标准和流程,让你有时感到难受,但实际上它保证了工作的下限。创业公司没有这些流程,人和文化就变得特别重要。
日常节奏也完全不同。大厂里一天可能有20个deadline追着你;但创业公司有时候一天只专注做一两件大事,有时候又忙到疯。没有没完没了的“价值证明”会议,没有“没有问题要制造问题”的内耗。这种节奏感跟大厂完全不一样,有的人会非常不适应这种“没人管你,但你必须高度自驱”的状态。
薪资不一定降。现在有些字节系出来创业的,融资额很高,你甚至还能涨薪。但大部分情况可能是需要降低现金薪资,以换取更多的期权。需要清醒认识的是,期权在大部分情况下是“废纸”,公司最终能上市或被收购的概率极低,可能1%都不到。像字节、小红书这样有成熟回购机制的公司也极其罕见。但你在这过程中收获的经验和成长速度是真实的——因为你在大量地做你从来没做过的事情。
3. 创业:拿钱相对容易,团队最难
现阶段,拿钱是相对好拿的时候,VC(风险投资)依然存在FOMO(害怕错过)的情绪。如果你有一定的履历(比如在字节的剪映、豆包、抖音等核心业务待过),加上你对想做的事情想得比较清楚——有一定的市场天花板,故事不错,有靠谱的切入点——那么钱是比较好拿的。
如果一开始拿不到红杉、高瓴、IDG这些顶级机构的钱,可以先做一轮“亲友轮”。跟认识你、信任你的人聊聊你想做什么,大家觉得可以就投个几万或几十万,就当支持朋友、打水漂的心态。但如果做成了,这几万块可能换来了公司1%的股份,后面拿到机构投资时估值翻了几十上百倍,回报非常可观。亲友轮的几十万,其实足够你做出一个像样的Demo了。
但最难的是团队。互相信任、彼此互补——这八个字我有极深刻的感受。没有信任的话,遇到困难团队一下就分崩离析了。如果按大厂里那种常见的、彼此防备的关系模式,是不可能一起创业的,一遇到问题就会互相甩锅。
怎么找联合创始人(Co-founder)?最靠谱的方式是找以前合作过的人——字节的人找字节的熟人,腾讯的找腾讯的,或者找你在项目里紧密配合过、深知对方能力项和人品的人。只有真正一起干过活、打过仗,才知道对方到底行不行。
但也要注意:很多早期的“元老”或同学,过了5-10年,能力可能跟不上了。上下铺兄弟、室友同学不一定是最优选择——找人要看当下能力的匹配度,而不仅仅是关系的远近。
创业方向大概率会换。你看到很多AI公司现在产品做得挺好,但实际上之前已经换了好几个方向了。这不是例外,而是常态。张一鸣最开始也换了好几个方向。
创始人的核心工作:找钱、找人、找方向、为团队降噪。因为团队会接收到外界大量的噪声(杂音),创始人需要把这些信息收敛下来,让大家在一个相对清晰的范围内专注做事。另外,创始人会非常孤单——压力太大时,有些话不能跟团队讲,讲多了人心就慌了。最好有自己的创始人圈子,很多你遇到的问题网上没有答案、AI也没有答案,但问一下其他创始人可能就知道了。
如果要选方向创业,一定要认真考虑出海。国内市场,个人用户付费能力有限,企业客户预算紧张,大厂又太强,做国内市场非常艰难。出海的世界很大——美国市场做不了还有东南亚,东南亚做不了还有拉美、中东,还有日本(用户付费能力强)。能拿美元基金的钱就拿美元——国内有些VC的钱附带比较苛刻的条款,其本质更像是“债”而不是纯粹的投资。
4. 一人公司:小而美的可能
“一人公司”现在很火,但已经被有点神话了,需要真实、理性地看待。
首先,你要有Build的能力。Vibe Coding + 基本的工程化能力,是必须掌握的基本技能。有了这个能力,你可以做一些“小生意”——市场上有很多小需求,对公司来说不值得专门投入资源去做,但对个人来说,其收益已经足够了。比如月收入几千到1万美金,在大厂里有多少人月薪能达到1万美金(约7万人民币)?其实没多少。
具体形态可以是:小工具、浏览器插件、AI工具导航站(接Google Ads赚广告费)等等。这跟大厂做的事情完全不一样,我自己也不太擅长。因为我们太习惯依附于一个大体系,去做宏观的、规模大的生意了,对这种“小而美”的生意,要么看不上,要么不知道怎么做。它其实没有那么难,但关键是你要能敏锐地挖掘到那个真实、具体的需求点。
品牌和自媒体变得非常重要。现在AI编程门槛降低之后,很多工具类产品的复制成本极低,大家可以快速复刻。有多夸张?你花几周做一个APP出来,可能已经有专门的Agent能在两三天内就把你的APP核心功能复刻出来。那用户为什么还要用你的?因为你有品牌。有时候,内容就是品牌。在打磨产品的同时经营自媒体——产品本身不一定赚钱,但通过影响力可以触达更多人,甚至通过知识付费、课程等方式获得收入。
为什么自媒体在AI时代变得更重要?因为供给侧(产品开发)的门槛降低之后,产品本身的壁垒越来越弱。内容就是品牌,品牌就是影响力,影响力就是你在“注意力经济”里的核心杠杆。创始人亲自做自媒体,相当于为公司省下了一大笔市场推广费用。做内容的关键,不是追求每一篇都是精品,而是持续输出——持续输出本身就是一种筛选和积累。对于想做一人公司的人来说,一定要做自媒体,这可能说得有点绝对,但确实非常非常重要。
四、能力转型与冷静判断
1. 每个岗位都需要的四种能力
很多人问我:AI时代,设计师怎么转型?运营怎么转型?产品经理怎么转型?做AI测评做久了,会不会自己也变成“工具人”?
大家都逐渐看到,AI时代岗位的边界正在变得模糊。同一件事,算法、产品、设计、运营其实都能干;也有些事,目前谁都干不好,大家都在边学边干。
那什么能力是共通的?我总结了四个:
第一,Build的能力。至少能动手做出一个可演示的Demo。过去的专业积累门槛太高,限制了许多人的尝试。但现在这个门槛降低之后,一些底层学习能力、逻辑思维能力更好的人反而会脱颖而出。
第二,对模型的理解。模型是什么、能做什么、不能做什么、怎么让它表现更好。这个认知不是看几篇论文或评测文章就行的,必须亲自动手去用、去调、去感受它的边界。
第三,对用户需求的理解。无论产品形式怎么变,满足用户价值这个商业本质没有变。需求是什么、用户是谁、如何更好地满足、如何归因、如何优化——这些核心逻辑没变,只不过实现的具体技能和工具变了。
第四,对行业趋势的把握。即信息获取和独立判断的能力。大厂很容易形成“信息茧房”。你身边如果都是算法研究员,你可能不知道外部世界的技术应用参差不齐到了何种地步,不同行业之间的差距是非常大的。能看到不同世界之间的差距,并能理解其原因,这本身就是一种稀缺的能力。
关于“测评”这个问题很多人问到。做测评是非常好的AI产品入门方式,是练基本功。但如果你长期一直只做测评,从职业发展的实际角度来看,确实有变成“工具人”的风险。模型越来越强,强到你用普通任务可能已经评测不出明显差异了——现在已经是这样,很多时候你得设计非常刁钻、复杂的任务才能区分高下。测评是入门,但最终你还是要往业务深处走——思考这个应用怎么能变得更好、吸引更多用户、有更好的留存和付费,你个人能为此带来什么贡献。
2. 几个冷静的判断
最后讲一些相对冷静的观点。在FOMO情绪之外,我们需要一些更接近真实的判断。
裁员不会一夜之间发生,但招聘会持续收紧。不会是一夜之间所有公司大规模裁员(当然现在也有亚马逊一夜裁员上万人这样的案例)——但从更宏观的层面看,不会那么剧烈。对很多公司来说,变化在于不再倾向于招聘那么多人了,会招更少、更精的人。对个人来说,最直接的感受就是工作更难找了。
大家可以问自己一个问题:大厂里那么多年薪百万的人,你实际做出的工作产出、投入的精力,有多少是真正“值得”年薪百万的?坦白说,大部分人日常做的工作内容其实非常单薄。我们应该主动让AI去帮我们处理那些机械性、重复性的工作,解放自己,去做那些更有创造性、判断性和策略性的价值。一个业务里,真正提供不可替代核心价值的人往往没有几个,大部分人做的是支撑性的基础工作。
目前Agent直接ToC盈利仍有困难,但趋势向好。为什么难?因为运行Agent太“贵”了,Token消耗量非常高。但也要看到,模型本身的成本在持续下降,三年来百万Token的成本下降了多少大家有目共睹。同时,芯片、存储、电力、数据中心等底层基础设施都在快速铺开。
这里涉及到定价逻辑的根本性转变——到底应该基于“工具”定价,还是基于“人力替代”定价?工具逻辑是几美元或几十美元一个月,但现在已经出现个人用户月消耗几千美元的案例了。几千美元其实是“人的逻辑”——同样的服务,如果你认为它只是一个工具,50美元/月你觉得好贵;但如果它是一个“人”(或一个高度拟人的智能体)在帮你全职干活,100美元、200美元/月你反而觉得不贵。
在非常成熟的组织里推动AI提效,收效可能有限。在一个分工固化、流程锁死、每个环节的输入输出要求都已固定的成熟组织里,你会发现跟AI的“野路子”很不匹配。更有效的方式,往往是单独划出一个封闭的AI创新项目,在这个项目里,每个人的职责边界被暂时打破,大家都尝试做一些自己不擅长的、不确定的事情,反而能碰撞出火花。
这里有个很有意思的规律:当你做自己不太擅长的事情时,你会更加依赖和善于利用AI;当你做自己非常熟练、已成肌肉记忆的事情时,你反而会觉得AI不大行、碍手碍脚。所以,要让自己主动进入“不舒适区”,你才会真正体会到AI作为“能力延伸”的价值。
如果你是团队管理者,想让团队用上AI,最好的方式非常简单——给那些真正想用、愿意尝试的人提供“无限量”的Token,就够了。Token确实很贵,但只有用起来才有感觉。让一部分人先用起来,做出成绩,自然能带动其他人。这是成本最低、效果最好的AI赋能和培训方式。
真正的认知获取,只有通过付出成本的决策。看资料、听分享——包括阅读今天这篇文章——你投入的成本太低了,投入几十分钟、几个小时就结束了,所以吸收的信息往往非常浅层。如果你的成本是因为做错了一个关键决策,导致了用户流失、数据下跌,那么你才会被迫去思考最本质、最核心的问题。在云栈社区这样的开发者平台上交流实践,也是一种宝贵的认知提升途径。
写在最后
这是一个比移动互联网浪潮演进更快的时代。
我问过一些经历过PC互联网和移动互联网完整周期的人,他们普遍认为AI这波浪潮比之前两个都要更快、更“可怕”。行业共识形成的速度也在急剧加快——从需要半年到一两个月,再到一周,现在有时候几个小时就能在一个小圈子里达成共识。
短期来看,我们可能高估了AI,因为整体的FOMO情绪非常严重,这会带来强烈的割裂感。中期来看,我们大概率是低估了AI能带来的深远影响。长期来看,我不知道这个社会最终会演变成什么样子。
AI的渗透极度不均匀——编程领域已经翻天覆地,但很多传统行业还浑然不觉。这既是当下普遍感到割裂的来源,也意味着存在大量未被发掘的机会。
总结一下,对于我们个人而言:
- 尽可能投身于高浓度AI业务,或者在自己现有业务中主动发起AI项目。
- 如果在大厂无法实现,可以考虑加入AI初创公司,但要提前理解其“非标准化”的运行模式。
- 如果有志创业,当前拿钱相对容易,但组建“互相信任、彼此互补”的团队最难。
- 如果探索一人公司,Build能力是基础,而经营品牌和自媒体是重要的增长杠杆。
- 无论身处什么岗位,都要有意识地培养Build能力、深化对模型的理解、夯实对用户需求的洞察,并保持对行业趋势的敏锐把握。
奇点临近,浪潮已来。与其陷入焦虑,不如静心构建自己的认知框架,找到自己在这场变革中的独特位置。
说一句实在话:我专注AI领域三年,之前做的大部分东西,现在回头看都没什么太大意义了。但不要紧——你的认知是在真实成长的,每个阶段都有每个阶段该做的事。如果你总想着“我现在做的东西必须是终局、必须永不过时”,那心态就不太对了。接受过去的工作和经验可能会被快速迭代甚至淘汰,然后保持开放心态继续往前走,这本身就是一种需要锻炼的重要能力。
AI作为一次深刻的生产力变革,长远来看会带来极大的社会繁荣,但也必然伴随着短期的技术性阵痛和结构性调整。不确定这个调整期是3年还是10年。对于个体而言,要么积极拥抱这波红利,争取迅速起飞;要么就要调整心态,储备能量,让自己在变化中活得足够久。
回归根本,吃好喝好,保持身心健康,活下去比什么都重要。关于未来的职业规划,更需要我们在行动中不断探索和调整。