找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5094

积分

0

好友

695

主题
发表于 2 小时前 | 查看: 2| 回复: 0

AI程序员深夜编程与神经网络界面

词元(Token)调用量的指数级增长,正在将一批公司的估值推向疯狂高点。

被称为“Token第一股”的迅策科技,上市仅108天股价较发行价上涨近6倍,最新总市值已达1050亿港元。今年1月8日登陆港股的智谱,上市首日市值约580亿港元,交出首份年度成绩单后股价迅速冲破1000港元大关,市值也突破4000亿港元。智谱CEO张鹏将2026年的关键词定义为“Token量”,认为智能上限的突破与Token消耗的指数级增长,共同构成了AGI时代的商业价值。

2026年以来港股AI公司行情走势图

尚未上市的公司中,月之暗面上个月刚完成新一轮超10亿美元融资,估值达到180亿美元,而去年底的一轮5亿美元融资时估值仅为43亿美元。这种估值的短时间跃迁,与今年2月OpenClaw宣布将Kimi K2.5定为官方主力模型直接相关——K2.5发布仅一个月,月之暗面ARR(年度经常性收入)即突破1亿美元,业绩增速不仅支撑了估值提升,也打开了公司IPO的可能性。

无论国内国外,资本市场都在以惊人的热情为Token经济的腾飞定价。未来几个月,我们将有机会听到各种各样的财富神话。这场轰轰烈烈的Token经济大繁荣,正以“大跃进”的方式完成对所有人的认知普及,也悄然累积着风险。

增长引擎:从博特到智能体,Token消耗飙出指数曲线

聊天Bot刚问世时,很少有人能想到两年之后,仅仅豆包一款 大模型 的日均Token使用量就能突破120万亿。即便按照每百万Token两块钱的便宜价格计算,这也意味着每天有3亿元的真实经费在豆包上空燃烧。事实上,国内外各家大模型公司都在上演同样的剧本——全球Token日均消耗量正以指数级规模疯涨。

工信部旗下中国信息通信研究院数据显示,截至2026年3月,中国日均Token调用量已突破140万亿,较2024年初暴涨超过1000倍。

OpenRouter平台部分AI模型周度Token用量统计

全球最大的AI模型API聚合平台OpenRouter则统计到,其每周处理的Token数量从2025年3月的1.62万亿飙升至2026年3月的16.90万亿,一年之内增长超过10倍。OpenRouter连接着Anthropic、OpenAI、谷歌、Meta等几乎所有主流模型厂商的API接口,它的周度Token消耗曲线,本质上就是全球AI应用活跃度的实时监测图。

这条几乎垂直向上的消耗曲线,既不像GDP的线性增长,也不像互联网用户渗透率的S型曲线,完全走出了人工智能经济自己的节奏。那么,是什么在驱动Token需求的大爆发?答案是AI技术范式的演进:从Bot到Agent的架构质变。

早期AI应用以聊天机器人为主,一问一答,几百到几千Token结束。但自去年下半年起,以Agent和Claw为代表的新型应用范式迅速流行,让AI不再只是“一问一答”的对话工具,而成为一个能自主规划、调用工具、长周期执行任务的数字员工。这种底层架构的变化,使Token消耗量以意想不到的方式大幅增长。行业内部测算表明,完成同一个业务目标,Agent模式消耗的Token约是Bot模式的50到200倍。

原因在于,Agent在执行任务时需要将整个历史对话上下文全量携带,复杂任务动辄累积数十万Token的上下文窗口;每次思考都要多轮推理并触发API请求,还需持续加载系统配置文件和记忆库以维持任务一致性和个性化体验。这导致Agent模式下的Token消耗更像一个不受用户主观控制的黑箱操作。

更值得警惕的是,这个阶段Token的表面消耗量,并不等同于真实的需求量。当AI转型成为企业的“政治正确”,当Token消耗量被纳入员工考核指标,一种“Token伪需求”便诞生了。

Meta员工内部Token消耗排名推文

Meta内部已有团队将Token消耗量作为AI渗透率的标尺,部分员工为了“显得自己很懂AI”,故意运行大量冗余的模型调用任务;国内腾讯等大厂也被爆料存在类似现象,一些业务线甚至发明了“Token刷量”的灰色操作。这种为了不被时代抛弃而制造多余消耗、夸大不存在的业绩的行为,充满了大跃进式的荒诞。

核心:谁为Token买单,谁从Token收费中受益?

当Token消耗量以指数级增长,一个严肃的产业问题浮出水面——谁来买单,谁会受益?4月15日,国家数据局就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》公开征求意见,首次在官方政策文件中提出“探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据集价值体系”。从“词元交易”被写入国家顶层设计的那一刻起,Token就不再仅仅是一个技术概念,而是逐渐成为人工智能经济的法定计价单位。某种意义上说,Token化收费是AI经济的核心。

中国经济时报封面:词元经济的崛起

迅策科技之所以被称为“Token第一股”,就是因为它率先在商业模式上全面转向按Token消耗付费与分成的新模式,构建了“收入=Token价格×调用次数×模块应用数”的增长模型。目前,Token付费收入占迅策科技总营收的5%左右,公司预计年底这一比例将迅速提升至20%至30%。市场对其估值逻辑也因此脱离了传统市销率的限制,拥有了更大的想象空间。

迅策科技的模式表明,在AI经济中,大模型厂商大概率会扮演“精炼厂”的角色——将底层的算力与数据加工成可直接消费、以Token计价的“成品”或“结果”,并掌握着价值分配体系中的关键生态位。而云服务厂商则像是“发电厂”和“电网”,它们不直接为Token定价,却决定了Token的底层成本。以 阿里云 为例,截至2026年2月底,阿里云2026财年累计外部商业化收入突破1000亿元,AI相关产品收入连续第十个季度实现三位数同比增长。紧随需求而来的就是涨价,上周阿里云四天连发三条产品涨价公告,调整百炼部分模型单元服务价格及DataWorks部分API免费额度——云服务厂商对Token成本的影响力,可见一斑。

在传统架构中,云厂商主要靠虚拟机、存储与网络等基础设施计费;进入Agent时代后,它们完全可以推动按资源(Token)使用量计费,并通过Agent平台订阅、开发者生态套件、行业级解决方案等获得长期合同收入。

Token经济学三层框架表格

更上游的算力厂商则像原材料和燃料供应方。英伟达的高端GPU至今仍处于产业链最核心位置,高带宽内存(HBM)供应紧张,三星、SK海力士及美光三大存储原厂一边产能受限,一边毛利率抬高。也许有人担心算力实际已过剩,英伟达和存储厂商股价过高,但这些都不影响Token化收费的历史进程。

Token收费,让整条产业链的价值分配有了清晰的计算依据。就像千瓦时的确立让电力市场得以形成,流量/曝光量成为抖音和视频号的收费标准一样,Token正将人工智能经济从“感觉有用”推向“可以算账、可以收税”,成为一种真实可计量的经济构成。

狂欢:杰文斯悖论与Token经济的无限想象

Token化收费让人工智能经济的运转逻辑变得清晰,但作为一种划时代的技术革命,其经济逻辑是否与传统的经济学规律一致呢?至少传统经济学的供需平衡理论,在AI经济中并不完全适用。传统模型中,供给和需求是两条独立的曲线相交;而在AI经济中,供给本身会通过数据飞轮改进供给质量,需求曲线向右移动不是因为外部收入变化,而是因为供给曲线本身向下、向右移动了。

数字时代的数据飞轮流程图

目前这个阶段,我们更可能看到蒸汽时代的“杰文斯悖论”在人工智能时代重演。所谓杰文斯悖论是指:当蒸汽机效率提升、单位马力耗煤量下降时,煤炭的总消耗量反而暴增,因为更便宜的蒸汽动力催生了更多工厂、火车和轮船。现在,Token的单位生产成本越低,愿意消耗Token的群体就越多,舍得使用Token而非人力的场景就越多,最终Token的总成本越高,或者说人工智能经济的总价值就越大。

据统计,过去两年多,Token生产成本下降了超过99%,GPT-4每百万Token的成本已经从37.5美元下降到2025年的0.14美元。但根据硅谷知名风投Menlo Ventures,全球企业2025年在AI上的支出反而比2024年增长了3.2倍。如果这种趋势延续下去,哪怕单位Token的价格趋近于零,全人类消耗的Token总价值(总量×单价)以及它撬动的GDP比重,仍可能成百上千倍地增长。

这正是智谱、MiniMax等公司在巨额亏损下,仍被资本市场赋予超过许多传统互联网企业估值的深层原因——市场定价的不是今天的利润,而是未来Token经济的总价值。更何况,用Token生产出来的东西本身也变得越来越有价值。同一百万个Token,在不同场景下创造的价值差距可达十万倍,完全因执行的任务而异:用于闲聊的Token只值几分钱,用于写代码的值几百几千元,用于量化投资、企业并购的可以价值几万元。斯坦福大学2026年AI指数报告估算,仅2024年生成式AI就为美国消费者创造了约1720亿美元的消费者剩余,而用户获得的价值远超实际支付的费用。

央视财经新闻:Meta宣布全球裁员10%

值得警惕的是,在AI代替了大量人类的脑力劳动后,传统的劳动力供给理论也将面临挑战。传统的需求曲线会因为购买力萎缩而整体坍塌,而供给端由于自动化依然强劲——这正是凯恩斯所说的“技术性失业导致的有效需求不足”。只不过,在现阶段,围绕着Token消耗量指数级增长的一切都还披着繁荣的外衣,引领着产业链上下游和资本市场的狂欢。

历史已经反复证明,每当一种新技术被资本市场赋予无限想象空间,泡沫总是比价值更先抵达终点。在 云栈社区 的技术论坛里,关于Token经济泡沫与可持续商业模式的讨论,也正随着这轮浪潮日益升温。




上一篇:DeerFlow 2.0 架构:14层中间件源码解读,洋葱责任链的工程化落地
下一篇:Meta提出HyperAgents:AI学会自我优化“变强的方法”
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-25 12:07 , Processed in 0.774753 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表