
技术在发展,衡量世界的单位也在演变。互联网时代,字节(Byte)是基础单位;而在AI时代,Token正成为新的价值锚点。不论监管、企业还是大众,AI盛行之后,Token无处不在,甚至开始与我们的日常工作、生活密切相关。
这种无处不在的压迫感,部分源于行业领袖的预言:英伟达CEO黄仁勋曾将Token比作新时代的“数字石油”,并预测它将成为像电力、自来水一样分层定价的基础商品。输入电力和数据,输出Token——这种模式定义了新的生产力公式。
没人敢深究这种类比是否完全精确,大家或主动或被动地投身其中。对Token经济学,全社会同时怀抱两种心态:唯恐被AI抛弃的恐惧,以及抢占先机获利的贪婪。
Token在变成一种货币单位
程序员群体是最先感受到这波Token经济学冲击的。由于AI能够高效处理超长上下文,AI Coding成为了智能体(Agent)最先落地的场景,互联网公司开始向AI要生产效率,Token消耗量成为一个关键衡量指标。
昆仑万维在今年2月25日发布的内部信颇具代表性:公司为所有技术研发序列员工开通AI编程工具账号,并提供每月100美金的Token额度支持,同时要求强制使用,目标是至少提升50%的开发效率。信中甚至提到,若在半年绩效考核中达不到AI Coding模式要求,将进行比例在5-20%的末尾淘汰。
这就像为每位程序员拧上了倒计时闹钟。有段子手调侃:“被毕业的同事并没有消失,不过是被蒸馏成了Token继续陪伴你。”
但对快速适应变化的从业者而言,这可能成为新的博弈筹码。黄仁勋在今年GTC大会预测,未来每位工程师入职时,除了基本工资,还会获得一份年度Token预算,用于购买算力以放大个人生产力。他甚至断言,“你的offer带多少Token”将成为硅谷新的谈判筹码。
这直接影响着企业对人才的判断标准。58同城董事长姚劲波在接受采访时透露,公司在提拔干部时,最看重的就是AI能力:“如果我判断一个人不了解AI、没有未来视野,绝对不会把他放到管理岗位。而Token消耗量、客户流程优化效果都是AI考核体系中重要的量化指标。”
月之暗面创始人杨植麟在3月25日的公开演讲中也指出,未来几年,AI将主导越来越多的研究工作,每位研究员将配备海量的Token,由AI自动完成新任务合成、环境构建乃至网络架构探索。
企业对Token的重视,已上升到组织结构层面。3月16日,阿里巴巴成立Alibaba Token Hub(ATH)事业群,目标直指“创造Token、输送Token、应用Token”,并由集团CEO吴泳铭直接负责。这很可能不是阿里的专属动作,而是互联网公司的集体方向。
随之改变的,还有企业对成本的定义。吴泳铭在阿里2025自然年财报电话会议上表示,现在许多企业在消耗Token时,不再将其视为IT预算的一部分,而是作为整体运营或研发成本的一部分——Token已成为企业生产投入的关键组成部分。姚劲波对内部的指示也佐证了这一点:Token用得越多越好,哪怕压力大,58同城也会不计成本。
Token消费的需求决定价格
3月23日,国家数据局局长刘烈宏在公开场合将Token称为“词元”,并解释这不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。这一定位为一锤定音。
从经济学角度看,需求决定价格,需求决定供给。在Token经济学范畴,这一定律依然适用。
需求正呈现爆炸式增长。有人分享其家庭一周的Token消耗量达到5亿;昆仑万维每月消耗约10000亿到12000亿Token;58同城全公司每天消耗接近2000亿Token。字节跳动旗下的火山引擎公布,截至今年三月,其豆包大模型日均Token使用量已突破120万亿,过去三个月增长了一倍。
产业层面,官方数据显示,到今年3月,我国日均Token调用量超过140万亿,相比2024年初的1000亿,增长了1000多倍。全球AI模型API聚合平台OpenRouter的数据同样惊人:过去一年,其平台内前十大模型的周Token调用量从1.24万亿暴增至近14万亿,增幅超10倍。最近一周的Token使用总量超过22万亿。

Token消耗量呈几何级数增长,一个重要推手是AIAgent的大跃进。腾讯总裁刘炽平曾在财报会议上指出,若向智能体AI演进,Token需求将呈指数级增长。
此前,AI应用以聊天机器人(Chatbot)形态为主,单轮对话约消耗1000到3000个Token。而Agent执行一个完整任务,可能触发几十上百次模型调用(规划、拆解、执行、反思、纠错),一个中等复杂度任务就可能消耗10万Token,复杂任务更可达百万级。
需求的爆发决定了Token当前的价格并不“亲民”。有用户反馈,测试一句“你好”就可能消耗掉80美元的Token;在“养龙虾”应用热潮中,有用户晒出账单,Token消耗最高的一天达到93亿,若按当时较贵的模型价格18元/百万Token计算,单日花费高达1674元。
但AI有个特点:指令的质量直接决定产出价值。无效消耗会导致成本飙升。猎豹移动CEO傅盛就曾分享,通过优化使用技巧,他将每日Token费用从最初的200美元降到了几十甚至十美元。
目前,企业更多将Token消耗视为一种投资,预期是产生更大的价值和收入,而不仅仅是成本支出。姚劲波“不计成本”的表态正是基于这种逻辑。然而,当AI生产成为普遍现象,全社会面临算力峰值压力时,企业是否还能持续“不计成本”,这是一个需要观察的问题。
产业链谁在获益?
阿里提出的“创造Token、输送Token、应用Token”,大致勾勒了Token经济产业链的框架。
上游是生产环节。 每一个Token的生成,都需要AI算力芯片的支撑。芯片的算力密度、能效比直接决定了Token生产的成本上限与供给规模。从这个角度看,英伟达无疑是全球最大的Token工厂,更重要的是,它还在很大程度上决定着Token的生产规则与定价机制。
在今年GTC大会上,黄仁勋就清晰地展示了哪种模型对应哪种Token生成速度、处于哪个定价区间,以及需要何种级别的硬件来支撑。由推理需求引发的算力紧张,使得芯片企业收入大增。2025年,英伟达全年营收达2159.38亿美元,同比增长65.5%。
中游是连接枢纽,即Token Hub。 这是目前变数最多、想象空间最大的环节。以阿里云、腾讯云、火山引擎为核心的云厂商,负责将上游的算力资源转化为标准化、高性价比的Token服务,并与下游应用进行匹配分发。他们决定了Token的流通效率与商业化边界。
AI发展早期,云厂商曾陷入惨烈的价格战,百万Token价格被打到几毛钱。如今,Token消耗量成为核心指标,甚至有厂商为销售团队制定极端考核政策,将Token业绩按10倍、20倍折算进收入。谁能最大化“生产一个Token的成本”与“卖出一个Token的价格”之间的差值,谁就能获得更丰厚的利润。
特别是OpenClaw等应用的爆发驱动Token消耗激增,催生了刚性算力需求。加之受上游核心元器件涨价影响,AI服务器成本被推高。云厂商终于摆脱了“用户用得越多,自己亏得越狠”的困境,顺势掀起了一轮AI算力“涨价潮”,腾讯云、阿里云和百度云几乎在一周内相继宣布调价。
腾讯总裁刘炽平解释称,硬件供应链供应周期拉长且不确定性增加,导致国内云服务行业将成本传导给客户。不过,腾讯似乎对单纯以Token消耗量为指标的生意持审慎态度。腾讯云副总裁杨晨曾表示:“Token不是一个多么健康的生意,它看着量很大但黏性极差。AI真正好的生意还是要以应用场景为导向。”
相比之下,阿里则更为乐观。吴泳铭确信,未来5年内,阿里来自AI和云相关业务的收入将超过1000亿美元。他的判断基于一个根本转变:许多企业不再将Token消耗视为IT预算的一部分,而是运营成本,这是推动AI增长最根本的长期因素。
下游是应用层。 这是Token价值的最终出口。我们所熟知的豆包、元宝、千问等AI通用应用,以及自动驾驶、医疗等细分领域的应用,都是将算力转化为实际生产力的关键体现。它们完成了从技术价值到商业价值的转换。
目前,以英伟达为代表的上游厂商掌握着Token的生产和定价权。但如果下游应用能创造出更高的商业价值,未来或许能对产业链上游产生更大的话语权。
想象一下,当生产成本已按Token计费,未来一切AI服务也将按Token收费。也许有一天,家庭内部、朋友之间闲聊时,除了人民币花费,还会互相询问:“你这个月花了多少Token?”
讨论技术趋势、分享实践经验,欢迎来 云栈社区 交流。