今天看到一个词叫 Token minimizing,直译过来是 Token 最小化,实际含义是 Token 成本最小化。
我是从 CNBC 的一篇报道里知道这个词的,报道说美国企业发现 AI 账单越来越吓人。
比如,有一家开发 AI Agent 的创业公司 Lindy,只有 25 名员工。公司 CEO 弗洛·克里维洛发现,他们每月的 AI 费用严重超支,甚至超过了所有员工的工资总和。
于是他决定把模型从 Claude 切换成 DeepSeek,未来几个月能省下几百万美元。
Uber 等大公司也开始设置 Token 费用限额,每个员工每月最高只能花 1500 美元。
有人可能会问:这是不是代表 AI 泡沫要破裂了?
还真不是。恰恰相反,Token minimizing 是 AI 商业化走向成熟的标志。
企业刚开始用 AI 时,通常只追求最强效果,直接上最顶尖的模型,很多公司调用 Claude、GPT 这类大模型。
可一旦进入真实业务,问题就暴露了——AI 不是一次性软件采购,而是按使用量持续烧钱的“智能电费”。
尤其是 AI Agent,每次推理、每次调用工具、每次读取上下文,都在消耗 Token。如果不加限制,Token 消耗会不断放大。
所以 Lindy CEO 说 AI 账单超过员工工资,我一点不意外。
AI Agent 本质上是在把一部分“白领劳动”转化成“算力支出”。过去你付工资雇人,现在还得付 Token 让模型干活,性价比就成了必须考虑的账。
Lindy 切换到 DeepSeek,说明 DeepSeek 的性价比优势在美国企业也开始被认真看待。这是一个很重要的信号。
这说明,AI 已经从“演示阶段”进入了“成本优化阶段”。
对企业来说,AI 就像 云计算 一样,是需要做预算、做审计、做优化的核心生产资料。
对 DeepSeek 而言,这当然是打开全球企业市场的机会,但它更可能先成为模型路由体系里的高性价比层。
不过,DeepSeek 未必能吃掉 Claude 的全部市场。真正复杂的 Agent 任务,企业还是会倾向用更强、更稳定、更可控的模型。
所以未来的格局,很可能是性价比模型吃掉大量低价 Token 流量,顶级模型则完成高价值、复杂推理任务。
这和半导体行业类似——复杂需求用高端芯片,简单需求用低端芯片,形成一个按任务分层、按成本匹配的产业生态。
|