4207 积分	0 好友	549 主题

发消息

Token成本失控背后：AI应用收益为何难敌消耗？

发表于 2026-6-10 20:20:07 | 查看: 121| 回复: 0

最近，各大科技公司都在收紧 Token 的使用。这里的 Token，可以理解为发给 AI 的提示词以及它回复的内容所消耗的基本计量单位。“收紧”意味着不能再无限制地使用 AI 了，想申请更大的使用额度，必须有正当的业务理由。

这背后是一连串令人咋舌的新闻，而不是网络段子：

某巨头（疑似亚马逊）因忘记设置预算上限，单月 Claude API 账单高达 5 亿美金（约合 35 亿人民币）。
Uber 为 5000 名工程师配置了 Claude Code，结果 4 个月就烧光了全年的人工智能预算，单人月均消耗在 500 到 2000 美元之间。
米哈游的员工在测试游戏 AI 智能体时未设限制，十几个 Agent 互相等待、循环运行了 13 个小时，一夜之间烧掉了约 200 万人民币。
Meta 内部甚至有个“Token 传奇榜”，榜首的同事在 30 天内消耗了 2810 亿 Token，保守估算花费超过 140 万美元。

这些事件的起因，其实都是此前各公司大力鼓励员工使用 Token，甚至将 Token 用量作为工作绩效的评估指标。AI 确实好用，员工也乐意用。比如我自己就定了个原则：遇到事先问 AI（需要实时响应的场景除外），拿到建议后再动手。可现在公司纷纷踩下刹车，这暴露了一个核心问题：目前使用 AI 的成本，远远大于收益。为什么会这样呢？

从程序员使用 AI 的现状切入，或许能看清一些症结。先抛出一个问题：你打心底里把 AI 当成一个辅助工具，还是把它看作一个真正的“数字员工”？不同职级的人答案可能截然不同。一线执行层的同学，大多将其视为辅助工具；而管理层，则更倾向于将其定位为能独立交付的“员工”。

在程序员的日常工作中，有个现象很有意思：AI 辅助生成代码，极大地提升了编码效率。但这种个人效率的提升，在高层看来似乎“上不了台面”，很难作为亮眼的业绩去汇报。背后的逻辑是：如果 AI 只是个辅佐工具，那作为“人”的核心贡献在哪里？程序员不应该只产出代码，贡献的应当是他们的知识和决策。

在这种思想驱动下，各种用于写代码的 Agent（智能体，你可以简单理解为虚拟员工）应运而生。可问题在于，当前主流的大模型天然带有不确定性。为了让它的输出可控，就必须给 Agent 配置海量的约束条件——说白了，就是用文字描述什么事能做、什么事不能做、遇到特定情况具体该怎么处理。这些约束条件会占用巨量的 Token。更夸张的是，由于当前 AI 本身不具备真正的记忆能力，每次提问，你都得把所有的背景和规则再“喂”给它一遍。这就好比两个人聊天，你每说一句话前，都得先重新做一遍自我介绍，并把你们之前所有的对话复述一次，对方才能接上话——是不是挺荒谬的？

到目前为止，以我个人的经验看，还没见过哪个 Agent 能做到真正的商业落地。大部分仍停留在 Demo 演示阶段，就像我常说的“上称”检验，至今没发现谁能真正过关。反复调试这类 Agent，会重复消耗海量 Token，可以说现在整个行业仍处于早期探索期，投入和产出完全不成正比。大量的 Token，就这样被用来生成了一堆垃圾代码。

有人说，2026 年会是 AI 应用的爆发之年。我们确实期盼，届时的 AI 应用能真正实现收益大于成本，切切实实地造福行业、服务人类，甚至创造出更多新的社会岗位。

上一篇：程序员从OLED退回IPS：PWM频闪与文字模糊才是硬伤
下一篇：库克最后一次WWDC：供应链之王留下的不是颠覆，是四万亿机器

Token, AI成本, 大模型, Claude, Agent

Token成本失控背后：AI应用收益为何难敌消耗？

相关帖子