最近,各大科技公司都在收紧 Token 的使用。这里的 Token,可以理解为发给 AI 的提示词以及它回复的内容所消耗的基本计量单位。“收紧”意味着不能再无限制地使用 AI 了,想申请更大的使用额度,必须有正当的业务理由。
这背后是一连串令人咋舌的新闻,而不是网络段子:
- 某巨头(疑似亚马逊)因忘记设置预算上限,单月 Claude API 账单高达 5 亿美金(约合 35 亿人民币)。
- Uber 为 5000 名工程师配置了 Claude Code,结果 4 个月就烧光了全年的 人工智能 预算,单人月均消耗在 500 到 2000 美元之间。
- 米哈游的员工在测试游戏 AI 智能体时未设限制,十几个 Agent 互相等待、循环运行了 13 个小时,一夜之间烧掉了约 200 万人民币。
- Meta 内部甚至有个“Token 传奇榜”,榜首的同事在 30 天内消耗了 2810 亿 Token,保守估算花费超过 140 万美元。
这些事件的起因,其实都是此前各公司大力鼓励员工使用 Token,甚至将 Token 用量作为工作绩效的评估指标。AI 确实好用,员工也乐意用。比如我自己就定了个原则:遇到事先问 AI(需要实时响应的场景除外),拿到建议后再动手。可现在公司纷纷踩下刹车,这暴露了一个核心问题:目前使用 AI 的成本,远远大于收益。为什么会这样呢?
从程序员使用 AI 的现状切入,或许能看清一些症结。先抛出一个问题:你打心底里把 AI 当成一个辅助工具,还是把它看作一个真正的“数字员工”?不同职级的人答案可能截然不同。一线执行层的同学,大多将其视为辅助工具;而管理层,则更倾向于将其定位为能独立交付的“员工”。
在程序员的日常工作中,有个现象很有意思:AI 辅助生成代码,极大地提升了编码效率。但这种个人效率的提升,在高层看来似乎“上不了台面”,很难作为亮眼的业绩去汇报。背后的逻辑是:如果 AI 只是个辅佐工具,那作为“人”的核心贡献在哪里?程序员不应该只产出代码,贡献的应当是他们的知识和决策。
在这种思想驱动下,各种用于写代码的 Agent(智能体,你可以简单理解为虚拟员工)应运而生。可问题在于,当前主流的 大模型 天然带有不确定性。为了让它的输出可控,就必须给 Agent 配置海量的约束条件——说白了,就是用文字描述什么事能做、什么事不能做、遇到特定情况具体该怎么处理。这些约束条件会占用巨量的 Token。更夸张的是,由于当前 AI 本身不具备真正的记忆能力,每次提问,你都得把所有的背景和规则再“喂”给它一遍。这就好比两个人聊天,你每说一句话前,都得先重新做一遍自我介绍,并把你们之前所有的对话复述一次,对方才能接上话——是不是挺荒谬的?
到目前为止,以我个人的经验看,还没见过哪个 Agent 能做到真正的商业落地。大部分仍停留在 Demo 演示阶段,就像我常说的“上称”检验,至今没发现谁能真正过关。反复调试这类 Agent,会重复消耗海量 Token,可以说现在整个行业仍处于早期探索期,投入和产出完全不成正比。大量的 Token,就这样被用来生成了一堆垃圾代码。
有人说,2026 年会是 AI 应用 的爆发之年。我们确实期盼,届时的 AI 应用能真正实现收益大于成本,切切实实地造福行业、服务人类,甚至创造出更多新的社会岗位。
|