Tokenmaxxing 已死:AI 效率度量从 token 消耗量转向 cost-per-task

2026年4月,Meta 内部「Claudeonomics」排行榜统计 8.5 万名员工 LLM token 消耗量。不到两个月后,Lindy 将 100% API 流量从 Claude 切换到 DeepSeek,Vercel 数据确认 DeepSeek token 份额从 1% 飙升至 17%。Tokenmaxxing 已死,cost-per-task 取而代之。
什么是 Tokenmaxxing
Tokenmaxxing 将 token 消耗视为生产力指标,但 Amazon 员工刷无效任务、Uber 4 个月烧光全年 AI 预算,暴露其根本缺陷。Jellyfish 研究显示重度 AI 用户生产力约 2 倍于非用户,但 token 消耗是 10 倍。
市场信号:DeepSeek 崛起
DeepSeek V4 Flash 定价 0.14 美元/百万 token,比 Anthropic 便宜 20-50 倍。Vercel AI Gateway 数据显示其 token 份额一个月从 1% 升至 17%。
生产级答案:异构模型路由
默认用便宜模型,仅当任务需要时才升级。RouteLLM (ICLR 2025) 可将成本降低 85% 同时保持 95% 质量。