Tokenmaxxing 已死：AI 效率度量从 token 消耗量转向 cost-per-task

2026年4月，Meta 内部「Claudeonomics」排行榜统计 8.5 万名员工 LLM token 消耗量。不到两个月后，Lindy 将 100% API 流量从 Claude 切换到 DeepSeek，Vercel 数据确认 DeepSeek token 份额从 1% 飙升至 17%。Tokenmaxxing 已死，cost-per-task 取而代之。

什么是 Tokenmaxxing

Tokenmaxxing 将 token 消耗视为生产力指标，但 Amazon 员工刷无效任务、Uber 4 个月烧光全年 AI 预算，暴露其根本缺陷。Jellyfish 研究显示重度 AI 用户生产力约 2 倍于非用户，但 token 消耗是 10 倍。

市场信号：DeepSeek 崛起

DeepSeek V4 Flash 定价 0.14 美元/百万 token，比 Anthropic 便宜 20-50 倍。Vercel AI Gateway 数据显示其 token 份额一个月从 1% 升至 17%。

生产级答案：异构模型路由

默认用便宜模型，仅当任务需要时才升级。RouteLLM (ICLR 2025) 可将成本降低 85% 同时保持 95% 质量。

Tokenmaxxing 已死：AI 效率度量从 token 消耗量转向 cost-per-task

什么是 Tokenmaxxing

市场信号：DeepSeek 崛起

生产级答案：异构模型路由

关联推荐