Claude Code 被曝乱扣费:AI 多智能体流水线成“Token 黑洞”,MaaS 厂商计费黑箱引质疑
用户的钱包正在被看不见的“AI 流水线”吞噬。周四成为许多开发者一周中 API 额度消耗最快的一天,写周报、Review 代码等常规操作,动辄消耗掉 Claude Code 套餐 30% 以上的 Token。更令人不安的是,用户根本不知道这些 Token 具体花在了哪里。问题的根源,在 Reddit 社区用户通过逆向工程揭露 Claude Code 的计费代码后,终于被官方证实。Anthropic 官方账号在证据面前承认存在计费问题,并表示“正在紧急排查,目前是最高优先级问题”。这并非简单的定价策略,而是一个深植于其技术架构的工程缺陷。
Claude Code 的高效源于其复杂的“多智能体流水线”架构。它并非单一模型,而是由负责编写、评审、调试等多个子智能体组成的系统。当用户发起一次看似简单的“对话”时,后台可能在五六个智能体之间反复跳转、协同工作。支撑这种复杂任务的 Harness 架构,其开销远高于单模型对话。据社区测试,复杂任务下的 Token 消耗可能是直接调用基础模型的数倍甚至十倍。然而,所有这些子智能体的消耗,都被打包进一次对话的账单里,对用户完全透明。更隐蔽的是内部的模型调控机制,如 Plan Mode、Reviewer 等角色的每次切换,都是一次隐性的 API 调用。
此次事件暴露了 MaaS(模型即服务)行业一个普遍但被忽视的风险:应用层的计费黑箱。逆向工程揭示,导致 Claude Code 乱扣费的核心是两个独立的缓存 Bug,它们使得 Prompt Cache 完全失效,导致大量重复计算和无效 Token 消耗。这引发了更广泛的质疑:其他国产或国际 MaaS 厂商是否面临同样的架构性计费漏洞?在 AI 使用的高峰期,厂商能否提供更透明、可预测的计费方案,而非让用户为无法感知的后台开销买单?当智能体在“疯狂偷吃”用户的 Token 时,整个行业的计费透明度和技术债务,正面临来自用户和开发者的严格审视。