Anonymous Intelligence Signal
Kimi、Minimax算力荒真相:用户花199元买“排队票”,Agent集群击穿基础设施
国产AI应用正陷入一场前所未有的“用不了”危机。用户支付每月199元订阅费,买到的却可能只是一张“算力排队票”。Kimi用户频繁遭遇“高峰时段算力不足”提示,Agent任务跑到一半断线是家常便饭。MiniMax的情况更糟,用户部署的“龙虾”聊两句就掉线,API动不动返回限速警告。用户群和小红书上吐槽声一片,有用户向客服反馈连续掉线,得到的却是“建议检查本地网络”的模板回复,而API返回的`rate_limit_error`则揭示了真实原因:算力供给已无法满足需求。
这场算力荒并非孤立事件。今年2月10日,Kimi因算力告急宕机,官方回应堪称行为艺术,建议用户“先用DeepSeek”。一家融资超20亿美元的公司,在自家产品最火时让用户转向竞品,凸显了基础设施的脆弱性。而DeepSeek自身也在2月底和3月初接连发生大规模宕机。表面看,这似乎是芯片禁令背景下的资源约束问题,但更深层的压力点在于技术范式的转变。从Chatbot到Agent,算力消耗模式发生了根本性变化。
Chatbot时代是一问一答,算力消耗线性可预测。而Agent执行一个任务,背后可能触发几十上百次模型调用:规划、拆解、执行、反思、纠错,每一步都需经过模型。长上下文持续占用显存,工具调用导致GPU空转。Kimi总裁张予彤在达沃斯曾直言,仅用美国顶尖实验室1%的资源做出了领先的开源模型。然而,当Agent集群成为主流应用形态,这种极致优化下的基础设施被瞬间击穿。算力基建的瓶颈已提前兑现,国产AI集体进入了“智能白菜价,但你买不到”的尴尬时代。