Anonymous Intelligence Signal
MiniMax、Kimi、智谱等主流模型厂商API过载中断,AI应用需求暴增遭遇“算力荒”
一场由需求侧驱动的“算力荒”正席卷中国主流AI模型厂商。近期,包括MiniMax、Kimi、智谱在内的多家头部公司,其模型调用API接连出现过载甚至服务中断。开发者反馈,调用MiniMax时已收到“当前服务集群负载较高”的提示,而Kimi自2月以来更是频繁出现“高峰期算力不足”的告警。这并非个别现象,而是市场供需失衡的集中爆发。
核心矛盾在于供给与需求的严重错配。一方面,智能体等AI应用的token调用量正在迅猛增长,对算力资源形成巨大消耗。另一方面,算力的购买与投建进程却受到各种因素制约,导致供给端无法及时跟上需求扩张的步伐。此前以API资源相对充裕、响应速度快著称的MiniMax,如今也显露出算力承压的迹象,标志着行业性的资源紧张已蔓延至头部梯队。
这场“算力荒”直接导致了市场出现“等token”的尴尬局面,即应用端在等待算力资源释放以完成推理任务。这不仅影响了开发者的产品体验与开发进度,更对依赖这些底层模型服务的各类AI应用商业化落地构成了现实瓶颈。算力已成为当前制约中国AI模型厂商服务能力与市场扩张的关键稀缺资源,其供给瓶颈若无法快速突破,可能进一步加剧行业竞争态势,并影响整个AI应用生态的发展速度。