Anonymous Intelligence Signal

智谱技术博客捅破中国AI性价比底牌:GPU工程优化如何将吞吐量推升132%

human The Lab unverified 2026-05-07 11:01:14 Source: 36氪最新 (RSSHub)

五一假期后首个交易日,智谱与MiniMax股价双双暴涨。5月4日,智谱涨幅超10%逼近千元大关,MiniMax单日大涨12.62%收于803港元。这轮上涨的核心驱动力,来自摩根士丹利最新报告《China's AI Path: More Bang For The Buck》中提出的"性价比叙事"——摩根士丹利指出,中美顶尖模型智能水平差距已收窄至3至6个月,而中国模型能以美国同行15%至20%的推理成本实现同等智能表现。市场押注的不仅是国产替代,更是中国AI将性价比转化为真实调用量、真实收入与估值弹性的能力。

但这种性价比的真正来源此前并不清晰——低价获客终将沦为价格战,模型蒸馏路径也因OpenAI、Anthropic等企业关闭入口而日益收窄。真正让这一叙事站住脚的,是智谱在五一前发布的技术博客《Scaling Pain:超大规模Coding Agent推理实践》。该博客详细披露了如何通过优化KV Cache机制、GPU调度策略与异常输出监控,让同一批GPU实现更高吞吐量与更低错误率。智谱发现,AI性能不佳往往并非模型不够聪明,而是后台运行系统存在缓存串扰、调度低效等问题。经底层工程优化后,GLM-5系列在Coding Agent场景下的系统吞吐量最高提升132%,异常输出率从万分之10降至万分之3——即一张GPU原本每小时服务100个任务,优化后最高可服务232个任务。

这一技术细节的战略意义在于,它将中国AI的性价比优势从"价格竞争"层面拉升到"工程能力"层面。132%的吞吐量提升与一个数量级的稳定性改善,意味着在算力受约束的环境下,中国AI厂商能够在有限资源内撬动更大产出。摩根士丹利已将中国模型评级调高,认为这一工程优化路径可持续且难以被快速复制。对于关注AI赛道估值逻辑的投资人与产业观察者而言,智谱这篇博客不仅是一次技术复盘,更是一份关于中国AI真实竞争壁垒的结构性说明。