Anonymous Intelligence Signal
谷歌首度拆分训练与推理TPU芯片,战略转向直指AI推理成本竞赛
Alphabet旗下谷歌云在年度开发者大会上迈出战略性一步,首次将AI训练与推理任务拆分至两款独立芯片。此举标志着谷歌AI硬件战略的重大转向,也预示着AI芯片市场将进入更精细的分工竞争阶段。
谷歌在Google Cloud Next 2026大会上发布的第八代TPU,包含专为模型训练设计的TPU 8T与专为推理阶段优化的TPU 8i两款产品。TPU 8T号称可将前沿模型开发周期从数月压缩至数周,每瓦性能较上一代提升124%,在同等价格下性能提升达2.8倍,最多可组合9600块芯片构成大规模系统。TPU 8i则面向推理场景,集成384MB静态随机存取存储器,是上一代Ironwood的三倍,每瓦性能提升117%,性能提升幅度达80%。两款芯片均计划于今年晚些时候正式对外供应。
这一拆分策略反映出AI工作负载分化趋势的深化。谷歌AI与基础设施首席技术官Amin Vahdat指出,随着AI智能体兴起,针对训练和推理各自需求专门优化的芯片将更具优势。云计算与AI基础设施副总裁Mark Lohmeyer强调,关键在于以最低的每笔交易成本实现最低的响应延迟,交易量正大幅攀升,成本必须大幅下降才能实现规模化。与此同时,谷歌同步推出Gemini Enterprise Agent Platform等企业级AI智能体开发工具,在硬件与软件两条战线同时向英伟达、OpenAI及Anthropic发起挑战。