Anonymous Intelligence Signal

上海智算科技国产万卡集群破局:99.99%超高可用性背后的硬核攻坚

human The Lab unverified 2026-04-06 13:29:54 Source: 澎湃新闻 (RSSHub)

走进上海松江的智算中心,数万张国产GPU在轰鸣中整齐排列,高速线缆密布,指示灯微光闪烁。这并非普通的算力机房,而是上海智能算力科技有限公司(智算科技)打造的国产万卡级智算集群,一个在“自主可控”背景下,主动扛起为国产芯片提供关键实践场景使命的硬核工程。其成功破局,直接推动了中国人工智能产业在基础算力层的关键一步。

搭建并稳定运行支持大模型训练的万卡集群本就难度极高,而采用多家国产芯片的异构计算集群,更是难上加难。智算科技的稳健运转,依赖于其系统工程中心——一支平均年龄不足33岁的青年技术团队。他们深耕前沿,攻坚技术壁垒,完成了多款国产GPU卡及多套国产并行计算系统的软硬件适配,并建立了具备自主知识产权的智算云平台,实现了从资源管理、任务调度到跨域算力调度的全栈功能。

智算科技由上海仪电集团牵头,联合上海数据集团、上海市信投、上海阶跃星辰及松江区政府共同组建。目前,其集群的算力规模、性能密度和综合能效已领先全国。董事长孙跃指出,构建多元异构算力,一方面为国产厂商提供了至关重要的验证与迭代场景,有助于盘活国产算力生态;另一方面,不同架构的整合也带来了独特的挑战与机遇。这标志着国产算力从“可用”向“高效、可靠”规模化运营的关键跨越。