清华系AI Infra厂商「容芯致远」获数亿元天使轮融资,以GPU重构计算机系统架构突破传统瓶颈
硬氪获悉,北京容芯致远科技有限公司近日完成天使轮数亿元融资,由北京绿色能源和低碳产业基金与赛富投资基金领投,顺禧基金、富华资本、万利达集团、长江创新投、水木清华校友基金、梅花创投等机构跟投。云岫资本担任长期独家财务顾问。本轮资金将支持容芯致远进一步推进以GPU为核心的AI计算体系——AGC(AI computer system with the GPU as its Core)架构的商业化落地。
当前AI算力需求急剧增长,传统以CPU为中心的计算架构瓶颈日益凸显:CPU成为数据调度与交互的核心限制,GPU间通信效率不足,内存无法实现统一地址空间共享,整体算力利用率偏低。容芯致远创始人石旭毕业于清华大学电子工程系,在芯片设计与AI领域深耕多年。据其透露,传统AI服务器在规模化部署时,往往需要多个CPU协同调度少量GPU,CPU数量随规模同步增加,导致系统复杂度与成本显著上升。AGC架构正是在这一痛点下提出:打破以CPU为核心的传统模式,将GPU作为系统核心计算单元,CPU转为外围控制组件,使GPU与CPU的比例(G:C)从传统约2:1提升至20:1甚至32:1。系统层面,该架构支持单一操作系统统一管理多达64个GPU,实现全局地址空间共享,避免跨节点数据拷贝,在大模型训练与推理场景中显著提升整体效率。
值得关注的是,这一体系创新并非单点优化,而是涉及全栈重构,涵盖BMC管理、交换系统、通信协议、推理框架、连接器等多个层面。在硬件监控层面,容芯致远自研AI BMC系统,将传统3至5秒级的轮询机制提升至微秒级响应,可在GPU温度异常等风险出现时即时触发降频或休眠策略。在可靠性设计上,传统八卡服务器单卡故障往往需整机停机维护,而AGC架构下单机可实现多达20个GPU的冗余设计,配合自研混存技术构建约10TB混合存储空间,对健康GPU的KV Cache进行实时缓存,缩短故障恢复周期并降低运维成本。