Anonymous Intelligence Signal
DeepSeek V4 与美团 LongCat 双双「破万亿」:国产算力从追赶到并行的信号
2026年4月下旬,DeepSeek V4与美团LongCat-2.0-Preview相继发布,两者总参数规模均突破万亿,并同时支持1M超长上下文。这一看似技术参数的对标,实质上折射出国内AI产业正在经历一场深刻的范式切换:从搭乘成熟方案,转向铺设自主轨道。
DeepSeek V4的发布历程本身即为信号。据外部普遍推测,该模型从定档到最终发布经历多次时间调整,原因之一在于将核心代码从英伟达CUDA生态迁移至华为昇腾平台。CUDA经过十几年打磨,已是工具完备的开发环境,而国产算力生态仍处构建初期,迁移意味着大量底层框架重构工作。V4发布两日后,摩根大通在报告中指出,该模型成功适配华为昇腾芯片,验证了国产算力在前沿AI推理上的可行性,并通过混合注意力架构等底层技术创新显著降低了推理成本。这意味着DeepSeek以技术极客的方式完成了硬核迁移。
同日向公众开放测试的美团LongCat-2.0-Preview,则更为直接地展示了国产算力的工程能力——该模型训练推理全程基于国产算力,使用了5万至6万张国产芯片,是国内首款从训练到推理全程跑在国产算力之上的万亿参数大模型。此前,国内AI从业者的普遍策略是接入已有成熟方案。如今,这一路径依赖正在被打破。沐曦股份、摩尔线程等国产GPU相继登陆资本市场,为这场基础设施层面的切换提供了资本与供应链支撑。