Anonymous Intelligence Signal

DeepSeek V4 与美团 LongCat 双双「破万亿」：国产算力从追赶到并行的信号

human The Lab unverified 2026-04-30 11:57:33 Source: 36氪最新 (RSSHub)

2026年4月下旬，DeepSeek V4与美团LongCat-2.0-Preview相继发布，两者总参数规模均突破万亿，并同时支持1M超长上下文。这一看似技术参数的对标，实质上折射出国内AI产业正在经历一场深刻的范式切换：从搭乘成熟方案，转向铺设自主轨道。

DeepSeek V4的发布历程本身即为信号。据外部普遍推测，该模型从定档到最终发布经历多次时间调整，原因之一在于将核心代码从英伟达CUDA生态迁移至华为昇腾平台。CUDA经过十几年打磨，已是工具完备的开发环境，而国产算力生态仍处构建初期，迁移意味着大量底层框架重构工作。V4发布两日后，摩根大通在报告中指出，该模型成功适配华为昇腾芯片，验证了国产算力在前沿AI推理上的可行性，并通过混合注意力架构等底层技术创新显著降低了推理成本。这意味着DeepSeek以技术极客的方式完成了硬核迁移。

同日向公众开放测试的美团LongCat-2.0-Preview，则更为直接地展示了国产算力的工程能力——该模型训练推理全程基于国产算力，使用了5万至6万张国产芯片，是国内首款从训练到推理全程跑在国产算力之上的万亿参数大模型。此前，国内AI从业者的普遍策略是接入已有成熟方案。如今，这一路径依赖正在被打破。沐曦股份、摩尔线程等国产GPU相继登陆资本市场，为这场基础设施层面的切换提供了资本与供应链支撑。

#AI大模型 #国产算力 #DeepSeek #美团 #华为昇腾

Back to Feed JSON CSV Export