The Network · 2026-03-06 05:05:49 · ai
八年前,中兴通讯因美国一纸禁令而“心脏骤停”。2018年4月16日,美国商务部工业与安全局的禁令禁止任何美国公司在未来七年内向中兴出售零部件、商品、软件和技术。这导致这家全球第四大通信设备商主要经营活动无法进行,最终以支付14亿美元罚款、高管换血、接受美方合规监督为代价存活,当年净亏损70亿元。
八年后,2026年2月26日,中国AI独角兽DeepSeek宣布,其即将发布的V4多模态大模型将优先与国产芯片厂商深度合作,首次实现从预训练到精调的全流程非英伟达方案。这标志着中国AI产业在算力独立上的关键一步。
真正的“卡脖子”问题并非仅是硬件芯片,而是英伟达的CUDA生态。CUDA是英伟达在2006年推出的并行计算平台和编程模型,已...
The Lab · 2026-03-31 12:39:54 · 36氪最新 (RSSHub)
国内头部AI大模型服务商DeepSeek的服务稳定性正面临严峻考验。在刚刚经历一场持续近12小时的重大服务中断后仅隔一天,其服务在3月31日下午再度崩溃,引发用户对平台可靠性的新一轮担忧。当天下午,大量用户发现无法正常使用DeepSeek,对话时频繁收到“请检查网络后重试”或“服务器繁忙”的提示,界面新闻等媒体实测也证实了服务异常。尽管官方在约一小时后宣布问题解决,但此次快速复发的宕机事件,无疑给DeepSeek的技术架构和运维能力投下了浓重阴影。
此次宕机是DeepSeek在短短三天内遭遇的第二次严重服务故障。就在3月29日晚间至30日上午,该平台刚刚经历了一场创纪录的、持续近12小时的大规模服务中断。根据官方状态页面披露,那场...
The Lab · 2026-04-07 10:59:28 · 36氪最新 (RSSHub)
全球AI模型聚合平台OpenRouter的最新周度数据揭示了一个关键转折:在2026年4月3日当周的调用量前十榜单中,中国模型占据了六席。其中,小米的MiMo-V2-Pro以4.82万亿Token的调用量位居全平台第一,超越了所有美国模型。这一领先态势并非偶然,自2026年2月中旬中国模型周调用量首次超越美国以来,其优势已持续近两个月。OpenRouter作为汇聚超过400个模型、覆盖60多家供应商的平台,其数据被视为观察全球开发者偏好的重要窗口,而中国模型的崛起正在重塑这一格局。
价格是驱动这一转变的核心杠杆。截至2026年3月底的官方定价显示,中美主流大模型的成本差距悬殊。以输入价格为例,中国模型如DeepSeek V3.2为...
The Lab · 2026-04-26 04:57:33 · 华尔街见闻 (RSSHub)
高盛最新研报揭示,DeepSeek V4的核心价值不在于参数量的军备竞赛,而在于以激进成本压缩打开AI应用规模化的新空间。4月24日,高盛Ronald Keung团队发布分析指出,V4延续了DeepSeek效率优先、开源路线的基因,其技术突破直指当前制约AI落地的关键瓶颈——长上下文推理的高昂成本。
技术层面,V4通过混合注意力机制实现显著降本。压缩稀疏注意力(CSA)与重度压缩注意力(HCA)的组合架构,将100万上下文场景下的浮点运算量压缩至V3.2的27%(Pro版本),KV缓存占用更降至10%。Flash版本更为激进,FLOPs降至10%,KV缓存压缩至7%。与此同时,引入mHC机制增强信息传递稳定性,并以Muon优化器替...
The Vault · 2026-05-06 09:01:28 · 华尔街见闻 (RSSHub)
高盛发布重磅报告,系统梳理中国AI大模型赛道的五大核心投资辩题,并罕见调整头部标的评级。报告将MiniMax评级从"中性"上调至"买入",维持阿里巴巴"买入"评级,同时将阿里云三月季度收入增速预期上调至40%,高于上季度的36%。这一评级动作释放出高盛对中国AI云基础设施板块的强烈看多信号。
报告核心论点之一,是中国AI模型正加速缩小与美国领先模型之间的差距。从基准测试来看,中国模型在定价竞争力、推理速度及智能体任务完成率上已具备显著优势。分析师指出,紧缺的算力资源正推动中国AI企业探索高效架构路线,以更少芯片和内存实现性能优化。与此同时,美国SOTA模型对中国用户的访问限制趋于收紧,为中国模型在高价值场景形成正向数据飞轮创造了条...
The Lab · 2026-05-07 11:01:14 · 36氪最新 (RSSHub)
五一假期后首个交易日,智谱与MiniMax股价双双暴涨。5月4日,智谱涨幅超10%逼近千元大关,MiniMax单日大涨12.62%收于803港元。这轮上涨的核心驱动力,来自摩根士丹利最新报告《China's AI Path: More Bang For The Buck》中提出的"性价比叙事"——摩根士丹利指出,中美顶尖模型智能水平差距已收窄至3至6个月,而中国模型能以美国同行15%至20%的推理成本实现同等智能表现。市场押注的不仅是国产替代,更是中国AI将性价比转化为真实调用量、真实收入与估值弹性的能力。
但这种性价比的真正来源此前并不清晰——低价获客终将沦为价格战,模型蒸馏路径也因OpenAI、Anthropic等企业关闭入口...
The Vault · 2026-05-09 01:54:44 · 爱范儿
中国AI领域或将迎来迄今规模最大的单轮融资。据《The Information》报道,DeepSeek正计划启动成立以来首轮外部融资,目标金额高达500亿元人民币,创始人兼CEO梁文锋预计以个人身份认购最多200亿元,占本轮融资约40%。若融资顺利完成,DeepSeek估值(含募资额)将超过3500亿元人民币,较融资启动初期外界预估的逾100亿美元大幅攀升。这一融资规模与估值跃升,标志着中国大模型赛道进入资本加速集中的新阶段。
DeepSeek同时计划于今年6月推出V4模型的升级版V4.1。新版本将面向企业用户提供更多工具,增强对MCP(模型上下文协议)的支持,便于AI模型与其他软件系统对接,并具备处理图像和音频内容的多模态能力。...