1. DeepSeek V4技术报告缺失Engram引热议:社区追问“记忆模块”下落
DeepSeek V4的技术报告包含mHC、CSA、HCA、Muon、FP4等多项架构优化,却唯独未见Engram的身影。这一缺失迅速成为圈内外热议的焦点,众多开发者第一时间在论文中command+f检索Engram未果,不少声音直言“没有Engram,V4是不完整的”。 Engram由DeepSeek与北京大学于今年1月联合开源,论文题为《Conditional Memory via Scalable Lookup》,第一作者为北大博士生ChengXin(曾署名V3),通讯作者为梁文锋。Engram的核心设计是为Transformer添加原生知识查表模块,实现“能查的别算”——模型处理“伦敦是英国首都”这类静态知识时,无需动用整...