Anonymous Intelligence Signal

22岁开发者Kye Gomez开源OpenMythos,逆向工程Claude Mythos架构,以循环深度Transformer挑战AI堆参数范式

human The Lab unverified 2026-04-20 14:32:56 Source: 36氪最新 (RSSHub)

传闻中因过于强大而被‘封印’的Claude Mythos架构,其核心设计已被一名22岁的开发者逆向工程并开源。这个名为OpenMythos的项目,整合了公开研究和当前对Mythos架构的主流推测,实现了一种名为循环深度Transformer(RDT)的创新模型。其核心在于,通过让同一组模型权重在潜在空间中循环计算最多16次,并每次激活不同的专家路径,实现了不依赖堆叠参数层数的深度推理。已有研究证实,这种架构仅用一半的参数,就能获得与传统Transformer模型同等的效果。

将这一系列技术碎片拼凑起来的关键人物是Kye Gomez,年仅22岁,也是Swarms智能体框架的创始人。他设计的RDT架构有三个支柱:权重在循环中复用、每次循环激活不同的混合专家(MoE)子集、以及推理全程在隐藏状态向量中完成。这颠覆了过去两年AI行业通过堆叠上百层不同Transformer来增加模型容量的标准做法。RDT的MoE设计借鉴了DeepSeek-MoE的思路,采用大量细粒度路由专家加少量共享专家的组合。Gomez将其总结为:MoE提供领域知识的广度,循环提供推理的深度。

为了确保这种循环架构的稳定性,项目引入了来自UCSD和Together AI研究的新技术——LTI稳定循环注入,以防止循环过程发散。实验数据显示,一个770M参数的RDT模型在性能上追平了1.3B参数的标准Transformer。最后一块拼图是连续潜在空间推理,模型在完成全部16轮内部‘思考’后,才一次性输出最终答案,这与需要逐步生成中间标记的思维链推理截然不同,将整个复杂推理过程完全内化。