阿里AI技术大牛接连出走,暴露大模型时代“顶层设计”与“底层代码”的深层冲突
2026年3月,阿里通义实验室Qwen团队技术负责人林俊旸(P10)在社交媒体宣布离职,留下告别语。随后,后训练负责人郁博文也同步离开。此前,Qwen Code负责人惠彬原已于同年1月转投Meta。这一系列核心人事变动发生在团队外部声誉正高、内部士气尚佳的时刻。导火索是通义实验室试图将原本垂直整合的模型团队拆解为预训练、后训练、文本及多模态等水平分工部门。林俊旸因管理范围缩小,且其“预训练、Infra与训练需紧密结合”的技术理念与调整方向相悖,最终选择离开。
这并非孤立事件。百度、腾讯、字节跳动等大厂的AI核心团队也曾经历类似骨干流失。当AI从技术探索演变为科技公司的“全局战争”,此类案例正从偶发走向频发。现象背后是大厂在AI深水区面临的结构性焦虑与技术人才主体意识觉醒的剧烈碰撞。
大模型研发遵循独特的“全栈闭环”规律,要求数据、算力、算法与反馈机制高度耦合,任何环节割裂都会导致信息损耗,影响模型智能的涌现。Qwen团队曾自建Infra团队,正是为了打破通用支持模式,追求极致效率与适配。对“垂直整合”的渴望源于训练中微小参数调整可能引发巨大性能波动,唯有全流程掌控才能捕捉决定模型上限的细微信号。
然而,国内大厂的组织基因与大模型的研发需求存在天然错位。互联网巨头崛起于应用层创新,擅长通过精细化分工、赛马机制与强KPI导向实现商业目标的快速落地。这种工业化思维在开发确定性高的应用软件时效率惊人,但在面对充满不确定性的基础科学研究时则捉襟见肘。大模型的突破往往需要非共识的探索、长周期投入以及类似早期达摩院那种允许专注迭代的环境。
随着AI成为“全局战争”,大厂急于将技术影响力转化为AI云收入或超级App流量,商业目标的紧迫性压倒了技术探索的从容。阿里内部对Qwen-3.5“半成品”的评价及对开源模型商业化效率的追问,折射出管理层对短期回报的焦虑。这种焦虑传导至组织层面,便体现为频繁的架构调整与对技术理想主义空间的挤压,最终导致顶尖人才的流失。这留给业界一个关于技术理想与商业秩序如何共存的深刻命题。