机器人开源战争:小米、蚂蚁、阿里、英伟达为何争相免费开放“大脑”?
一场围绕机器人“大脑”的免费开源革命正在全球科技巨头间引爆。从今年2月小米、蚂蚁集团、阿里达摩院、宇树科技,到更早的英伟达发布GR00T N1.6,消费电子、互联网、芯片领域的顶级玩家正以前所未有的速度,将各自研发的机器人基础模型免费向世界开放。这并非简单的技术共享,其背后是万亿美元市场前景下的复杂博弈与战略心机。当特斯拉、Figure等闭源巨头正凭借硬件和数据优势构筑护城河时,开源阵营的集体行动,正试图用另一种方式重塑具身智能的竞争格局。
目前,开源视觉-语言-动作模型阵营已形成四股清晰的力量。第一是“学院派”,以OpenVLA和Octo为代表,模型参数虽小但能以巧取胜。第二是“巨头生态派”,以英伟达的GR00T和谷歌的Gemini Robotics为核心,它们不只提供模型,更布局了完整的工具链。第三是“创业公司与中国力量”,包括自变量、OpenMind以及小米、蚂蚁等中国科技公司。第四是“技术极致派”,如Physical Intelligence的π₀模型,追求极致的精度与泛化能力。其中,学院派的开源模型OpenVLA在2024年6月一战成名,其仅70亿参数的模型在29项机器人操作任务中,全面击败了参数规模是其8倍、背靠谷歌庞大资源的RT-2-X模型,成功率高出16.5%。其制胜关键在于采用了“双视觉编码器+大语言模型”的聪明架构,相比谷歌模型的单一编码器,信息处理效率显著提升。
这场开源运动的动机远非技术理想主义那么简单。核心问题在于,什么是“真开源”,什么是“假开源”?开源模型生态能否真正挑战特斯拉这样的闭源巨头?巨头们开放“大脑”,意在通过社区力量加速技术迭代、建立事实标准,并为其硬件平台或云服务生态引流。而创业公司与中国力量的加入,则试图在巨头主导的赛道中,以开源策略快速切入,积累开发者生态与数据。这场博弈的胜负手,将取决于开源社区能否在数据飞轮、工具易用性和实际场景落地效率上,真正匹敌闭源巨头的垂直整合优势。