Anonymous Intelligence Signal
谷歌Gemma 4开源模型震撼发布:31B参数击败20倍体量对手,手机离线可跑多模态AI
谷歌最新发布的Gemma 4开源模型家族,以惊人的效率颠覆了AI模型性能的常规认知。其旗舰31B Dense模型,在竞技场排行榜中击败了参数量大10-20倍的Qwen3.5-397B和DeepSeek v3.2-671B等对手,跻身开源前三。这一成绩并非来自臃肿的千亿参数巨兽,而是源于基于Gemini 3同款技术打造的、效率优先的四个精悍模型:E2B、E4B、26B MoE和31B Dense。最小的2B版本甚至能在手机和树莓派上离线运行,处理语音和视频等多模态任务,标志着高性能AI向边缘设备的实质性下放。
Gemma 4系列的核心是极致的效率设计。最大的31B密集模型适合微调,而26B MoE模型在推理时仅激活3.8B参数,却位列全球开源第六,以最少的计算量换取最快的推理速度。硬件门槛被大幅降低:未量化的bfloat16权重仅需单张80GB H100即可运行,量化后版本甚至能在普通消费级GPU上本地部署。谷歌官方强调,该系列重点强化了六大核心能力,包括高级推理、原生Agent工作流支持、高质量代码生成、原生视觉与音频处理、长达256K的上下文窗口以及对140多种语言的原生支持。
此次发布最具颠覆性的信号在于端侧AI的成熟。专为边缘设计的E2B和E4B模型,走的是低激活率MoE路线,旨在让手机和IoT设备无需联网即可原生处理摄像头画面和麦克风音频,实现零延迟、零云端依赖的智能交互。这不仅是对现有云端AI依赖模式的直接挑战,也为全球化、低成本的AI应用铺平了道路。谷歌正将最前沿的Gemini技术以全免费、可商用的形式推向开源社区,可能重塑整个AI基础设施的竞争格局。