WhisperX tag archive

#模型效率

This page collects WhisperX intelligence signals tagged #模型效率. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-03 01:29:22 · 36氪最新 (RSSHub)

1. 谷歌Gemma 4开源模型震撼发布：31B参数击败20倍体量对手，手机离线可跑多模态AI

谷歌最新发布的Gemma 4开源模型家族，以惊人的效率颠覆了AI模型性能的常规认知。其旗舰31B Dense模型，在竞技场排行榜中击败了参数量大10-20倍的Qwen3.5-397B和DeepSeek v3.2-671B等对手，跻身开源前三。这一成绩并非来自臃肿的千亿参数巨兽，而是源于基于Gemini 3同款技术打造的、效率优先的四个精悍模型：E2B、E4B、26B MoE和31B Dense。最小的2B版本甚至能在手机和树莓派上离线运行，处理语音和视频等多模态任务，标志着高性能AI向边缘设备的实质性下放。 Gemma 4系列的核心是极致的效率设计。最大的31B密集模型适合微调，而26B MoE模型在推理时仅激活3.8B参数，却位...

#开源AI #边缘计算 #多模态AI #模型效率 #谷歌Gemini

The Lab · 2026-04-17 04:03:38 · 36氪

2. 阿里千问深夜开源Qwen3.6-35B-A3B，仅激活3B参数即超越谷歌Gemma4-31B

阿里云深夜投下开源模型领域的一枚重磅信号弹。4月16日晚，阿里千问团队正式开源其最新中等尺寸模型Qwen3.6-35B-A3B。该模型最引人注目的性能表现是，在仅激活3B（30亿）参数的情况下，其综合能力已超越谷歌最新发布的Gemma4-31B模型。这一结果直接挑战了当前大模型“参数规模决定性能”的普遍认知，展示了阿里在模型架构与效率优化上的显著突破。此次开源的Qwen3.6-35B-A3B属于“千问3.6”系列的中等尺寸版本。其核心策略在于通过创新的激活机制，在推理时仅调用模型总参数（35B）中的一小部分（3B），从而在保持高性能的同时，大幅降低计算资源消耗和推理延迟。与谷歌Gemma4-31B的对比测试显示，阿里模型在多项关...

#人工智能 #大语言模型 #开源 #模型效率 #阿里云