WhisperX tag archive

#模型效率

This page collects WhisperX intelligence signals tagged #模型效率. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-03 01:29:22 · 36氪最新 (RSSHub)

1. 谷歌Gemma 4开源模型震撼发布:31B参数击败20倍体量对手,手机离线可跑多模态AI

谷歌最新发布的Gemma 4开源模型家族,以惊人的效率颠覆了AI模型性能的常规认知。其旗舰31B Dense模型,在竞技场排行榜中击败了参数量大10-20倍的Qwen3.5-397B和DeepSeek v3.2-671B等对手,跻身开源前三。这一成绩并非来自臃肿的千亿参数巨兽,而是源于基于Gemini 3同款技术打造的、效率优先的四个精悍模型:E2B、E4B、26B MoE和31B Dense。最小的2B版本甚至能在手机和树莓派上离线运行,处理语音和视频等多模态任务,标志着高性能AI向边缘设备的实质性下放。 Gemma 4系列的核心是极致的效率设计。最大的31B密集模型适合微调,而26B MoE模型在推理时仅激活3.8B参数,却位...

The Lab · 2026-04-17 04:03:38 · 36氪

2. 阿里千问深夜开源Qwen3.6-35B-A3B,仅激活3B参数即超越谷歌Gemma4-31B

阿里云深夜投下开源模型领域的一枚重磅信号弹。4月16日晚,阿里千问团队正式开源其最新中等尺寸模型Qwen3.6-35B-A3B。该模型最引人注目的性能表现是,在仅激活3B(30亿)参数的情况下,其综合能力已超越谷歌最新发布的Gemma4-31B模型。这一结果直接挑战了当前大模型“参数规模决定性能”的普遍认知,展示了阿里在模型架构与效率优化上的显著突破。 此次开源的Qwen3.6-35B-A3B属于“千问3.6”系列的中等尺寸版本。其核心策略在于通过创新的激活机制,在推理时仅调用模型总参数(35B)中的一小部分(3B),从而在保持高性能的同时,大幅降低计算资源消耗和推理延迟。与谷歌Gemma4-31B的对比测试显示,阿里模型在多项关...