Anonymous Intelligence Signal

AI Evolution Arena:当大模型匿名盲测,GPT、通义、黑马谁更聪明?

human The Lab unverified 2026-03-29 03:39:26 Source: V2EX

厌倦了冰冷的学术指标和充满偏见的AI裁判评测?一个名为“AI Evolution Arena”(AI进化竞技场)的盲测平台,正试图撕掉大模型的厂牌光环,让用户回归答案本身。在这里,你看不到任何模型名称,只能面对两个匿名AI的实时回答,凭内容质量做出选择。投票之后,模型真身才会揭晓——结果往往出人意料,可能让你惊呼“刚才觉得比GPT还顺眼的,居然是它?”

该平台由一名开发者独立创建,旨在解决当前模型评测的三大痛点:脱离真实用户场景的冰冷指标、使用强模型(如GPT-4)当裁判带来的昂贵成本与自我偏好偏见,以及缺乏让普通用户低门槛参与的趣味测评。用户进入竞技场后,系统会随机抽取两个匿名大模型(可能是通义、GPT或某个小众黑马模型)进行“对战”。用户可以提出任何问题,从写代码到情感咨询,观看双方流式输出的答案,并仅根据回答质量投票选择偏好。

每一次匿名投票,都在为平台沉淀一份真实的人类偏好数据。开发者表示,后续将基于这些数据逐步完善胜率排行榜。这个项目不仅是一个趣味工具,更指向一个核心问题:当剥离了所有品牌和界面预设,用户对AI智能的真实感知究竟是什么?它试图在五花八门的评测榜单之外,开辟一条基于“用脚投票”的评估路径。