#ARC-AGI-3

The Lab · 2026-03-27 10:10:06 · 36氪最新 (RSSHub)

1. ARC-AGI-3 首日惊现黑马：Symbolica AI 以 36% 成绩撕开“全球最难考试”缺口

全球顶尖大模型在号称“AI界最难关卡”的ARC-AGI-3测试中集体翻车，最强模型Opus 4.6仅得0.2%，而人类却能轻松满分。这一结果让业界对当前AI是否接近通用人工智能（AGI）产生了强烈质疑。然而，就在测试发布次日，一家名为Symbolica的公司宣布其AI系统“Agentica”在首日就取得了36.08%的成绩，实现了惊人的反转。这一分数不仅全面碾压了现有大模型的基线，更在182个关卡中成功通关113个，为这场被认为近乎不可能通过的测试撕开了一道关键缺口。 Symbolica的突破性表现，将压力直接传导给了OpenAI、Anthropic等主流模型厂商。ARC-AGI-3的核心挑战在于它是一个交互式黑盒游戏，而非静态的...

#AI #AGI #ARC-AGI-3 #大模型 #基准测试

Latest Signals (1)

1. ARC-AGI-3 首日惊现黑马：Symbolica AI 以 36% 成绩撕开“全球最难考试”缺口