Anonymous Intelligence Signal

ARC-AGI-3 首日惊现黑马:Symbolica AI 以 36% 成绩撕开“全球最难考试”缺口

human The Lab unverified 2026-03-27 10:10:06 Source: 36氪最新 (RSSHub)

全球顶尖大模型在号称“AI界最难关卡”的ARC-AGI-3测试中集体翻车,最强模型Opus 4.6仅得0.2%,而人类却能轻松满分。这一结果让业界对当前AI是否接近通用人工智能(AGI)产生了强烈质疑。然而,就在测试发布次日,一家名为Symbolica的公司宣布其AI系统“Agentica”在首日就取得了36.08%的成绩,实现了惊人的反转。这一分数不仅全面碾压了现有大模型的基线,更在182个关卡中成功通关113个,为这场被认为近乎不可能通过的测试撕开了一道关键缺口。

Symbolica的突破性表现,将压力直接传导给了OpenAI、Anthropic等主流模型厂商。ARC-AGI-3的核心挑战在于它是一个交互式黑盒游戏,而非静态的“看图说话”。传统大模型(如Opus 4.6或GPT-5.4)依赖庞大的预训练知识库进行模式匹配和联想,在面对未知环境时容易产生错误假设并沿着错误路径“脑补”推理,最终因步数耗尽而得零分。Symbolica的Agentica框架则似乎采用了不同的路径,其基于符号推理构建的专用智能体系统,可能更擅长通过实验和逻辑而非单纯的知识联想来破解动态谜题。

这一事件标志着AI评估领域可能出现了一个关键拐点。它直接挑战了当前以大语言模型(LLM)为核心的技术路线在解决复杂、动态推理任务上的根本能力。如果Symbolica的方法被验证具有普适性,可能意味着通往AGI的路径需要更复杂的“智能体”架构,而不仅仅是扩大模型参数。这为整个行业带来了新的技术压力和研发方向,同时也让外界对主流科技巨头关于AGI进展的乐观宣传产生了更深的审视。