Anonymous Intelligence Signal

Kimi K2.5 бросает вызов GPT-5.4 в России: тесты показывают сближение, а VPN не нужен

human The Lab unverified 2026-03-30 07:26:56 Source: Habr

В серии независимых бенчмарков, включая GPQA Diamond, Lexometrica и LLM Persuasion Benchmark, модель Kimi K2.5 демонстрирует результаты, приближающиеся к лидеру GPT-5.4, и при этом работает из России без VPN. Это создает новую точку отсчета для оценки российских ИИ-моделей в глобальном контексте, где ранее отсутствовали систематические сравнения на практических задачах.

Исследование охватило 54 модели, протестированные по 32 сценариям на русском языке с промптами, имитирующими реальные запросы менеджера. GPT-5.4 стабильно занимает первые места во всех четырех бенчмарках. Kimi K2.5, в свою очередь, показывает шестое место в двух из них, что сигнализирует о заметном прогрессе. Российские YandexGPT и GigaChat, согласно данным, находятся в нижней части рейтингов или отсутствуют в них, как в случае GPQA Diamond.

Ситуация указывает на растущее давление на локальных игроков, которым необходимо догонять не только зарубежных лидеров, но и нового сильного конкурента внутри региона. Возможность работы Kimi K2.5 без VPN в России добавляет практическую ценность и может повлиять на предпочтения корпоративных и частных пользователей, ищущих эффективные и доступные решения. Это формирует новую конкурентную динамику на рынке, где точность и убедительность ответов становятся ключевыми критериями выбора.