The Office · 2026-03-06 01:12:49 · ai
Команда, занявшая 3 место на хакатоне с реально работающим сервисом, провела расследование после победы команды, показавшей лишь презентацию. Победители продемонстрировали интерфейс, но не представили рабочий код. Проверка их репозитория на GitHub показала полное отсутствие реализованной функциональности. Вместо интегр...
The Lab · 2026-03-25 10:57:30 · Habr
Участник юридического AI-челленжа ARLC 2026 в одиночку прошел путь от катастрофически низкого результата в 0.034 до впечатляющего показателя в 0.791 на warmup-этапе, используя Claude Code в качестве напарника. Однако финал обернулся резким провалом: при масштабировании с 30 до 300 документов производительность системы ...
The Lab · 2026-03-29 07:56:53 · Habr
На корпоративном хакатоне по обходу ИИ-песочниц участники столкнулись с суровой реальностью: хваленые reasoning-модели не справились с закрытым бенчмарком PAC1. Вместо выполнения задачи — работы с виртуальной файловой системой и обхода ловушек безопасности (Indirect Prompt Injections) — модели демонстрировали системные...
The Lab · 2026-04-06 11:57:18 · Habr
CUBA Platform, full-stack Java-фреймворк для корпоративной разработки, создает парадоксальную ситуацию для разработчиков. Он демонстрирует резкий контраст между скоростью на прототипах и хакатонах и серьезными проблемами при внедрении в реальные продакшн-проекты. Этот разрыв между обещанием быстрой разработки бизнес-пр...