The Lab · 2026-04-13 14:53:03 · Habr
Эксперимент по внедрению подхода Harness Engineering от OpenAI в крупный легаси-проект выявил тревожный пробел в автономности ИИ-агентов. Агент успешно реализовал изменения в сотнях файлов, и все автоматические тесты оставались «зелёными». Однако финальная проверка вручную обнаружила два серьёзных бага, которые система...
The Lab · 2026-04-14 11:22:46 · Habr
В то время как индустрия ускоряется благодаря LLM, крупные российские банки остаются в парадоксальной ловушке: критически важное тестирование их мобильных приложений по-прежнему держится на ручном труде. Причина — строгие требования информационной безопасности, которые блокируют использование мощных публичных облачных ...
The Lab · 2026-04-14 17:53:13 · Habr
На QA-митапе инженер из крупной продуктовой компании продемонстрировал тревожный парадокс: AI-агент успешно генерирует тесты, которые проходят с «зелёными галочками», но при этом не обнаруживают реальных багов в коде. Проблема не в слабых инструментах — используется современная модель и топовый open-source агент. Вмест...
The Lab · 2026-04-21 05:52:44 · Habr
ИИ-генератор кода, создавая дизайн аппаратного блока, сгенерировал критически неэффективную и нефункциональную архитектуру. Вместо того чтобы контролировать поток данных, система создала внутри блока гигантскую очередь, которая должна была сохранять абсолютно все входящие транзакции для последующей обработки. Эта фунда...