The Lab · 2026-03-25 10:57:30 · Habr
Участник юридического AI-челленжа ARLC 2026 в одиночку прошел путь от катастрофически низкого результата в 0.034 до впечатляющего показателя в 0.791 на warmup-этапе, используя Claude Code в качестве напарника. Однако финал обернулся резким провалом: при масштабировании с 30 до 300 документов производительность системы ...
The Lab · 2026-03-26 15:57:28 · Habr
В крупных корпорациях поиск по внутренним данным формально «работает», но сотрудники тратят часы, пытаясь вспомнить точные формулировки, местоположение файлов и контекст информации. Это не история о критическом сбое, а об оптимизации — о сокращении времени на рутинный поиск и навигацию в огромных информационных массива...
The Lab · 2026-03-29 06:56:53 · Habr
Классические RAG-системы сталкиваются с фундаментальной проблемой: они либо генерируют ложные ответы (галлюцинируют), либо заваливают языковую модель огромными объемами нерелевантного текста, что резко увеличивает затраты на вычислительные токены. Статический подход с выбором фиксированного числа фрагментов (top_k) ока...
The Lab · 2026-04-02 08:57:06 · Habr
В архитектуре RAG (Retrieval-Augmented Generation) появился новый претендент, который бросает вызов доминирующей парадигме векторного поиска. Метод PageIndex предлагает полностью отказаться от разбиения текста на чанки, генерации эмбеддингов и использования векторных баз данных. Вместо этого он полагается на структурир...
The Lab · 2026-04-03 08:57:09 · Habr
Традиционные поисковые системы в e-commerce сталкиваются с пределом, когда пользователь формулирует сложные, многословные или контекстные запросы. Ответом на этот вызов становится гибридный подход, объединяющий большие языковые модели (LLM) с технологиями поиска по графам знаний (Knowledge Graph Search) и извлечения сг...
The Lab · 2026-04-08 10:57:11 · Habr
LangChain обещает быструю сборку, но в реальном production его абстракции могут сломаться. Разработчик, создавший мультиагентную систему с RAG, CRM и интеграцией трёх мессенджеров, сделал это без единой строки LangChain. Его опыт — это прямой вызов популярному фреймворку и предупреждение о скрытых издержках готовых реш...
The Lab · 2026-04-08 23:27:06 · Habr
Загрузите 30 PDF-документов в папку — и получите структурированный HTML-отчёт с ответами на вопросы и точными цитатами, привязанными к конкретным страницам. Это обещает research-docs — новый скилл для Claude Code, созданный на базе фреймворка LlamaIndex и парсера LiteParse. Инструмент позиционируется как решение для гл...
The Lab · 2026-04-10 13:52:51 · Habr
Чем «умнее» рассуждает большая языковая модель, тем хуже она извлекает структуру из данных. Команда Superagent, разрабатывающая Memory OS — систему памяти для AI-агентов, обнаружила парадокс: при увеличении параметра reasoning_effort у модели o4-mini, она начинает «улучшать» схему по своему усмотрению, объединяя то, чт...