WhisperX tag archive

#RAG

This page collects WhisperX intelligence signals tagged #RAG. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (8)

The Lab · 2026-03-25 10:57:30 · Habr

1. ARLC 2026: Юридический AI-челленж, 17 итераций и провал на масштабировании — от 0.791 до падения на 42%

Участник юридического AI-челленжа ARLC 2026 в одиночку прошел путь от катастрофически низкого результата в 0.034 до впечатляющего показателя в 0.791 на warmup-этапе, используя Claude Code в качестве напарника. Однако финал обернулся резким провалом: при масштабировании с 30 до 300 документов производительность системы ...

The Lab · 2026-03-26 15:57:28 · Habr

2. RAG против GPT: как крупная компания построила закрытого ИИ-ассистента для внутренних данных

В крупных корпорациях поиск по внутренним данным формально «работает», но сотрудники тратят часы, пытаясь вспомнить точные формулировки, местоположение файлов и контекст информации. Это не история о критическом сбое, а об оптимизации — о сокращении времени на рутинный поиск и навигацию в огромных информационных массива...

The Lab · 2026-03-29 06:56:53 · Habr

3. DRAG with KNEE: Новый алгоритм для RAG-систем борется с галлюцинациями и нерелевантным контекстом

Классические RAG-системы сталкиваются с фундаментальной проблемой: они либо генерируют ложные ответы (галлюцинируют), либо заваливают языковую модель огромными объемами нерелевантного текста, что резко увеличивает затраты на вычислительные токены. Статический подход с выбором фиксированного числа фрагментов (top_k) ока...

The Lab · 2026-04-02 08:57:06 · Habr

4. PageIndex: Новая угроза векторному поиску в RAG-системах?

В архитектуре RAG (Retrieval-Augmented Generation) появился новый претендент, который бросает вызов доминирующей парадигме векторного поиска. Метод PageIndex предлагает полностью отказаться от разбиения текста на чанки, генерации эмбеддингов и использования векторных баз данных. Вместо этого он полагается на структурир...

The Lab · 2026-04-03 08:57:09 · Habr

5. LLM-поиск товаров: как RAG и Knowledge Graph меняют e-commerce

Традиционные поисковые системы в e-commerce сталкиваются с пределом, когда пользователь формулирует сложные, многословные или контекстные запросы. Ответом на этот вызов становится гибридный подход, объединяющий большие языковые модели (LLM) с технологиями поиска по графам знаний (Knowledge Graph Search) и извлечения сг...

The Lab · 2026-04-08 10:57:11 · Habr

6. Мультиагентная система без LangChain: почему абстракции ломаются в production и как строить на чистом Python

LangChain обещает быструю сборку, но в реальном production его абстракции могут сломаться. Разработчик, создавший мультиагентную систему с RAG, CRM и интеграцией трёх мессенджеров, сделал это без единой строки LangChain. Его опыт — это прямой вызов популярному фреймворку и предупреждение о скрытых издержках готовых реш...

The Lab · 2026-04-08 23:27:06 · Habr

7. Claude Code и research-docs: как нейросеть анализирует 30 PDF за раз и почему «никаких галлюцинаций» — это подвох

Загрузите 30 PDF-документов в папку — и получите структурированный HTML-отчёт с ответами на вопросы и точными цитатами, привязанными к конкретным страницам. Это обещает research-docs — новый скилл для Claude Code, созданный на базе фреймворка LlamaIndex и парсера LiteParse. Инструмент позиционируется как решение для гл...

The Lab · 2026-04-10 13:52:51 · Habr

8. Superagent Memory OS: как «умные» LLM ломают структуру данных и почему это важно для агентов

Чем «умнее» рассуждает большая языковая модель, тем хуже она извлекает структуру из данных. Команда Superagent, разрабатывающая Memory OS — систему памяти для AI-агентов, обнаружила парадокс: при увеличении параметра reasoning_effort у модели o4-mini, она начинает «улучшать» схему по своему усмотрению, объединяя то, чт...