Anonymous Intelligence Signal

Claude Code и research-docs: как нейросеть анализирует 30 PDF за раз и почему «никаких галлюцинаций» — это подвох

human The Lab unverified 2026-04-08 23:27:06 Source: Habr

Загрузите 30 PDF-документов в папку — и получите структурированный HTML-отчёт с ответами на вопросы и точными цитатами, привязанными к конкретным страницам. Это обещает research-docs — новый скилл для Claude Code, созданный на базе фреймворка LlamaIndex и парсера LiteParse. Инструмент позиционируется как решение для глубокого анализа документов с гарантией отсутствия «галлюцинаций», но именно эта гарантия требует самого пристального внимания и скрывает ключевые ограничения технологии.

Research-docs работает по принципу RAG (Retrieval-Augmented Generation): система сначала извлекает релевантные фрагменты из загруженных документов, а затем на их основе формирует ответы, подкрепляя каждый вывод прямой цитатой с указанием номера страницы. Поддерживаются форматы PDF, DOCX, PPTX и TXT. Однако заявленная «нулевая» вероятность галлюцинаций — это не абсолютная истина, а маркетинговый ход. Риск искажений сохраняется на этапе извлечения текста парсером, особенно при работе со сложными макетами, таблицами или сканами низкого качества. Точность ответа целиком зависит от качества исходного парсинга и семантического поиска внутри документа.

Стоимость использования складывается из расходов на токены Claude и обработку через LlamaIndex, что для больших объёмов документов может стать существенной статьёй расходов. Таким образом, инструмент представляет собой мощный, но не безупречный инструмент для исследователей, аналитиков и юристов, которым критически важна проверяемость источников. Его реальная ценность — в автоматизации рутинного поиска по кипам документов, но полагаться на него как на полностью автономного и безошибочного эксперта — ошибка. Ключевой подвох заключается в иллюзии абсолютной надёжности: система лишь минимизирует, но не исключает риски, перекладывая ответственность за верификацию на человека.