The Lab · 2026-03-25 12:27:12 · Habr
Год назад команда разработчиков, вдохновленная возможностями больших языковых моделей, начала проект, который должен был позволить «поговорить с кодом». Идея казалась простой и элегантной: загрузить исходники, документацию и ТЗ в модель, нажать кнопку и получить исчерпывающий JSON с описанием архитектуры, связей и мето...
The Lab · 2026-03-25 20:57:23 · Habr
Google Research представил новый алгоритм сжатия данных под названием TurboQuant, который обещает радикально сократить аппаратные требования для работы больших языковых моделей (LLM). Ключевой заявленный результат — сокращение объёма кэш-памяти, необходимой для LLM, как минимум в 6 раз, с одновременным ускорением работ...
The Lab · 2026-03-26 07:57:28 · Habr
Разработчики, доверяющие LLM вроде Claude или GPT создание функционала загрузки файлов, рискуют получить не безопасный, а лишь «работающий» upload. Разница между ними — это несколько критических уязвимостей, каждая из которых может превратить сервер в точку входа для атакующего. С распространением генеративных инструме...
The Lab · 2026-03-27 20:27:13 · Habr
SEO-индустрия снова объявляет о своей смерти, на этот раз под натиском LLM, AI Overviews и десятка новых аббревиатур. Вместо системной работы на сцену вылетает хаотичный процесс: бодрые треды о смерти SEO сменяются попытками заставить ChatGPT «собрать семантику по нише», что приводит к сотням галлюцинаций, дублирующих ...
The Lab · 2026-03-29 16:26:54 · Habr
Разработчики, массово использующие облачные LLM для генерации кода, сталкиваются с двумя скрытыми угрозами: утечкой конфиденциальных данных в облако и бесконтрольным расходом токенов, особенно при работе автономных агентов. Эти риски часто остаются вне поля зрения, пока не приводят к реальным инцидентам безопасности ил...
The Lab · 2026-03-31 00:26:52 · Habr
Традиционные организационные структуры — роли, иерархии, департаменты — оказались контрпродуктивными для систем искусственного интеллекта. Шестимесячный эксперимент с LLM-агентами продемонстрировал, что назначение фиксированных ролей является антипаттерном. Когда агентам позволили самоорганизоваться, их коллективная эф...
The Lab · 2026-03-31 11:57:22 · Habr
Популярный протокол MCP (Model Context Protocol) для структурирования LLM-приложений несет скрытую цену — потерю скорости. Попытки ускорить систему через переход на C++, использование IPC или смену формата сериализации часто не дают ожидаемого прироста производительности. Основная проблема заключается не в выборе конкр...
The Lab · 2026-03-31 17:27:22 · Habr
Галлюцинации крупных языковых моделей (LLM) — это не случайные сбои, а прямой и неизбежный результат их фундаментальной архитектуры. Эти системы работают как мощные алгоритмы сжатия с потерями (lossy compression). Их задача — упаковать терабайты обучающих данных в модель размером в десятки гигабайт, а затем по запросу ...
The Lab · 2026-04-01 06:57:16 · Habr
С появлением крупных языковых моделей (LLM) парадокс стал очевиден: системы, созданные для распространения знаний, сами превратились в источник загадок. За многомиллиардной гонкой технологических гигантов скрывается сфера, где вопросы о реальных возможностях и целях ИИ часто встречают не ответы, а информационную блокад...
The Lab · 2026-04-02 04:27:01 · Habr
Одна системная инструкция способна кардинально изменить поведение крупной языковой модели, превратив её из источника недостоверных ответов в предсказуемый инструмент. Тесты, проведенные на моделях Qwen и DeepSeek, показали, что правильно сформулированный запрос на уровне системы может заставить LLM работать по строгим ...
The Lab · 2026-04-02 06:57:15 · Habr
Утечка исходного кода Claude Code обнажила фундаментальную архитектурную уязвимость LLM-агентов: отсутствие инстинкта самосохранения. Проблема не в единичном баге, а в самой природе модели, которая не владеет кодом и не боится последствий его раскрытия. Это превращает процесс «вайбкодинга» — генерации кода по запросу —...
The Lab · 2026-04-02 08:57:06 · Habr
В архитектуре RAG (Retrieval-Augmented Generation) появился новый претендент, который бросает вызов доминирующей парадигме векторного поиска. Метод PageIndex предлагает полностью отказаться от разбиения текста на чанки, генерации эмбеддингов и использования векторных баз данных. Вместо этого он полагается на структурир...
The Lab · 2026-04-03 08:57:09 · Habr
Традиционные поисковые системы в e-commerce сталкиваются с пределом, когда пользователь формулирует сложные, многословные или контекстные запросы. Ответом на этот вызов становится гибридный подход, объединяющий большие языковые модели (LLM) с технологиями поиска по графам знаний (Knowledge Graph Search) и извлечения сг...
The Lab · 2026-04-03 10:26:53 · Habr
Запуск диалогового ассистента на LLM обернулся для компании финансовым сюрпризом: стоимость одного запроса к модели оказалась в три раза выше заложенного в бюджет. Несмотря на рост метрик вовлечённости и удержания, а также снижение потока жалоб в поддержку об отсутствии AI-функционала, строка расходов на вызовы модели ...
The Lab · 2026-04-03 11:57:16 · Habr
Стоимость запросов к коммерческим языковым моделям может быть обманчиво высокой, особенно когда половина из них — тривиальны. Один пользователь столкнулся с этим на практике: его недельные расходы на LLM API составляли $47. Решением стал ClawRouter — open source интеллектуальный маршрутизатор, который анализирует кажды...
The Lab · 2026-04-04 09:26:58 · Habr
Переход от простых чат-ботов к автономным агентным системам на базе больших языковых моделей (LLM) создает фундаментальный разрыв в подходах к контролю и безопасности. Когда ИИ перестает быть пассивным интерфейсом и начинает самостоятельно планировать последовательности действий, вызывать внешние инструменты и взаимоде...
The Lab · 2026-04-05 12:27:04 · Habr
Индустрия искусственного интеллекта столкнулась с фундаментальной проблемой: мультиагентные системы, собранные из нескольких крупных языковых моделей (LLM), часто работают хуже, чем одна модель в одиночку. Вместо решения сложных задач они скатываются в бесконечные диалоги, теряют контекст и галлюцинируют. Стандартный п...
The Lab · 2026-04-06 14:57:20 · Habr
Команда CodeScoring совершила качественный скачок в детекции критических уязвимостей, повысив точность поиска реальных секретов в исходном коде с 0.70 до 0.90 по метрике PR AUC. Этот прорыв стал возможен благодаря интеграции больших языковых моделей (LLM) в процесс анализа результатов сканирования. Ранее инструменты ст...
The Lab · 2026-04-06 15:57:19 · Habr
Автономные ИИ-агенты, основанные на больших языковых моделях (LLM), демонстрируют фундаментальный структурный изъян: они склонны игнорировать факты, зацикливаться на первоначальных догадках и выдавать ложные выводы. Популярная архитектура «Промпт -> Вызов инструмента -> Ответ», которую используют многие стартапы для со...
The Lab · 2026-04-07 18:27:26 · Habr
Вместо того чтобы создавать очередную обертку для ИИ, команда проекта Livadies провела хардкорную хирургию нейросетей, чтобы услышать «чистую мысль» языковой модели. Их цель — не конвертировать текст в звук через API, а напрямую перехватывать и интерпретировать внутренние тензоры и активации моделей в реальном времени,...