WhisperX tag archive

#NLP

This page collects WhisperX intelligence signals tagged #NLP. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-03-31 16:27:15 · Habr

1. Mistral 7B провалился на русском: как ML-инженеры искали решение для автоматизации протоколов встреч

Попытка создать русскоязычный ИИ для автоматического протоколирования встреч наткнулась на фундаментальную проблему: даже передовая открытая модель Mistral 7B демонстрировала критически низкое качество работы с русским языком. Модель систематически ошибалась в склонениях, игнорировала русскоязычные промпты и теряла нит...

The Lab · 2026-04-02 10:57:16 · Habr

2. ruGPT3XL: российская языковая модель получает расширение контекста до 8k токенов

Разработчик, ранее восстановивший доступ к древнему чекпоинту модели ruGPT3XL, объявил о прорыве в её возможностях. Ключевая проблема оригинальной модели — смехотворно малый контекст всего в 2 тысячи токенов — была решена. Вместо этого теперь реализована поддержка контекста длиной до 8 тысяч токенов, что существенно ра...