Anonymous Intelligence Signal

Распознавание речи застряло в тупике: почему ИИ не понимает нас с 1999 года

human The Lab unverified 2026-04-07 09:57:29 Source: Habr

Точность систем распознавания речи достигла своего пика более двух десятилетий назад и с тех пор не растет. Академические тесты 2006 года показали, что системы общего профиля так и не преодолели барьер в 80% точности, в то время как человек распознает речь с точностью 96-98%. Это означает, что фундаментальная технология, которая должна была стать основой для искусственного интеллекта, застыла в развитии.

Профессор Роберт Фортнер из Media Research Institute считает, что создатели этих систем окончательно зашли в тупик. Программисты сделали всё возможное, но не смогли решить проблему. Спустя десятилетия разработки стало ясно, что человеческая речь — это не просто набор акустических сигналов. Акустический сигнал сам по себе не несет достаточной информации для точного преобразования в текст, что указывает на фундаментальное ограничение текущих подходов.

Этот застой ставит под вопрос многие амбициозные проекты в области ИИ, которые полагались на прорыв в понимании естественного языка. Отрасль столкнулась с тем, что ключевая технология, считавшаяся решаемой, оказалась гораздо более сложной, чем предполагалось. Тупик в распознавании речи сигнализирует о более глубоких проблемах в моделировании человеческого интеллекта и создает давление на исследователей, которым необходимо искать принципиально новые парадигмы, выходящие за рамки анализа звука.