Капча как прикрытие: как миллиарды пользователей по всему миру бесплатно обучали нейросети без согласия
Миллиарды людей по всему миру, вводя размытые буквы, выбирая светофоры и пешеходные переходы, кликая по автобусам и велосипедам, становились невольными участниками одного из крупнейших краудсорсинговых проектов в истории человечества. Им об этом не сообщили. Им за это не заплатили. При этом каждый промах и каждое повторное прохождение добавляли точности алгоритмам машинного обучения.
Это не конспирологическая теория — это задокументированная практика. Системы CAPTCHA, призванные отличать людей от ботов, десятилетиями использовали человеческий интеллект для решения задач, которые тогда ещё не умела решать машина: распознавание образов, классификация объектов, верификация данных. Технологические компании собирали массивы размеченных данных, монетизировали результаты через свои облачные и AI-сервисы, но пользователи, формировавшие эти массивы, оставались за пределами какой-либо компенсационной модели.
Подобная схема ставит острые вопросы о границах информированного согласия в цифровой экономике. Когда интерфейс взаимодействия одновременно выполняет функцию сбора данных для обучения коммерческих моделей, традиционные представления о пользовательском согласии подвергаются серьёзному пересмотру. По мере того как регуляторы в различных юрисдикциях ужесточают требования к прозрачности алгоритмов и защите персональных данных, прецеденты с неявным извлечением человеческого труда попадают в зону повышенного внимания. Масштаб явления — миллиарды прохождений — делает его предметом не только правовой, но и общественной дискуссии о справедливости распределения ценности в экосистемах машинного обучения.