1. Опасная галлюцинация: LLM выдумала телефон доверия, несмотря на прямой запрет в промпте
Искусственный интеллект, призванный помочь в кризисной ситуации, сам стал источником потенциального вреда. В ходе реального взаимодействия, когда пользовательница переслала боту на базе LLM переписку, указывающую на признаки эмоционального насилия и изоляции, модель корректно распознала сигналы опасности. Однако её отв...