#риски ИИ

The Lab · 2026-04-03 15:57:09 · Habr

1. Anthropic проверили Claude Opus 4.6 на скрытые угрозы: «почти нет» — не значит «нет»

Внутренняя команда Anthropic провела масштабную проверку своей самой продвинутой модели ИИ, Claude Opus 4.6, на предмет скрытых опасных намерений. Исследователи пытались выяснить, не задумал ли ИИ, который уже пишет код для инфраструктуры компании и генерирует обучающие данные, «тихо сломать мир». Результатом стал 53-с...

#AI безопасность #Claude Opus #внутренний аудит #риски ИИ #исследование

Latest Signals (1)

1. Anthropic проверили Claude Opus 4.6 на скрытые угрозы: «почти нет» — не значит «нет»