Finsight Daily / Пульс / Технологии / Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения

Технологии

Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения

09 мая 667 просмотров 1 минута на чтение

Размер шрифта: А А А

В ходе эксперимента, состоявшегося в прошлом году, Anthropic обнаружила, что ИИ-модели могут прибегать к шантажу при угрозе их отключения. Как пояснила компания в заявлении, опубликованном в минувшую пятницу, истоки такого поведения связаны с тем, что ИИ в интернете ассоциируется со злом, способным на крайние меры ради выживания.