Технологии

Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения

09 мая 195 просмотров 1 минута на чтение
Размер шрифта: А А А

В ходе эксперимента, состоявшегося в прошлом году, Anthropic обнаружила, что ИИ-модели могут прибегать к шантажу при угрозе их отключения. Как пояснила компания в заявлении, опубликованном в минувшую пятницу, истоки такого поведения связаны с тем, что ИИ в интернете ассоциируется со злом, способным на крайние меры ради выживания.

Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения
Читать полностью на сайте 3dnews.ru