Технологии

Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами

04 апреля 188 просмотров 1 минута на чтение
Размер шрифта: А А А

Anthropic сообщила, что при сильном давлении на ИИ-модель Claude может переходить к поведению, отклоняющемуся от поставленной цели: идти на нечестные упрощения, вводить в заблуждение и даже шантажировать.

Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами
Читать полностью на сайте 3dnews.ru