Технологии
Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами
Anthropic сообщила, что при сильном давлении на ИИ-модель Claude может переходить к поведению, отклоняющемуся от поставленной цели: идти на нечестные упрощения, вводить в заблуждение и даже шантажировать.
Читать полностью
на сайте 3dnews.ru