Finsight Daily / Пульс / Технологии / OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы

Технологии

OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы

18 июня 2025 г. 429 просмотров 1 минута на чтение

Размер шрифта: А А А

Исследователи из OpenAI заявили, что обнаружили внутри ИИ-моделей скрытые механизмы, соответствующие нежелательным шаблонам поведения, приводящим к небезопасным ответам. Об этом стало известно из новой научной работы, опубликованной компанией. В ходе исследования были выявлены закономерности, которые активировались, когда модель начинала вести себя непредсказуемо.

OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы

Читать полностью на сайте 3dnews.ru

OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы

Сейчас на Finsight TV

Шатдаун как зеркало власти: когда политика США становится игрой на выживание

Робот Charlotte строит будущее: дома без цемента, отходов и людей

Туннель в будущее: почему Нобелевская премия 2025 по физике — это больше, чем просто наука

Ледяной капкан: альтернативный Севморпуть обернулся кошмаром для судоходства

OpenAI вскрыла тёмные личности в ИИ, отвечающие за ложь, сарказм и токсичные ответы

Сейчас на Finsight TV

Шатдаун как зеркало власти: когда политика США становится игрой на выживание

Робот Charlotte строит будущее: дома без цемента, отходов и людей

Туннель в будущее: почему Нобелевская премия 2025 по физике — это больше, чем просто наука

Ледяной капкан: альтернативный Севморпуть обернулся кошмаром для судоходства

Популярно на Finsight Daily: