Технологии

Большие языковые модели и авторские права: как одна модель может изменить всё

14 июня 2025 г. 1007 просмотров 1 минута на чтение
Размер шрифта: А А А

Большие языковые модели, как и другие чат-боты, обучаются на данных, которые могут быть защищены авторским правом.
Разработчики утверждают, что действуют в рамках закона, но в случае одной конкретной модели все обстоит иначе.
Одним из источников данных для обучения является популярный каталог текстов под названием the Pile, который включает 886 гигабайт информации. В его состав входит подкаталог Books3 размером 140 гигабайт, содержащий 183 тысячи книг на английском языке, включая произведения таких авторов, как Стивен Кинг, Маргарет Этвуд и Джоан Роулинг. Это вызывает беспокойство у авторов и издателей, и некоторые компании начали подавать в суд.

Большие языковые модели и авторские права: как одна модель может изменить всё
Читать полностью на сайте www.pravda.ru