Технологии
Большие языковые модели и авторские права: как одна модель может изменить всё
Большие языковые модели, как и другие чат-боты, обучаются на данных, которые могут быть защищены авторским правом.
Разработчики утверждают, что действуют в рамках закона, но в случае одной конкретной модели все обстоит иначе.
Одним из источников данных для обучения является популярный каталог текстов под названием the Pile, который включает 886 гигабайт информации. В его состав входит подкаталог Books3 размером 140 гигабайт, содержащий 183 тысячи книг на английском языке, включая произведения таких авторов, как Стивен Кинг, Маргарет Этвуд и Джоан Роулинг. Это вызывает беспокойство у авторов и издателей, и некоторые компании начали подавать в суд.
Читать полностью
на сайте www.pravda.ru