На OpenAI снова подали в суд за парсинг новостей

Новостные издания The Intercept, Raw Story, AlterNet требуют возмещения убытков и удаления своего контента из языковых моделей OpenAI.

Три цифровых издательства подали в суд на компанию OpenAI, утверждая, что она украла их статьи, защищенные авторским правом, для обучения ChatGPT, в двух отдельных исках, поданных в среду.

ChatGPT обучался на огромных массивах текстов, взятых из интернета, включая множество журналистских материалов. Однако издатели новостей недовольны тем, что OpenAI использовала их статьи для обучения своих моделей без разрешения или компенсации. New York Times уже подала иск против OpenAI по этому поводу.

The Intercept, Raw Story и AlterNet — последние медиа, подавшие в суд на OpenAI за нарушение авторских прав. The Intercept подал один иск, а поскольку Raw Story и AlterNet принадлежат одной и той же компании, она подала второй. Оба дела ведет одна и та же юридическая фирма, Loevy & Loevy.

The Intercept также обратился в суд против Microsoft, которая поддерживает OpenAI и использует её технологии.

Оба иска обвиняют ответчиков в нарушении авторских прав и Закона об авторском праве в цифровую эпоху, который запрещает удалять имена авторов и названия их работ, чтобы скрыть кражу интеллектуальной собственности.

Когда они наполняли свои обучающие наборы журналистскими произведениями, у ответчиков был выбор: они могли обучать ChatGPT, используя журналистские произведения с сохранением информации об авторских правах, защищенных DMCA, или они могли убрать её.

Ответчики выбрали последнее и в процессе обучили ChatGPT не признавать и не уважать авторские права, не уведомлять пользователей ChatGPT о том, что полученные ими ответы защищены авторскими правами журналистов, и не указывать авторство при использовании работ журналистов.
из судебных документов по делу, возбужденному Raw Story и AltNet

Аналогичные заявления о нарушении DMCA, поданные авторами в предыдущем иске против OpenAI, не увенчались успехом.

Исходя из описанной выше общедоступной информации, тысячи работ истцов, защищенных авторским правом, были включены в обучающие наборы ответчиков без указания автора, названия и авторских прав, которые истцы указали при их публикации.
говорится в судебных документах, подготовленных юридической группой The Intercept

Оба истца требуют возмещения ущерба и судебного запрета, обязывающего разработчиков ИИ-чатботов удалить все копии их работ, защищенных авторским правом.

Адвокаты, представляющие The Intercept, Raw Story и AlterNet, заявили, что неясно, какой текст OpenAI и Microsoft используют для обучения своих моделей, но указали на три набора данных — WebText, WebText2 и Common Crawl, — которые, по их мнению, включают контент истцов.

Юристы считают, что контент всех трех издательств был получен путем парсинга новостей, и утверждают, что ChatGPT генерирует контент, имитирующий «значительное количество» защищенных авторским правом журналистских материалов.

На OpenAI снова подали в суд за парсинг новостей

Related Posts

Парсинг LinkedIn не может быть заблокирован — решение суда США

Meta* признает свое поражение и отказывается от иска в борьбе с Bright Data, занимающейся парсингом данных

Юридические баталии вокруг данных для искусственного интеллекта

Reddit и Google объявили о партнерстве в области искусственного интеллекта для ускорения обучения моделей

Write A Comment Cancel Reply