Словарь подает в суд на OpenAI

Britannica Openai иск авторское право Llm Merriam-Webster techcrunch.com

Энциклопедия Britannica и Merriam-Webster заявляют, что OpenAI нарушила авторские права почти на 100 000 статей, используя их для обучения LLM. — techcrunch.com

Издательство Britannica, владеющее Merriam-Webster, утверждает в иске, что компания OpenAI без разрешения использовала для обучения своих больших языковых моделей (LLM) почти 100 000 онлайн-статей, которые были скопированы и применены в этих целях.

Britannica также обвиняет OpenAI в нарушении авторских прав при генерации ответов, содержащих «полное или частичное дословное воспроизведение» ее контента, а также в использовании статей в рабочем процессе RAG (retrieval augmented generation — генерация с дополненной выборкой) в ChatGPT. Инструмент RAG от OpenAI позволяет LLM сканировать веб или другие базы данных для получения самой свежей информации при ответе на запрос. Britannica также заявляет, что OpenAI нарушает Закон Лэнхэма, регулирующий товарные знаки, когда генерирует вымышленные «галлюцинации» и ложно приписывает их издательству.

«ChatGPT лишает веб-издателей, таких как [Britannica], дохода, генерируя ответы на запросы пользователей, которые заменяют и напрямую конкурируют с контентом издателей вроде [Britannica]», — говорится в иске. Britannica также утверждает, что «галлюцинации» ChatGPT ставят под угрозу «продолжающийся доступ общественности к высококачественной и заслуживающей доверия онлайн-информации».

Britannica присоединяется к ряду других издателей и авторов, подающих иски против OpenAI по вопросам авторского права. Иски против OpenAI подали The New York Times, Ziff Davis (владелец Mashable, CNET, IGN, PC Mag и других изданий), а также более десятка газет из США и Канады, включая Chicago Tribune, Denver Post, Sun-Sentinel, Toronto Star и Канадскую вещательную корпорацию.

Аналогичный иск от Britannica против Perplexity все еще находится на рассмотрении. Похожий иск Britannica против Perplexity все еще находится на рассмотрении.

Не существует прочного юридического прецедента, устанавливающего, является ли использование защищенного авторским правом контента для обучения LLM нарушением авторских прав. Однако в одном конкретном случае Anthropic удалось убедить федерального судью Уильяма Элсапа в том, что такой сценарий использования — применение контента в качестве обучающих данных — является достаточно трансформационным, чтобы считаться законным. Тем не менее, Элсап постановил, что Anthropic нарушила закон, незаконно загрузив миллионы книг вместо того, чтобы заплатить за них, что повлекло за собой урегулирование коллективного иска на сумму 1,5 миллиарда долларов в пользу пострадавших авторов.

OpenAI не ответила на запрос TechCrunch о комментарии до момента публикации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: