В четверг Фонд Викимедиа объявил о заключении лицензионных соглашений с Microsoft, *Meta, Amazon, Perplexity и Mistral AI. Это расширяет усилия фонда по взиманию платы с крупных технологических компаний за использование контента Википедии для обучения моделей искусственного интеллекта, лежащих в основе таких ИИ-помощников, как Microsoft Copilot и ChatGPT от OpenAI.
Хотя ранее эти же компании извлекали данные из Википедии без разрешения, теперь большинство ведущих разработчиков ИИ присоединились к программе Wikimedia Enterprise — коммерческому подразделению фонда, которое предоставляет доступ по API к 65 миллионам статей Википедии с более высокой скоростью и объемом, чем это позволяют бесплатные публичные API. Финансовые условия сделок фонд не разглашает.
Новые партнеры присоединяются к Google, которая заключила соглашение с Wikimedia Enterprise в 2022 году, а также к таким небольшим компаниям, как Ecosia, Nomic, Pleias, ProRata и Reef Media. Выручка помогает компенсировать инфраструктурные расходы некоммерческой организации, которая в противном случае полагается на небольшие публичные пожертвования, наблюдая при этом, как ее контент становится основой для обучения моделей ИИ.
«Википедия является критически важным компонентом работы этих технологических компаний, и им необходимо понять, как финансово поддерживать ее», — заявила Лэйн Беккер, президент Wikimedia Enterprise, в интервью Reuters. «Нам потребовалось некоторое время, чтобы понять, какой набор функций и возможностей предложить, если мы собираемся перевести эти компании с нашей бесплатной платформы на коммерческую… но все наши партнеры из “Большой Технологии” действительно видят необходимость в их обязательствах по поддержке работы Википедии».
Стремление к платному лицензированию последовало за годами растущих инфраструктурных расходов, поскольку ИИ-компании в промышленных масштабах извлекали контент из Википедии. В апреле 2025 года фонд сообщил, что объем трафика, используемого для загрузки мультимедийного контента, вырос на 50 процентов с января 2024 года, причем боты составляли 65 процентов самых дорогих запросов к основной инфраструктуре, несмотря на то, что на их долю приходилось всего 35 процентов общего числа просмотров страниц.
К октябрю Фонд Викимедиа раскрыл, что трафик от людей, посещающих Википедию, снизился примерно на 8 процентов по сравнению с прошлым годом после того, как организация обновила свои системы обнаружения ботов и обнаружила, что многие из тех, кто выглядел как посетители-люди, на самом деле были автоматизированными парсерами, созданными для обхода обнаружения.
Снижение трафика угрожает циклу обратной связи, который поддерживал Википедию на протяжении четверти века: читатели заходят на сайт, некоторые становятся редакторами или донорами, и контент, казалось бы, улучшается. Но сегодня многие ИИ-чат-боты и поисковые системы отвечают на вопросы, используя контент Википедии, не направляя пользователей на сам сайт.
Тем временем собственные эксперименты фонда с генеративным ИИ столкнулись с сопротивлением со стороны волонтеров-редакторов, которые поддерживают сайт. В июне Википедия приостановила пилотную программу по созданию резюме статей с помощью ИИ после того, как редакторы назвали это «ужасной идеей» и предупредили, что это может подорвать доверие к платформе.
Основатель Википедии Джимми Уэйлс в беседе с The Associated Press заявил, что он приветствует обучение моделей ИИ на данных Википедии. «Я лично очень рад, что модели ИИ обучаются на данных Википедии, потому что они курируются людьми», — сказал Уэйлс. «Я бы не хотел использовать ИИ, который обучен только на X, знаете ли, например, очень злом ИИ». Но он провел черту в отношении бесплатного доступа: «Вы, вероятно, должны внести свой вклад и оплатить свою справедливую долю расходов, которые вы нам создаете».
*Facebook, *Instagram и *WhatsApp принадлежат компании Meta Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Benj Edwards




