Построив бизнес на ремиксах чужого контента, Anthropic обеспокоена тем, что китайские лаборатории ИИ воруют её данные.
Американский разработчик моделей Claude в понедельник обвинил базирующиеся в Китае компании DeepSeek, Moonshot AI и MiniMax в проведении «кампаний в промышленных масштабах» по выкачиванию знаний из её моделей с помощью техники, известной как «дистилляция» (перегонка).
Дистилляция моделей — это метод глубокого обучения, при котором большая модель-«учитель» может передавать усвоенные паттерны меньшей модели-«ученику». Это форма сжатия данных, которая в идеале позволяет получить меньшую, более эффективную модель без существенной потери производительности. Полезная для объяснимого ИИ — проливающей свет на алгоритмы типа «чёрный ящик» — она также является удобным способом копирования модели.
Anthropic, как и её ведущие конкуренты, неоднократно подвергалась судебным искам по обвинению в нарушении авторских прав или несанкционированном веб-скрейпинге. Среди исков: Bartz против Anthropic; Carreyrou против Anthropic; Concord Music Group, Inc. против Anthropic; MacKinnon против Anthropic (Канада); и Reddit, Inc. против Anthropic.
Пока суды решают, нарушает ли обучение моделей ИИ на материалах, защищённых авторским правом, без согласия закон, Anthropic и её коллеги обеспокоены тем, что китайские компании их обворовывают.
По словам компании, DeepSeek, Moonshot AI и MiniMax использовали сети мошеннических аккаунтов для масштабного зондирования моделей Claude.
«Эти лаборатории сгенерировали более 16 миллионов взаимодействий с Claude через приблизительно 24 000 мошеннических аккаунтов, что является нарушением наших условий обслуживания и региональных ограничений доступа», — заявила компания в записи в блоге.
Эти атаки принимают форму слегка изменённых запросов, предназначенных для получения ответов, которые можно использовать для обучения моделей. Anthropic называет распределённую инфраструктуру, используемую для дистилляции моделей, «гидрой-кластерами», хотя ей не удалось доказать, что базовая технология достаточно отличается от коммерческих прокси-сервисов, чтобы оправдать зловещую многоголовую мифологическую отсылку.
Anthropic выразила обеспокоенность тем, что нежелательная дистилляция её моделей иностранными лабораториями ИИ позволит авторитарным режимам проводить кибератаки, кампании по дезинформации и массовую слежку.
Неясно, чем это будет отличаться от мира, в котором мы сейчас живём. Но в сфере ИИ предполагают, что ситуация станет ещё хуже, если разработчики дистиллированных моделей выложат свои работы в открытый доступ (open source).
«Если дистиллированные модели будут выложены в открытый доступ, этот риск возрастёт многократно, поскольку эти возможности будут свободно распространяться вне контроля какого-либо одного правительства», — заявила компания.
Две недели назад главный конкурент Anthropic, OpenAI, направила меморандум [PDF] в Специальный комитет Палаты представителей США по Китаю, предупредив, что противники в Китае и, в меньшей степени, в России активизировали усилия по рейдерскому захвату передовых моделей.
«Например, китайские субъекты перешли от извлечения “цепочки рассуждений” (Chain-of-Thought, CoT) к более сложным, многоэтапным конвейерам, которые сочетают генерацию синтетических данных, крупномасштабную очистку данных и оптимизацию предпочтений в стиле подкрепления», — заявила OpenAI. «Мы также видели, как китайские компании полагаются на сети неавторизованных реселлеров услуг OpenAI для обхода контроля нашей платформы».
OpenAI конкретно упомянула хищничество DeepSeek, предупредив, что её моделям «не хватает значимых защитных механизмов от опасных результатов в областях высокого риска, таких как химия и биология, или они предлагают ограниченную защиту для материалов, защищённых авторским правом».
(Отметим, что OpenAI является ответчиком по делу «In re: OpenAI, Inc. Copyright Infringement Litigation», объединяющему 16 исков о нарушении авторских прав.)
Меморандум OpenAI призывает США защитить национальную индустрию ИИ, и запись в блоге Anthropic следует этому примеру, утверждая, что иностранные разработчики моделей угрожают национальной безопасности.
«Незаконно дистиллированные модели не имеют необходимых мер предосторожности, что создаёт значительные риски для национальной безопасности», — заявила компания. «Anthropic и другие американские компании создают системы, которые не позволяют государственным и негосударственным субъектам использовать ИИ для, например, разработки биологического оружия или осуществления вредоносной кибердеятельности. Модели, созданные путём незаконной дистилляции, вряд ли сохранят эти меры предосторожности, а это означает, что опасные возможности могут распространяться с полным устранением многих защитных механизмов».
Согласно пятому волновому отчёту Института прогностических исследований (Forecasting Research Institute) с прогнозами Панели экспертов по долгосрочному ИИ (LEAP), опубликованному в понедельник, «Эксперты и суперпрогнозисты ожидают, что разрыв в производительности между моделями ИИ США и Китая сократится к 2031 году, а паритет ожидается к 2041 году».
DeepSeek, Moonshot и MiniMax не сразу ответили на запросы о комментариях. ®
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Thomas Claburn




