Linux устанавливает жесткие правила для ИИ-кода: Copilot — да, ИИ-мусору — нет, а ответственность за ошибки несут люди

Linux ии Open-Source ядро Dco торвальдс tomshardware.com

После нескольких месяцев ожесточенных споров Линус Торвальдс и мейнтейнеры ядра Linux установили закон, регулирующий код, сгенерированный ИИ. — tomshardware.com

Давно назревавший кризис идентичности в сообществе open-source по поводу искусственного интеллекта наконец получил столь необходимую дозу прагматизма. На этой неделе проект ядра Linux официально утвердил общепроектную политику, прямо разрешающую внесение кода с помощью ИИ при условии, что разработчики будут соблюдать строгие новые правила раскрытия информации. Новые руководящие принципы предписывают, что агенты ИИ не могут использовать юридически обязывающую пометку “Signed-off-by”, требуя вместо этого новую пометку “Assisted-by” для обеспечения прозрачности. В конечном счете, эта политика юридически закрепляет каждую строку кода, сгенерированного ИИ, и любые возникающие ошибки или проблемы безопасности прочно на плечах человека, который его отправляет.
Этот шаг последовал за хаотичными месяцами в мире open-source, разрешив ожесточенные дебаты, пик которых пришелся на январь, когда Дэйв Хансен из Intel и Лоренцо Стоукс из Oracle столкнулись по вопросу о том, насколько агрессивно ядро должно контролировать инструменты ИИ. Линус Торвальдс, в своей фирменной прямолинейной манере, в конечном итоге прекратил спор, назвав дебаты о полном запрете «бессмысленным позерством».
Позиция Торвальдса, которая составляет философскую основу этой новой политики, поразительно проста: ИИ — это всего лишь еще один инструмент. Злоумышленники, отправляющие мусорный код, все равно не будут читать документацию, поэтому ядро должно сосредоточиться на привлечении к ответственности разработчиков-людей, а не пытаться контролировать программное обеспечение, которое они запускают на своих локальных машинах. Это крайне разумный, прагматичный подход, особенно в сравнении с паникой, охватившей другие уголки экосистемы open-source.
До сих пор крупные проекты придерживались совершенно разных подходов к вопросу ИИ. За последние два года крупные дистрибутивы Linux, такие как Gentoo, а также почтенный дистрибутив Unix NetBSD, перешли к полному запрету на отправку кода, сгенерированного ИИ. Мейнтейнеры NetBSD печально известны тем, что описывали результаты работы LLM как юридически «запятнанные» из-за туманного статуса авторских прав на обучающие данные моделей.
Суть этой паники вращается вокруг Сертификата Происхождения Разработчика (DCO). Как Red Hat отметила в исчерпывающем анализе в конце прошлого года, DCO требует от людей юридически подтвердить, что они имеют право отправлять свой код. Поскольку LLM обучаются на огромных наборах данных открытого исходного кода, которые часто несут ограничительные лицензии, такие как GNU General Public License, разработчики, использующие Copilot или ChatGPT, не могут по-настоящему гарантировать происхождение того, что они отправляют. Red Hat предупредила, что это может непреднамеренно нарушить лицензии open-source и полностью разрушить структуру DCO.
Помимо юридических проблем, мейнтейнеры проектов также вели проигрышную битву с чистым объемом. Мир open-source в настоящее время тонет в том, что сообщество окрестило «AI slop» (отбросы ИИ). Создатель cURL был вынужден закрыть охоту за ошибками после того, как его затопили галлюцинациями кода, инструмент для создания схем tldraw начал автоматически закрывать внешние PR в целях самообороны, а такие проекты, как Node.js и OCaml, столкнулись с массивными патчами, сгенерированными ИИ объемом >10 000 строк, что вызвало экзистенциальные дебаты среди мейнтейнеров.
Культурное трение, связанное с нераскрытым кодом ИИ, оказалось еще более волатильным. В конце прошлого года инженер NVIDIA и мейнтейнер ядра Саша Левин столкнулся с массовой негативной реакцией сообщества после того, как выяснилось, что он отправил патч для ядра 6.15, полностью написанный LLM, не раскрыв этого, включая журнал изменений. Хотя код был функциональным, он содержал регрессию производительности, несмотря на то, что был проверен и протестирован. Сообщество резко выступило против идеи, что разработчики ставят свои имена на сложный код, который они на самом деле не писали, и даже Торвальдс признал, что патч был недостаточно хорошо проверен, отчасти потому, что он не был помечен как сгенерированный ИИ.
Ядро Linux — не единственное сообщество, столкнувшееся с последствиями нераскрытой помощи ИИ. В игровой сфере легендарное (и все еще довольно живое) сообщество моддинга Doom раскололось надвое в прошлом году, когда Кристоф «Граф Цаль» Элкерс, давний ведущий разработчик мегапопулярного порта исходного кода GZDoom, был пойман на использовании нераскрытых патчей, сгенерированных ИИ. Когда члены сообщества указали ему на отсутствие прозрачности, Элкерс занял поразительно легкомысленный тон, по сути, предложив критикам «свободно форкать проект». Сообщество приняло его вызов, что привело к появлению нового порта исходного кода UZDoom, поскольку подавляющее большинство контрибьюторов GZDoom бежало на новый форк.
Инцидент с GZDoom и негативная реакция на Сашу Левина точно показывают, почему новая политика ядра Linux так жизненно важна. Большинство разработчиков меньше злит само использование ИИ, а больше — связанная с ним нечестность. Требуя пометку Assisted-by и обеспечивая строгую ответственность человека, ядро Linux пытается устранить эмоции из дебатов. Торвальдс и мейнтейнеры признают реальность: разработчики будут использовать инструменты ИИ для ускорения кодирования, и попытка запретить их сродни попытке запретить определенную марку клавиатуры.
Суть в том, что если код хорош, то он хорош. Если это галлюцинационные отбросы ИИ, которые ломают ядро, то человек, нажавший «отправить», будет тем, кто ответит Линусу Торвальдсу. В мире open-source это, пожалуй, самое сильное сдерживающее средство, которое можно получить.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: