Она принимала участие в эксперименте под названием #WearthePants, в рамках которого женщины проверили гипотезу о том, что новый алгоритм LinkedIn предвзят по отношению к женщинам.
В течение нескольких месяцев некоторые активные пользователи LinkedIn жаловались на падение вовлеченности и охвата публикаций в профессиональной социальной сети. Это произошло после того, как вице-президент компании по инжинирингу Тим Юрка в августе заявил, что платформа «недавно» внедрила большие языковые модели (LLM) для улучшения отображения полезного для пользователей контента.
Мишель (чьё имя известно TechCrunch) заподозрила неладное из-за изменений, поскольку у неё более 10 000 подписчиков, и она пишет посты для своего мужа, у которого всего около 2 000. Тем не менее, она и её муж получают примерно одинаковое количество показов публикаций, несмотря на её большую аудиторию.
«Единственной существенной переменной был пол», — сказала она.
Марилин Джойнер, основательница компании, также изменила пол в своём профиле. Она регулярно публикуется в LinkedIn в течение двух лет и заметила за последние несколько месяцев снижение видимости своих постов. «Я сменила пол в своем профиле с женского на мужской, и мои показы подскочили на 238% в течение дня», — рассказала она TechCrunch.
Меган Корниш сообщила о схожих результатах, как и Рози Тейлор, Джессика Дойл Меккес, Эбби Найдам, Фелисити Мензес, Люси Фергюсон и другие.
LinkedIn заявил, что его «алгоритм и системы искусственного интеллекта не используют демографическую информацию, такую как возраст, раса или пол, в качестве сигнала для определения видимости контента, профиля или публикаций в ленте» и что «сравнение ваших собственных обновлений ленты, которые не являются идеально репрезентативными или равными по охвату, не означает автоматически несправедливое отношение или предвзятость» в ленте.
Эксперты по социальным алгоритмам сходятся во мнении, что явный сексизм мог и не быть причиной, хотя неявная предвзятость может присутствовать.
Платформы — это «сложный симфонический оркестр алгоритмов, которые одновременно и постоянно управляют специфическими математическими и социальными рычагами», — сказала TechCrunch Брандис Маршалл, консультант по этике данных.
«Изменение фотографии профиля и имени — это лишь один из таких рычагов», — отметила она, добавив, что на алгоритм также влияет, например, то, как пользователь взаимодействовал и продолжает взаимодействовать с другим контентом.
«Мы не знаем обо всех других рычагах, которые заставляют этот алгоритм отдавать приоритет контенту одного человека над другим. Это более сложная проблема, чем люди предполагают», — добавила Маршалл.
“Мужской” код
Эксперимент #WearthePants начался с двух предпринимательниц — Синди Гэллоп и Джейн Эванс.
Они попросили двух мужчин создать и опубликовать тот же контент, что и они, из любопытства, является ли пол причиной того, что так много женщин ощущают падение вовлеченности. Гэллоп и Эванс обе имеют значительную аудиторию — более 150 000 подписчиков в сумме, по сравнению с 9 400 у двух мужчин на тот момент.
Гэллоп сообщила, что её пост охватил всего 801 человека, тогда как мужчина, опубликовавший тот же самый контент, охватил 10 408 человек, что более чем на 100% превышает количество его подписчиков. Затем к эксперименту присоединились другие женщины. Некоторые, как Джойнер, которая использует LinkedIn для продвижения своего бизнеса, стали обеспокоены.
«Я очень хотела бы, чтобы LinkedIn взял на себя ответственность за любую предвзятость, которая может существовать в его алгоритме», — сказала Джойнер.
Однако LinkedIn, как и другие платформы поиска и социальных сетей, зависящие от LLM, предоставляет мало деталей о том, как были обучены модели выбора контента.
Маршалл отметила, что большинство этих платформ «по своей сути имеют встроенную точку зрения белого, мужского, западного мира» из-за того, кто обучал модели. Исследователи находят свидетельства человеческих предубеждений, таких как сексизм и расизм, в популярных моделях LLM, поскольку модели обучаются на контенте, созданном людьми, а люди часто непосредственно участвуют в пост-тренировке или обучении с подкреплением.
Тем не менее, то, как каждая отдельная компания внедряет свои системы ИИ, окутано тайной «чёрного ящика» алгоритма.
LinkedIn утверждает, что эксперимент #WearthePants не мог продемонстрировать гендерную предвзятость против женщин. В августовском заявлении Юрки, а также в другом посте в ноябре, повторенном главой отдела ответственного ИИ и управления LinkedIn Сакши Джейн , говорится, что его системы не используют демографическую информацию в качестве сигнала для определения видимости.
Вместо этого LinkedIn сообщил TechCrunch, что он тестирует миллионы публикаций, чтобы связать пользователей с возможностями. Компания заявила, что демографические данные используются только для таких тестов, например, чтобы увидеть, «конкурируют ли публикации от разных авторов на равных условиях и соответствует ли опыт прокрутки, то, что вы видите в ленте, для всех аудиторий», — сообщила компания TechCrunch.
LinkedIn известен тем, что исследует и корректирует свой алгоритм , чтобы попытаться обеспечить менее предвзятый опыт для пользователей.
Именно неизвестные переменные, по словам Маршалл, вероятно, объясняют, почему некоторые женщины увидели увеличение показов после смены пола в профиле на мужской. Участие в вирусном тренде, например, может привести к росту вовлеченности; некоторые аккаунты публиковались впервые за долгое время, и алгоритм мог вознаградить их за это.
Тон и стиль письма также могут играть роль. Мишель, например, сказала, что за неделю, когда она публиковалась как «Майкл», она немного скорректировала свой тон, написав в более простом, прямом стиле, как она делает для своего мужа. Именно тогда, по её словам, показы подскочили на 200%, а вовлеченность выросла на 27%.
Она пришла к выводу, что система не была «явно сексистской», но, казалось, считала стили общения, часто ассоциируемые с женщинами, «прокси-переменной для более низкой ценности».
Считается, что стереотипные мужские стили письма более лаконичны, в то время как стереотипы стиля письма для женщин представляются более мягкими и эмоциональными. Если LLM обучена продвигать тексты, соответствующие мужским стереотипам, это является тонкой, неявной предвзятостью. И, как мы ранее сообщали, исследователи определили, что большинство LLM изобилуют такими предубеждениями.
Сара Дин, доцент кафедры компьютерных наук в Корнелле, заявила, что платформы, такие как LinkedIn, часто используют полные профили, помимо поведения пользователя, при определении контента для продвижения. Это включает в себя должности в профиле пользователя и тип контента, с которым он обычно взаимодействует.
«Демографические данные человека могут влиять на «обе стороны» алгоритма — что он видит и кто видит то, что он публикует», — сказала Дин.
LinkedIn сообщил TechCrunch, что его системы ИИ анализируют сотни сигналов для определения того, что показывается пользователю, включая информацию из профиля человека, его сети контактов и активности.
«Мы проводим постоянные тесты, чтобы понять, что помогает людям находить наиболее актуальный и своевременный контент для их карьеры», — сказал представитель. «Поведение пользователей также формирует ленту: то, на что люди нажимают, сохраняют и с чем взаимодействуют, меняется ежедневно, равно как и форматы, которые им нравятся или не нравятся. Такое поведение также естественным образом формирует то, что появляется в лентах наряду с любыми нашими обновлениями».
Чад Джонсон, эксперт по продажам, активный в LinkedIn, описал изменения как снижение приоритета лайков, комментариев и репостов. Система LLM «больше не заботится о том, как часто вы публикуете или в какое время суток», — написал Джонсон в посте. «Её волнует, демонстрирует ли ваш текст понимание, ясность и ценность».
Всё это затрудняет определение истинной причины любых результатов эксперимента #WearthePants.
Людям просто не нравится алгоритм
Тем не менее, кажется, что многим людям, независимо от пола, не нравится или они не понимают новый алгоритм LinkedIn — каким бы он ни был.
Шейлви Вахулу, специалист по данным, рассказала TechCrunch, что она публикует в среднем не менее одного поста в день в течение пяти лет и раньше видела тысячи показов. Теперь она и её муж с трудом набирают несколько сотен. «Это демотивирует создателей контента с большой лояльной аудиторией», — сказала она.
Один мужчина сообщил TechCrunch, что за последние несколько месяцев его вовлеченность упала примерно на 50%. Тем не менее, другой мужчина сказал, что за аналогичный период показы и охват его постов увеличились более чем на 100%. «Это в значительной степени связано с тем, что я пишу на конкретные темы для конкретной аудитории, что и вознаграждается новым алгоритмом», — сказал он TechCrunch, добавив, что его клиенты видят аналогичное увеличение.
Но по опыту Маршалл, которая является чернокожей, она считает, что посты о её личном опыте работают хуже, чем посты, связанные с её расой. «Если чернокожие женщины получают отклик только тогда, когда говорят о чернокожих женщинах, но не когда говорят о своём конкретном опыте, то это предвзятость», — сказала она.
Исследователь Дин считает, что алгоритм может просто усиливать «любые сигналы, которые уже существуют». Он может вознаграждать определённые посты не из-за демографии автора, а потому, что на платформе исторически было больше откликов на них. Хотя Маршалл могла наткнуться на другую область неявной предвзятости, её анекдотических свидетельств недостаточно, чтобы утверждать это с уверенностью.
LinkedIn предоставил некоторые сведения о том, что сейчас работает хорошо. Компания заявила, что пользовательская база выросла, и в результате количество публикаций увеличилось на 15% год к году, а комментариев — на 24% год к году. «Это означает большую конкуренцию в ленте», — заявила компания. Посты о профессиональных инсайтах и уроках карьеры, отраслевых новостях и аналитике, а также образовательный или информационный контент по вопросам работы, бизнеса и экономики — всё это показывает хорошие результаты, говорится в сообщении.
Если что-то и можно сказать наверняка, так это то, что люди просто сбиты с толку. «Я хочу прозрачности», — сказала Мишель.
Однако, поскольку алгоритмы выбора контента всегда были строго охраняемыми секретами компаний, а прозрачность может привести к их «взлому», это большая просьба. И маловероятно, что она когда-либо будет удовлетворена.
Автор – Dominic-Madori Davis




