Когда Зевс, студент-медик из города на холме в центральной Нигерии, возвращается в свою студию после долгого дня в больнице, он включает кольцевую лампу, прикрепляет свой iPhone ко лбу и начинает снимать себя. Он медленно поднимает руки перед собой, словно лунатик, и расстилает простыню на кровати. Он двигается медленно и осторожно, чтобы его руки оставались в кадре камеры.
Зевс — регистратор данных для Micro1, американской компании из Пало-Альто, Калифорния, которая собирает реальные данные для продажи компаниям, занимающимся робототехникой. Пока такие компании, как Tesla, Figure AI и Agility Robotics, соревнуются в создании гуманоидов — роботов, спроектированных так, чтобы быть похожими на людей и двигаться как они на фабриках и в домах, — видео, записанные работниками-фрилансерами вроде Зевса, становятся самым востребованным способом их обучения.
Micro1 наняла тысячи контрактников более чем в 50 странах, включая Индию, Нигерию и Аргентину, где множество технически подкованной молодежи ищет работу. Они крепят iPhone к головам и записывают, как складывают белье, моют посуду и готовят еду. Эта работа хорошо оплачивается по местным меркам и стимулирует местную экономику, но она поднимает острые вопросы о конфиденциальности и информированном согласии. А сама работа порой бывает сложной — и странной.
Зевс нашел эту работу в ноябре, когда о ней начали говорить повсюду в LinkedIn и на YouTube. «Это будет действительно хорошая возможность заявить о себе и предоставить данные, которые будут использоваться для обучения роботов в будущем», — подумал он.
Зевсу платят 15 долларов в час, что является хорошим доходом в условиях напряженной экономики Нигерии с высоким уровнем безработицы. Но как светлоокий студент, мечтающий стать врачом, он находит многочасовую ежедневную глажку одежды скучной.
«Мне это не очень нравится», — говорит он. «Я из тех людей, которым нужна… техническая работа, требующая размышлений».
Зевс и все работники, с которыми беседовало издание MIT Technology Review, просили называть их только псевдонимами, поскольку они не уполномочены обсуждать свою работу.
Создание гуманоидных роботов печально известно своей сложностью, поскольку манипулирование физическими объектами — это навык, который трудно освоить. Но появление больших языковых моделей, лежащих в основе чат-ботов вроде ChatGPT, вдохновило на смену парадигмы в робототехнике. Подобно тому, как большие языковые модели научились генерировать слова, обучаясь на огромных массивах текста, собранного из интернета, многие исследователи полагают, что гуманоидные роботы могут научиться взаимодействовать с миром, обучаясь на массивных объемах данных о движении.
Примечание редакции: В недавнем опросе читатели MIT Technology Review выбрали гуманоидные роботы 11-м прорывом для нашего списка 10 прорывных технологий 2026 года.
Однако робототехнике требуются гораздо более сложные данные о физическом мире, и их гораздо труднее найти. Виртуальные симуляции могут обучать роботов выполнять акробатические трюки, но не тому, как хватать и перемещать предметы, поскольку симуляции с трудом моделируют физику с идеальной точностью. Чтобы роботы могли работать на фабриках и выполнять обязанности по дому, реальные данные, какими бы трудоемкими и дорогостоящими они ни были в сборе, могут оказаться тем, что нам нужно.
Инвесторы лихорадочно вкладывают деньги в решение этой задачи, потратив более 6 миллиардов долларов на гуманоидные роботы в 2025 году. А домашняя запись данных становится бурно развивающейся гиг-экономикой по всему миру. Дата-компании, такие как Scale AI и Encord, набирают свои собственные армии регистраторов данных, в то время как DoorDash платит водителям доставки за съемку себя за выполнением домашних дел. А в Китае работники десятков государственных робототехнических центров надевают гарнитуры виртуальной реальности и экзоскелеты, чтобы научить гуманоидных роботов открывать микроволновку и вытирать стол.
«Спрос большой, и он очень быстро растет», — говорит Али Ансари, генеральный директор Micro1. По его оценкам, компании, занимающиеся робототехникой, ежегодно тратят более 100 миллионов долларов на покупку реальных данных у его компании и других подобных ей.
Один день из жизни
Работники Micro1 проходят проверку с помощью ИИ-агента по имени Зара, который проводит собеседования и просматривает образцы видео с домашними делами. Каждую неделю они отправляют видеозаписи того, как выполняют домашние дела у себя дома, следуя списку инструкций о том, как держать руки на виду и двигаться с естественной скоростью. Видео просматриваются как ИИ, так и человеком и либо принимаются, либо отклоняются. Затем они аннотируются ИИ и командой из сотен людей, которые размечают действия на кадрах.
Поскольку этот подход к обучению роботов находится в зачаточном состоянии, еще неясно, что именно является хорошими обучающими данными. Тем не менее, «вам нужно предоставить очень много вариаций, чтобы робот хорошо обобщал базовую навигацию и манипулирование миром», — говорит Ансари.
Но многие работники говорят, что создание разнообразия «контента по домашним делам» в их крошечных домах является проблемой. Зевс, предприимчивый студент, живущий в скромной студии, изо всех сил старается записывать что-либо, кроме ежедневной глажки одежды. Арджун, репетитор из Дели, Индия, тратит час на создание 15-минутного видео, потому что слишком много времени тратит на мозговой штурм новых домашних дел.
«Сколько контента [можно создать] дома? Сколько контента?» — говорит он.
Существует также щекотливый вопрос конфиденциальности. Micro1 просит работников не показывать лица в камере и не раскрывать личную информацию, такую как имена, номера телефонов и даты рождения. Затем компания использует ИИ и человеческих рецензентов для удаления всего, что могло просочиться.
Но даже без лиц видео запечатлевают интимный срез жизни работников: интерьеры их домов, их имущество, их распорядок дня. И понять, какую личную информацию они могут записывать, пока заняты домашними делами перед камерой, бывает непросто. Проверка таких кадров может не выявить конфиденциальную информацию, выходящую за рамки самых очевидных идентификаторов.
Для работников с семьями сокрытие личной жизни от камеры — это постоянный компромисс. Арджун, отец двоих дочерей, вынужден выводить из кадра свою неугомонную двухлетнюю дочь. «Иногда очень трудно работать, потому что моя дочь маленькая», — говорит он.
Саша, бывший банкир, а ныне регистратор данных в Нигерии, крадется, когда развешивает белье на улице в общем жилом комплексе, чтобы не заснять своих соседей, которые с недоумением наблюдают за ней.
Хотя работники, с которыми беседовало MIT Technology Review, понимают, что их данные используются для обучения роботов, никто из них не знает, как именно их данные будут использоваться, храниться и передаваться третьим сторонам, включая робототехнические компании, которым Micro1 продает данные. По соображениям конфиденциальности, говорит Ансари, Micro1 не называет своих клиентов и не раскрывает работникам конкретный характер проектов, в которых они участвуют.
«Важно, чтобы если работники занимаются этим, компании сами информировали их о намерениях… куда может пойти эта технология и как это может повлиять на них в долгосрочной перспективе», — говорит Ясмин Коттури, профессор человеко-ориентированных вычислений в Университете Мэриленда.
Иногда, по словам некоторых работников, они видели, как другие работники спрашивали в корпоративном канале Slack, может ли компания удалить их данные. Micro1 отказалась комментировать, удаляются ли такие данные.
«Люди добровольно соглашаются на это», — говорит Ансари. «Они могут прекратить работу в любой момент».
Жажда данных
Поскольку тысячи работников выполняют свои дела по-разному в разных домах, некоторые робототехники задаются вопросом, достаточно ли надежны собранные у них данные для безопасного обучения роботов.
«То, как мы ведем себя в наших домах, не всегда правильно с точки зрения безопасности», — говорит Аарон Пратер, робототехник из ASTM International. «Если эти люди учат плохим привычкам, которые могут привести к инциденту, то это нехорошие данные». А огромный объем собираемых данных затрудняет их проверку на предмет контроля качества. Но Ансари утверждает, что компания отклоняет видео, демонстрирующие небезопасные способы выполнения задачи, в то время как неуклюжие движения могут быть полезны, чтобы научить роботов, чего делать не следует.
Затем возникает вопрос о том, сколько этих данных нам нужно. Micro1 заявляет, что у нее есть десятки тысяч часов отснятого материала, в то время как Scale AI объявила о сборе более 100 000 часов.
«Понадобится много времени, чтобы достичь этого», — говорит Кен Голдберг, робототехник из Калифорнийского университета в Беркли. Большие языковые модели обучались на текстах и изображениях, на чтение которых у человека ушло бы 100 000 лет, а гуманоидным роботам может потребоваться еще больше данных, поскольку управление роботизированными суставами еще сложнее, чем генерация текста. «Это займет больше времени, чем думают люди», — говорит он.
Когда Датту, студент инженерного факультета из оживленного технологического центра в Индии, возвращается домой после полного дня занятий в университете, он пропускает ужин и спешит на свой крошечный балкон, заставленный горшечными растениями и гантелями. Он прикрепляет свой iPhone ко лбу и записывает, как снова и снова складывает один и тот же комплект одежды.
Его семья смотрит на него с недоумением. «Для них это как какая-то космическая технология», — говорит он. Когда он рассказывает друзьям о своей работе, «они просто поражены идеей, что им могут платить за запись домашних дел».
Совмещение учебы в университете с записью данных, а также с другими подработками по аннотированию данных, отнимает у него много сил. Тем не менее, «ощущение, будто ты делаешь что-то отличное от всего мира», — говорит он.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Amy Nordrum




