Большинству из нас хоть раз снилось, что мы не можем говорить или двигаться; проснуться от такого кошмара и вновь обрести способность свободно пользоваться голосом — это настоящее освобождение. Теперь компания Meta* заявляет, что приближается к тому, чтобы помочь людям, которые на самом деле живут с этим парализующим состоянием, общаться с помощью ИИ, декодирующего мозговые волны.
В понедельник компания представила Brain2Qwerty v2 — свою последнюю разработку, направленную на преобразование зашумленной мозговой активности в связный текст: представьте это как рудиментарную форму алгоритмически опосредованного чтения мыслей. Хотя исследование все еще находится на ранней стадии, оно дает представление о, возможно, не столь отдаленном будущем, в котором пациенты, страдающие анартрией, синдромом запертого человека, боковым амиотрофическим склерозом (БАС) и другими парализующими нейродегенеративными расстройствами, смогут общаться посредством мысли без необходимости использования нейропротезов, которые обычно требуют крайне инвазивных, сложных и дорогостоящих операций на мозге.
«Мы считаем, что это исследование способно реально изменить жизнь миллионов людей, страдающих поражениями мозга, которые мешают им общаться», — написала Meta* в своем анонсе. Базовый код для Brain2Qwerty v2, как и для его предшественника v1, был опубликован в открытом доступе. «Мы надеемся, что эта работа, выполненная открыто, ускорит развитие нейронауки в выявлении, диагностике и лечении неврологических расстройств, а не будет проводиться в изоляции», — написала компания, вторя растущему движению в индустрии ИИ за предоставление ученым доступа к открытому исходному коду ИИ во имя ускорения темпов открытий.
Как Meta* обучала Brain2Qwerty v2
Обучение новой модели, которое проводилось в Баскском центре познания, мозга и языка в Сан-Себастьяне, Испания, включало девять здоровых добровольцев в возрасте от 25 до 56 лет, которых просили напечатать более 2500 предложений в ходе десяти сессий. На протяжении этих сессий их мозговая активность отслеживалась с помощью магнитоэнцефалографии (МЭГ), которая измеряет крошечные электрические поля, генерируемые нейронной активностью в мозге. Все напечатанные предложения и сканы мозга послужили необработанными обучающими данными, которые были поданы в Brain2Qwerty.
В своем самом успешном эксперименте Brain2Qwerty v2 достиг точности по словам — что означает, что более половины предложений, декодированных из мозговой активности, содержали не более одной ошибки в слове — в 78%. Для сравнения, Brain2Qwerty v1 (выпущенный в прошлом году) достиг показателя 48% в своем самом успешном случае.
Исследователи также обнаружили, что точность декодирования новой системы возрастает по мере увеличения объема предоставленных ей обучающих данных, что предполагает возможность применения простых законов масштабирования для создания более мощных систем в будущем: «если расширенное обучение на неинвазивных данных МЭГ в конечном итоге сможет устранить необходимость в нейрохирургии», — написали исследователи в своей технической статье, «это будет представлять собой преобразующий сдвиг в уходе за пациентами».
От мозговых волн к LLM и общению
Беспрецедентная точность декодирования Brain2Qwerty v2 была достигнута во многом благодаря использованию той же технологии распознавания образов, что лежит в основе чат-ботов, таких как ChatGPT и Llama от Meta*. На первых двух этапах процесса декодирования мозговые волны испытуемых, измеренные МЭГ, преобразовывались с помощью ИИ в токены, представляющие отдельные символы, после чего другая система ИИ — называемая выравнивателем (aligner) — организовывала отдельные символы в целые слова. Далее в дело вступает большая языковая модель (LLM), которая преобразует набор символов и слов, полученный от другого ИИ, в связные предложения.
Эти результаты знаменуют собой первый случай успешного применения LLM для преобразования зашумленной мозговой активности в структурированные, понятные предложения. Это также может предложить ценную новую модель для будущих исследователей, пытающихся создать новые нейрокомпьютерные интерфейсы, будь то физические или виртуальные, в которых несколько систем ИИ используются для иерархического и совместного декодирования мозговой активности.
Помимо этой многоуровневой системы декодирования на базе ИИ, Brain2Qwerty также полагается на группу агентов ИИ «автоматического исследования» (auto-research), задача которых — автономно оттачивать процесс декодирования для повышения его точности и эффективности; представьте их как рабочих пчел, постоянно вносящих структурные улучшения в улей, чтобы вся жизненно важная деятельность внутри могла продолжаться без сбоев. Агенты обучались «итеративно изменять нашу кодовую базу для изобретения новых, лучших архитектур», — написали исследователи в статье, что привело к «существенному улучшению» показателя ошибок в словах (WER).
В статье также отмечается, что, хотя агенты были полезны в выявлении новых стратегий оптимизации, они были далеки от полной замены человеческих исследователей: «хотя агенты ИИ могут служить мощным мультипликатором силы, человеческие исследования пока остаются критически важной частью научного процесса».
Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Webb Wright




