Шумиха вокруг генеративного ИИ отвлекает нас от более значимых прорывов в области искусственного интеллекта.

искусственный интеллект,генеративный ии,предиктивный ии,технологии,будущее ии,наука

Статья разбирает разницу между генеративным и предиктивным искусственным интеллектом, критикуя хайп вокруг первого и подчеркивая практическую пользу второго. Автор, ученый в области ИИ, объясняет, как предиктивный ИИ уже трансформирует нашу жизнь, от медицины до прогнозирования погоды, и призывает сосредоточиться на его реальных достижениях для создания более полезного и устойчивого будущего.

28 апреля 2022 года на долгожданном концерте в Спокане, штат Вашингтон, музыкант Пол Маккартни поразил публику новаторским применением ИИ: он начал выступать с реалистичным изображением своего покойного партнера по группе Джона Леннона.

Используя последние достижения в области обработки аудио и видео, инженеры извлекли финальное выступление дуэта (Лондон, 1969 год), отделили голос и изображение Леннона от оригинальной записи и восстановили их с поразительной четкостью.


Этот материал является частью проекта MIT Technology Review «Коррекция хайпа» — серии статей, призванных скорректировать представления о том, что такое ИИ, на что он способен и куда мы движемся дальше.


Годами такие исследователи, как я, учили машины «видеть» и «слышать», чтобы сделать подобный момент возможным. Когда Маккартни и Леннон, казалось, воссоединились сквозь время и пространство, зал погрузился в тишину; многие в толпе начали плакать. Как ученый, занимающийся ИИ, и давний поклонник The Beatles, я испытал глубокую благодарность за то, что мы смогли пережить этот поистине меняющий жизнь момент.

Позже в том же году мир был очарован другим крупным прорывом: диалоговым ИИ. Впервые в истории системы, способные генерировать новые, контекстуально релевантные комментарии в реальном времени практически по любой теме, стали широко доступны благодаря выпуску ChatGPT. Миллиарды людей внезапно получили возможность взаимодействовать с ИИ. Это пробудило воображение общественности относительно того, чем может быть ИИ, породив взрыв творческих идей, надежд и страхов.

Защитив докторскую диссертацию по генерации языка с помощью ИИ (долгое время считавшейся нишевой областью), я был рад, что мы достигли такого прогресса. Но трепет, который я испытывал, соперничал с моим растущим гневом на поток публикаций в СМИ и самозваных экспертов, настаивавших на том, что генеративный ИИ способен делать вещи, которые он просто не может, и предупреждавших, что любой, кто не примет его, останется позади.

Подобный хайп способствовал возникновению водоворота недоразумений относительно того, что такое ИИ на самом деле, и что он может, а что нет. Важно отметить, что генеративный ИИ является соблазнительным отвлечением от того типа ИИ, который, скорее всего, сделает вашу жизнь лучше или даже спасет ее: предиктивного ИИ. В отличие от ИИ, предназначенного для генеративных задач, предиктивный ИИ включает задачи с конечным, известным набором ответов; система просто должна обработать информацию, чтобы сказать, какой ответ правильный. Простой пример — распознавание растений: наведите камеру телефона на растение, и вы узнаете, что это папоротник-мечелист западный. В отличие от этого, генеративные задачи не имеют конечного набора правильных ответов: система должна смешивать фрагменты информации, на которых она обучалась, чтобы создать, например, новую картину папоротника.

Технология генеративного ИИ, используемая в чат-ботах, дипфейках и синтетическом видео, отлично подходит для эффектных демонстраций, привлекая клики и продажи, поскольку зрители предаются фантазиям о том, что сверхразумный ИИ сможет принести нам изобилие или привести к гибели. Тем временем предиктивный ИИ незаметно улучшает прогнозирование погоды и безопасность пищевых продуктов, обеспечивает более высокое качество музыкального производства, помогает организовывать фотографии и точно предсказывает самые быстрые маршруты движения. Мы включаем предиктивный ИИ в нашу повседневную жизнь, даже не задумываясь об этом, что свидетельствует о его незаменимой полезности.

Чтобы понять огромный прогресс в области предиктивного ИИ и его будущий потенциал, мы можем взглянуть на траекторию последних 20 лет. В 2005 году мы не могли заставить ИИ отличить человека от карандаша. К 2013 году ИИ все еще не мог надежно распознать птицу на фотографии, а разница между пешеходом и бутылкой кока-колы ставила его в тупик (именно так я узнал, что бутылки чем-то похожи на людей, если бы у людей не было голов). Мысль о внедрении этих систем в реальный мир была из области научной фантастики.

Тем не менее, за последние 10 лет предиктивный ИИ не только безупречно определил птиц до конкретного вида; он стремительно улучшил критически важные медицинские услуги, такие как выявление патологических поражений и сердечных аритмий. Благодаря этой технологии сейсмологи могут предсказывать землетрясения, а метеорологи — прогнозировать наводнения с большей надежностью, чем когда-либо прежде. Точность резко возросла для потребительских технологий, которые обнаруживают и классифицируют все — от песни, которую вы имеете в виду, когда напеваете мелодию, до объектов, которых следует избегать во время вождения, — делая самоуправляемые автомобили реальностью.

В самом ближайшем будущем мы должны иметь возможность точно обнаруживать опухоли и предсказывать ураганы задолго до того, как они смогут причинить вред, воплощая многолетние надежды людей по всему миру. Это может быть не так эффектно, как создание собственного фильма в стиле студии Ghibli, но это определенно заслуживает внимания.

Предиктивные системы ИИ также оказались невероятно полезными, когда они используют определенные генеративные методы в рамках ограниченного набора вариантов. Системы такого типа разнообразны: от визуализации нарядов до межъязыкового перевода. Вскоре гибридные предиктивно-генеративные системы позволят клонировать ваш собственный голос, говорящий на другом языке в реальном времени, что станет исключительной помощью в путешествиях (со серьезными рисками выдачи себя за другого). Здесь есть значительный простор для роста, но генеративный ИИ приносит реальную пользу, когда он опирается на надежные предиктивные методы.

Чтобы понять разницу между этими двумя широкими классами ИИ, представьте себя в роли системы ИИ, которой поручено показать кому-то, как выглядит кошка. Вы могли бы использовать генеративный подход, вырезая и вставляя небольшие фрагменты из различных изображений кошек (потенциально из источников, которые возражают), чтобы создать кажущееся идеальным изображение. Способность современного генеративного ИИ создавать такой безупречный коллаж и поражает.

Альтернативно, вы могли бы применить предиктивный подход: просто найдите и укажите на существующую картинку кошки. Этот метод гораздо менее гламурный, но более энергоэффективный и, скорее всего, точный, а также должным образом признает исходный источник. Генеративный ИИ предназначен для создания вещей, которые выглядят реальными; предиктивный ИИ определяет, что является реальным. Недоразумение, заключающееся в том, что генеративные системы извлекают вещи, когда на самом деле они их создают, привело к серьезным последствиям, когда речь идет о тексте, требуя отзыва судебных решений и аннулирования научных статей.

Движущей силой этого заблуждения является склонность людей преувеличивать возможности ИИ, не уточняя, о каком типе ИИ они говорят (я полагаю, многие и сами не знают). Очень легко приравнивать «ИИ» к генеративному ИИ или даже просто к ИИ, генерирующему язык, и предполагать, что все остальные возможности вытекают из этого. Эта ошибка имеет большой смысл: сам термин буквально отсылает к «интеллекту», а наше человеческое понимание того, каким может быть «интеллект», часто опосредуется использованием языка. (Спойлер: никто на самом деле не знает, что такое интеллект.) Но фраза «искусственный интеллект» была намеренно разработана в 1950-х годах, чтобы вызывать восхищение и намекать на нечто человекоподобное. Сегодня она просто относится к набору разрозненных технологий для обработки цифровых данных. Некоторым моим друзьям помогает называть это «математическими математиками».

Склонность рассматривать генеративный ИИ как самую мощную и реальную форму ИИ вызывает беспокойство, учитывая, что он потребляет значительно больше энергии, чем предиктивные системы ИИ. Это также означает использование существующей человеческой работы в продуктах ИИ против воли первоначальных создателей и замену рабочих мест ИИ-системами, чьим возможностям способствовала их работа, — без компенсации. ИИ может быть удивительно мощным, но это не значит, что создателей следует обдирать.

Наблюдая за этим процессом как разработчик ИИ в технологической индустрии, я извлек важные уроки для дальнейших шагов. Широкая привлекательность ИИ явно связана с интуитивностью диалоговых взаимодействий. Но этот метод взаимодействия в настоящее время чрезмерно использует генеративные методы там, где достаточно предиктивных, что приводит к неловкой ситуации, которая сбивает с толку пользователей, одновременно налагая высокие затраты на потребление энергии, эксплуатацию и потерю рабочих мест.

Мы видели лишь проблеск полного потенциала ИИ: нынешний ажиотаж вокруг ИИ отражает то, чем он мог бы быть, а не то, чем он является. Генеративные подходы истощают ресурсы, при этом все еще отставая в плане репрезентации, точности и учета пожеланий людей, чья работа интегрирована в систему.

Если мы сможем переключить внимание с хайпа вокруг генеративных технологий на предиктивные достижения, которые уже трансформируют повседневную жизнь, мы сможем создать ИИ, который будет действительно полезным, справедливым и устойчивым. Системы, которые помогают врачам раньше выявлять заболевания, ученым — быстрее прогнозировать стихийные бедствия, а обычным людям — безопаснее ориентироваться в жизни, обладают наибольшим потенциалом для оказания значительного влияния.

Будущее полезного ИИ будет определяться не самыми эффектными демонстрациями, а тихим, строгим прогрессом, который делает технологии надежными. И если мы будем опираться на этот фундамент, сочетая предиктивную силу с более зрелыми методами работы с данными и интуитивно понятными интерфейсами на естественном языке, ИИ сможет наконец начать оправдывать обещания, которые многие люди видят сегодня.

Доктор Маргарет Митчелл — исследователь в области компьютерных наук и главный специалист по этике в стартапе Hugging Face. Она работает в технологической индустрии 15 лет и опубликовала более 100 статей по генерации естественного языка, вспомогательным технологиям, компьютерному зрению и этике ИИ. Ее работы получили множество наград и были внедрены несколькими технологическими компаниями.