Пять архитекторов экономики ИИ объясняют, где «система» дает сбой

ии чипы энергия суверенитет агенты Ebm techcrunch.com

Ранее на этой неделе пять человек, затрагивающих все уровни цепочки поставок ИИ, встретились на Milken Global Conference в Беверли-Хиллз, где они обсудили с TechCrunch все: от дефицита чипов до орбитальных дата-центров и возможности того, что вся архитектура, лежащая в основе технологий, ошибочна. — techcrunch.com

На сцене TechCrunch: Кристоф Фоке, генеральный директор ASML, голландской компании, обладающей монополией на машины для экстремальной ультрафиолетовой литографии, без которых не существовало бы современных чипов; Фрэнсис деСоуза, операционный директор Google Cloud, курирующий одну из крупнейших инфраструктурных ставок в корпоративной истории; Касар Юнис, соучредитель и генеральный директор Applied Intuition, компании по физическому ИИ стоимостью 15 миллиардов долларов, которая начинала с симуляции, а затем перешла к оборонной сфере; Димитрий Шевеленко, главный по бизнесу в Perplexity, компании, ориентированной на поиск и агентов на базе ИИ; и Эве Бодния, физик-квантовик, покинувшая академическую среду, чтобы оспорить фундаментальную архитектуру, которую большая часть индустрии ИИ принимает как должное, в своей стартапе Logical Intelligence. (Бывший главный научный сотрудник Meta* по ИИ, Ян ЛеКун, ранее в этом году присоединился в качестве председателя-основателя ее технического исследовательского совета.)

Вот что сказали эти пятеро:

Узкие места реальны

Бум ИИ натыкается на жесткие физические пределы, и ограничения начинаются на более низких уровнях стека, чем многие могут себе представить. Фоке первым заявил об этом, описав «огромное ускорение производства чипов», при этом выразив свою «твердую убежденность» в том, что, несмотря на все эти усилия, «в ближайшие два, три, может быть, пять лет рынок будет ограничен предложением», что означает, что гиперскейлеры — Google, Microsoft, Amazon, Meta* — не получат все чипы, за которые платят, и точка.

ДеСоуза подчеркнул, насколько велика — и как быстро растет — эта проблема, напомнив аудитории, что выручка Google Cloud в прошлом квартале превысила 20 миллиардов долларов, показав рост на 63%, в то время как ее портфель заказов — зарезервированная, но еще не реализованная выручка — почти удвоился за один квартал, с 250 миллиардов до 460 миллиардов долларов. «Спрос реален», — сказал он с впечатляющим спокойствием.

Для Юниса ограничение исходит в основном из другого источника. Applied Intuition разрабатывает системы автономного управления для автомобилей, грузовиков, дронов, горнодобывающего оборудования и оборонной техники, и его узкое место — это не кремний, а данные, которые можно собрать, только отправив машины в реальный мир и наблюдая за происходящим. «Вы должны найти это в реальном мире», — сказал он, и никакое количество синтетического моделирования полностью не устраняет этот разрыв. «Пройдет много времени, прежде чем вы сможете полностью обучить модели, работающие в физическом мире, синтетически».

Энергетическая проблема также реальна

Если чипы — это первое узкое место, то энергия — это то, что маячит за ним. ДеСоуза подтвердил, что Google рассматривает центры обработки данных в космосе как серьезный ответ на энергетические ограничения. «Вы получаете доступ к более обильной энергии», — отметил он. Конечно, даже на орбите это не просто. ДеСоуза заметил, что космос — это вакуум, что исключает конвекцию, оставляя излучение единственным способом отвода тепла в окружающую среду (процесс, гораздо более медленный и сложный в реализации, чем системы воздушного и жидкостного охлаждения, на которые сегодня полагаются ЦОД). Но компания все еще рассматривает это как законный путь.

Более глубокий аргумент де Соуза, что неудивительно, касался эффективности за счет интеграции. Он предположил, что стратегия Google по совместной разработке всего стека ИИ — от специализированных чипов TPU до моделей и агентов — приносит дивиденды в виде флопс на ватт (больше вычислений на единицу энергии), которые компания, покупающая готовые компоненты, просто не может воспроизвести. «Запуск Gemini на TPU гораздо более энергоэффективен, чем любая другая конфигурация», потому что разработчики чипов знают, что будет в модели до ее выпуска, сказал он.

Фоке позже в обсуждении высказал схожую мысль. «Ничто не может быть бесценным», — сказал он. Индустрия сейчас находится в странном моменте, инвестируя огромные суммы капитала, движимые стратегической необходимостью. Но больше вычислений означает больше энергии, а у большей энергии есть цена.

Другой вид интеллекта

В то время как остальная индустрия обсуждает масштабы, архитектуру и эффективность инференса в парадигме больших языковых моделей, Бодния строит нечто совершенно иное.

Ее компания, Logical Intelligence, построена на так называемых энергетических моделях (EBM), классе ИИ, который не предсказывает следующий токен в последовательности, а пытается понять правила, лежащие в основе данных, так, как, по ее мнению, на самом деле работает человеческий мозг. «Язык — это пользовательский интерфейс между моим мозгом и вашим», — сказала она. «Само рассуждение не привязано ни к какому языку».

Ее самая большая модель насчитывает 200 миллионов параметров — по сравнению с сотнями миллиардов в ведущих LLM — и, по ее утверждению, работает в тысячи раз быстрее. Что еще более важно, она разработана для обновления своих знаний по мере изменения данных, а не для переобучения с нуля.

Для проектирования чипов, робототехники и других областей, где система должна понимать физические правила, а не лингвистические закономерности, она утверждает, что EBM подходят более естественно. «Когда вы ведете машину, вы не ищете закономерности в каком-либо языке. Вы смотрите вокруг себя, понимаете правила о мире вокруг вас и принимаете решение». Это интересный аргумент, который, вероятно, привлечет больше внимания в ближайшие месяцы, учитывая, что область ИИ начинает задаваться вопросом, достаточно ли одного только масштаба.

Агенты, ограничители и доверие

Шевеленко большую часть беседы посвятил объяснению того, как Perplexity превратилась из поискового продукта во что-то, что теперь называют «цифровым работником». Perplexity Computer, их новейшее предложение, разработано не как инструмент, который использует работник умственного труда, а как штат, которым руководит работник умственного труда. «Каждый день вы просыпаетесь, и у вас в команде сто сотрудников», — сказал он о возможностях. «Что вы собираетесь сделать, чтобы извлечь из этого максимум пользы?»

Это убедительный аргумент; он также поднимает очевидные вопросы о контроле, поэтому я их задал. Его ответ был: гранулярность. Администраторы предприятий могут указать не только то, к каким коннекторам и инструментам может получить доступ агент, но и то, являются ли эти разрешения только для чтения или для чтения/записи — различие, которое имеет огромное значение, когда агенты действуют внутри корпоративных систем. Когда Comet, агент по использованию компьютеров от Perplexity, совершает действия от имени пользователя, он представляет план и сначала запрашивает одобрение. Некоторым пользователям это трение кажется раздражающим, сказал Шевеленко, но он считает его необходимым, особенно после того, как присоединился к совету директоров Lazard, где, по его словам, он неожиданно проникся симпатией к консервативным инстинктам CISO, защищающего 180-летний бренд, построенный исключительно на доверии клиентов. «Гранулярность — это основа хорошей гигиены безопасности», — сказал он.

Суверенитет, а не только безопасность

Юнис высказал, возможно, самое геополитически заряженное замечание на панели, а именно то, что физический ИИ и национальный суверенитет переплетены так, как никогда не был переплетен чисто цифровой ИИ.

Интернет изначально распространялся как американская технология и сталкивался с противодействием только на уровне приложений — Uber и DoorDash — когда становились видимыми офлайн-последствия. Физический ИИ отличается. Автономные транспортные средства, оборонные дроны, горнодобывающее оборудование, сельскохозяйственная техника — все это проявляется в реальном мире так, что правительства не могут игнорировать, поднимая вопросы о безопасности, сборе данных и о том, кто в конечном итоге контролирует системы, работающие в пределах границ страны. «Почти постоянно каждая страна говорит: мы не хотим этот интеллект в физической форме на наших границах, контролируемый другой страной». Меньшее количество стран, сказал он толпе, в настоящее время может выставить на дорогу роботакси, чем обладает ядерным оружием.

Фоке сформулировал это немного иначе. Прогресс Китая в области ИИ реален — выпуск DeepSeek в начале этого года вызвал нечто вроде паники в некоторых частях индустрии, — но этот прогресс ограничен ниже уровня моделей. Без доступа к EUV-литографии китайские производители чипов не могут производить самые передовые полупроводники, а модели, построенные на устаревшем оборудовании, работают с кумулятивным недостатком, какой бы хорошей ни становилась программа. «Сегодня в Соединенных Штатах у вас есть данные, у вас есть доступ к вычислениям, у вас есть чипы, у вас есть таланты. Китай очень хорошо справляется с верхней частью стека, но ему не хватает некоторых элементов внизу», — сказал Фоке.

Вопрос поколения

Ближе к концу нашей панели кто-то из аудитории задал очевидный неудобный вопрос: повлияет ли все это на способность следующего поколения к критическому мышлению?

Ответы были оптимистичными, как и следовало ожидать от людей, которые поставили свою карьеру на эту технологию. ДеСоуза немедленно указал на масштаб проблем, которые более мощные инструменты, наконец, могут позволить человечеству решить. Представьте себе неврологические заболевания, биологические механизмы которых мы еще не понимаем, удаление парниковых газов и инфраструктуру сетей, которая откладывалась десятилетиями. «Это должно высвободить нас для следующего уровня творчества», — сказал он.

Шевеленко высказал более прагматичный довод: работа начального уровня может исчезать, но возможность самостоятельно запустить что-то никогда не была более доступной. «[Для] любого, у кого есть Perplexity Computer… ограничение — это ваше собственное любопытство и агентность».

Юнис провел самое резкое различие между умственным трудом и физическим трудом. Он указал на тот факт, что средний возраст американского фермера составляет 58 лет, а нехватка рабочей силы в горнодобывающей промышленности, междугородних грузоперевозках и сельском хозяйстве хроническая и растущая — не потому, что заработная плата слишком низка, а потому, что люди не хотят этих работ. В этих областях физический ИИ не вытесняет желающих работников. Он заполняет уже существующую пустоту, которая, по прогнозам, будет только углубляться.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: