Технологические гиганты втихомолку признают: чтобы продать ИИ массовому пользователю, он должен стоить дешево

ии токены Edge-вычисления затраты цод gizmodo.com

«Tokenmaxxing» выходит из моды. Наступает Великая токен-паника. Техгиганты сталкиваются с реальностью: расходы на ИИ и токены вышли из-под контроля, подталкивая к периферийным вычислениям и водным обещаниям. — gizmodo.com

Мания искусственного интеллекта, охватившая Кремниевую долину лихорадкой за последние несколько лет, наталкивается на суровую экономическую реальность.

В последние недели крупные технологические компании были вынуждены признать, что расходы на токены — базовую единицу измерения использования ИИ — вышли из-под контроля. Amazon пришлось закрыть внутреннее соревнование по использованию максимального количества токенов на работе, заявив сотрудникам: «Пожалуйста, не используйте ИИ просто ради использования ИИ», сообщает Business Insider; по сообщениям, Uber ограничила расходы сотрудников на токены до 1500 долларов в месяц после того, как компания исчерпала свой годовой бюджет на ИИ ранее в этом году. И что наиболее показательно, компании, разрабатывающие крупные модели ИИ, также пробудились к этой отрезвляющей реальности. На недавнем мероприятии, организованном OpenAI, генеральный директор Сэм Альтман признал, что использование токенов стало «огромной проблемой» для компаний, которым обещали значительный рост производительности в случае внедрения ИИ в их деятельность.

Это резкий поворот по сравнению с ситуацией всего несколько месяцев назад, когда общая атмосфера в отрасли заключалась в том, что чем больше сотрудники используют ИИ, тем лучше будет им и компаниям, в которых они работают. Так называемый «tokenmaxxing» стал мемом и более или менее синонимом «обеспечения будущего»: в эпоху, когда все вокруг используют ИИ, те, кто умеет им пользоваться, получат значительное преимущество. Не каждая работа будет обязательно заменена ИИ (такова была логика), но сотрудники, которые не используют ИИ, определенно будут заменены теми, кто его использует.

Но ИИ всегда был дорогим, а затраты на обучение и инференс новых моделей только растут. Тем временем целенаправленное стремление отрасли к агентам — по сути, системам ИИ, которые могут работать с минимальным участием человека в течение длительного времени — привело к взрывному росту использования токенов. В одном препринте, опубликованном в апреле, было обнаружено, что агенты используют в 1000 раз больше токенов, чем другие системы ИИ. 

Именно компании и отдельные пользователи в подавляющем большинстве несут эти расходы. Неудивительно, что некоторые разработчики прибегают к пиратству бесплатных онлайн-чат-ботов, таких как бот для обслуживания клиентов Chipotle, Pepper, чтобы обойти прожорливые до токенов модели крупных компаний. GitHub объявил на этой неделе о внедрении новой модели оплаты, по которой пользователи будут платить за количество сожженных токенов. Судя по первым отзывам пользователей, дела идут неважно.

Крупным технологическим компаниям отчаянно необходимо найти новый способ убедить людей в будущем ИИ без непомерных затрат на токены. Если они этого не сделают, компании и пользователи просто перейдут на какую-нибудь открытую модель, которую можно использовать бесплатно.

На грани

Некоторые крупные технологические компании буквально оказались на грани из-за растущих затрат на использование ИИ. 

Microsoft и Google недавно анонсировали новые продукты на базе ИИ — Gemma 4 12B и ноутбук RTX Spark соответственно, — основанные на так называемых вычислениях на периферии («edge» computing). Это когда модель работает за счет вычислительной мощности конкретного устройства, а не облака (то есть энергоемких центров обработки данных). Очевидно, что модель масштаба Claude Opus 4.8 или GPT-5 невозможно запустить напрямую с вашего ноутбука; это все равно что пытаться обеспечить энергией запуск ракеты Falcon 9, подключив велотренажер к генератору. Но логика новых продуктов Microsoft и Google заключается в том, что на самом деле не всем нужны самые новые, лучшие и самые прожорливые до токенов модели непосредственно в устройствах, которые они используют ежедневно. Для большинства людей в большинстве случаев меньшей, более легкой модели будет вполне достаточно. И что крайне важно, это сэкономит всем деньги на токенах.

Не стоит заблуждаться: инвестиции Microsoft и Google в периферийные вычисления ничтожны по сравнению с тем, что они тратят на центры обработки данных; облачные вычисления по-прежнему составляют основу бизнес-моделей обеих компаний. Но в их обращении к периферийным вычислениям мы видим, по крайней мере, молчаливое признание того, что стоимость массивных моделей ИИ просто не стоит того напряжения, которое оно создает для большинства потребителей.

Водные обещания

Пока они продвигают новые продукты для периферийных вычислений, обещая мощные возможности ИИ при более низкой стоимости, Microsoft и Google также пытаются успокоить общественность, которая все больше обеспокоена потребностью центров обработки данных в воде. (Центры обработки данных обычно используют воду для предотвращения перегрева кластеров GPU.) Во вторник, во время вступительной речи на Microsoft Build, ежегодной конференции для разработчиков, генеральный директор Сатья Наделла заявил, что годовое потребление воды новыми центрами обработки данных Microsoft «примерно эквивалентно потреблению одного ресторана». 

На следующий день Google объявила о планах «восполнять больше воды, чем потребляется» при охлаждении центров обработки данных к 2030 году, а также о других «обязательствах по управлению водными ресурсами». Для дополнительного успокоения в пресс-релизе отмечалось, что «центры обработки данных в США используют менее 1% воды, которую американцы ежегодно тратят на свои газоны» — хотя это, вероятно, говорит больше о привычках американцев поливать газоны, чем об искуплении грехов индустрии ИИ, расточительно расходующей воду.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: