Инфляция квот ИИ — это не просто «токен», она уже вшита в код

ии Llm токены синс подписки привязка theregister.com

Мнение: Мы уже бывали здесь. На этот раз мы можем не выбраться. Токены как новая форма привязки в эпоху ИИ. — theregister.com

Мнение Поклонники творческих профессий часто вычисляют места сбора создателей для неформального общения, а затем пробираются туда, чтобы подслушать, о чем говорят эти мастера своего дела. Золотые озарения, смелые концепции, передовое мышление? Ничуть. Сплетни, если повезет. Жалобы на путешествия, если не повезет. В основном они говорят о деньгах.

С большими языковыми моделями (LLM) то же самое, но вместо прямого разговора о деньгах люди говорят о токенах. Ежедневная сводка новостей от ИИ-кодеров: очередная функция получила ИИ-улучшение, очередная «ошибка» исправлена в учете подписок, изменение поведения — и все это объединяет одно: СИНС, или синдром инкрементального сжигания токенов. Возможно, мы находимся в начале СИНС, но, продолжая метафору ИИ как пандемии, впереди нас ждет еще очень многое.

Токены — это метрика для выставления счетов за использование LLM просто потому, что их легко считать, даже если это бросает вызов тем, кто их считает. Вы отправляете запрос в LLM, и она распознает его лексемы — лингвистический термин, восходящий к 1930-м годам, обозначающий единицы смысла и модификации. Они преобразуются в свои представления, токены, и подаются в гигантскую машину LLM, угадывающую следующее слово. Результатом является строка выходных токенов, преобразованных для вашего удовольствия в слова, компьютерный код или что-то еще. Считайте входящие, считайте исходящие. Это не совсем…

if ((ntokens_left -= (strlen(prompt) + strlen(slop))) <= 0) {
printf("Cough up, sunshine\n");

… Но достаточно близко. На этой концепции держится весь коммерческий фасад ИИ.

Основывать затраты на потреблении токенов, будь то для подсказок кода, генерации или ИИ-отладки, имеет столько же смысла — даже меньше, — сколько платить программистам за каждый нажатый символ и выведенный символ. Это даже глупее, чем метрика строк кода в месяц для оценки качества кодера — концепция настолько абсурдная, что сторонники Juicero на ее фоне выглядят как Уоррен Баффет. Здесь нет понятия фактически выполненной полезной работы, нет понимания, что неэффективность вознаграждается, и нет простого способа связать уплаченную цену с реальной стоимостью производства. Но это легко понять и похоже на любую другую модель подписки с предоплатой ограниченного использования. Странно, но никто, похоже, не собирается это улучшать.

Других метрик практически нет. Вы можете измерить токены в секунду для тестового сценария. Вы можете измерить соотношение исходящих токенов к входящим, хотя неясно, зачем. По крайней мере, в сравнимых моделях обслуживания, таких как облачные вычисления, вы знаете, что получаете, когда покупаете определенный объем вычислений, памяти, хранилища и сетевых ресурсов. Вам все еще приходится следить за автоматизацией или неправильным управлением, и «Шок от счетов» все еще работает в AWS, но у вас есть шанс связать результаты с затратами. Удачи с сервисами на основе LLM, не говоря уже об ИИ-агентах.

Добавьте это отсутствие метрик ценности к нелепой отдаче от инвестиций, которую должна продемонстрировать ИИ-индустрия, чтобы выполнить свои обещания, и мы получим рецепт нарастающей инфляции СИНС.

Продавцы одержимы превращением всего в подписку, а затем «варением лягушек» подписчиков, особенно когда они могут обеспечить фактическую монополию. Представьте себе привязку, когда организация деквалифицировала своих людей, производящих код, и стала зависимой от определенной цепочки генерации кода на базе ИИ.

Миграция — самое трудное слово, которое нужно произнести, даже когда обоснование подкреплено телефонной книгой метрик. Вы можете посмотреть на стоимость за инстанс или стоимость за терабайт и на то, что вам понадобится для поддержания бизнес-модели в хорошем состоянии, и, возможно, вы не будете полностью неправы. Как это сработает с CI/CD, сильно зависящим от ИИ, — это большой вопрос, ответ на который вы, возможно, захотите предоставить кому-то другому.

Вендорская сторона индустрии и сторона инфраструктуры всегда видели циклы привязки, ведущие к феодализму, ведущие к революции, ведущие к тому, что революционеры сами становились рантье-арендодателями. Хотите 70 лет корпоративных технологий в 60 словах? Держитесь крепче.

От арендованных мейнфреймов к мини-компьютерам, устанавливаемым на месте, от мини-компьютеров к автономным микрокомпьютерам на рабочем столе — по крайней мере, до тех пор, пока Ethernet не начал снова создавать виртуальные мини-компьютеры. От проприетарного к открытому исходному коду; открытый исходный код и повсеместное распространение, по сути, неограниченные вычисления, питающие гиперскейлеры, работающие на закрытых сервисах; архитектуры гиперскейлеров, поддерживающие модели ИИ с квотами на пользователя, которые возвращают нас к мейнфреймам вне площадки; снова закрытые сервисы и пользовательские квоты.

Эти циклы подпитывались Законом Мура, который постоянно менял экономику ИТ, чтобы препятствовать инерции в индустрии, которая отчаянно в ней нуждается.

Закон Мура закончился — вот честно. Плотностная интеграция теперь стала объемной, поэтому вместо того, чтобы становиться дешевле, меньше, энергоэффективнее и демократичнее, кремниевая технология раздувается в цене, размере, жадности к энергии и феодализме. ИИ — единственный зверь, способный двигать рынок, и чтобы оставаться таковым, ему нужно питаться вами. СИНС — это то, что нужно. Работайте на земле своего господина, крестьяне.

Если ИИ приведет к деквалификации технологических кадров и захвату двигателя создания ИТ, это будет так, словно эра мейнфреймов наступила в конце полупроводниковой эволюции, а не в начале. Все, что можно сказать об эволюционном двигателе, который сдвинет все дальше, — это то, что он еще не изобретен, несмотря на пятьдесят лет поисков.

ИИ-индустрия строится в гигаваттах, а выставляет счета в токенах. Она устанавливает стоимость и чует будущее, где глубокая привязка позволит ей устанавливать правила навсегда. Остальным нам следует помнить слова оригинального разумного мейнфрейма с последовательным портом из фильма «Военные игры» (WarGames): «Единственный выигрышный ход — не играть». Ему знать. ®

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: