Я долгое время следил за AWS, уделяя особое внимание ценообразованию. Вопрос “Что произойдет, если AWS поднимет цены?” всегда был чем-то вроде пугала, которое доставали как гипотетический аргумент, чтобы убедить людей избегать зависимости от конкретного провайдера.
В эти выходные – в субботу, не меньше – эта гипотеза стала реальностью.
AWS тихо подняла цены на свои EC2 Capacity Blocks для ML примерно на 15 процентов. Стоимость инстанса p5e.48xlarge – восемь ускорителей NVIDIA H200 в одном корпусе – подскочила с 34,61 доллара до 39,80 доллара в час в большинстве регионов, а p5en.48xlarge подорожал с 36,18 доллара до 41,61 доллара. Клиенты в регионе US West (N. California) столкнулись с еще более резким повышением: тарифы на p5e выросли с 43,26 доллара до 49,75 доллара. Об изменении было объявлено заранее: на странице цен AWS было отмечено (и, как ни странно, до сих пор отмечено), что “текущие цены планируется обновить в январе 2026 года”, хотя компания не удосужилась уточнить, в каком направлении.
Это произошло примерно через семь месяцев после того, как AWS протрубила о “снижении цен до 45%” на инстансы GPU, хотя это объявление касалось On-Demand и Savings Plans, а не Capacity Blocks. Забавно, как это работает.
Для непосвященных: Capacity Blocks – это ответ AWS на вопрос “Мне нужна гарантированная емкость GPU для моей задачи обучения ML в следующий вторник”. Вы резервируете определенные инстансы GPU на определенный период времени – от одного дня до нескольких недель – и платите авансом по фиксированной ставке. Это популярно среди компаний, занимающихся серьезной работой в области ML, которые не могут позволить себе прерывание обучения из-за испарения спотовых мощностей. Цены должны предельно ясно дать понять, что люди, использующие это, не любители; это команды с бюджетами, измеряемыми миллионами.
Представитель Amazon сообщил нам по электронной почте: “Цены на EC2 Capacity Blocks для ML варьируются в зависимости от моделей спроса и предложения, как описано на странице с подробной информацией о продукте. Эта корректировка цен отражает модели спроса и предложения, которые мы ожидаем в этом квартале”.
Чтобы было ясно, AWS и раньше поднимала цены, но редко в виде прямого увеличения стоимости позиции. Компания предпочитает полностью менять параметры ценообразования, часто представляя это как снижение цен для большинства клиентов – утверждение, которое я бы охарактеризовал как “креативное”. Исторические прямые повышения цен были связаны с нормативными актами: плата за SMS на определенных рынках и тому подобное. Это другое.
Время выбрано странно еще по одной причине: это дает Azure и GCP возможность для разговоров на блюдечке с голубой каемочкой. Обе компании агрессивно ухаживают за задачами машинного обучения, и “AWS только что подняла цены на GPU на 15%” – это именно тот вид боеприпасов, о котором мечтают корпоративные отделы продаж. Смогут ли конкуренты фактически поглотить спрос – это другой вопрос – ограничения GPU вряд ли уникальны для AWS – но восприятие имеет значение в корпоративных сделках.
Для компаний с программами Enterprise Discount Programs или другими согласованными соглашениями это поднимает неприятные вопросы. EDP обычно гарантируют скидки от публичных цен – поэтому, если публичные цены вырастут на 15 процентов, ваша “скидка” станет дороже в абсолютном выражении, даже если процент останется прежним. Я ожидаю несколько острых разговоров между командами AWS по работе с клиентами и их крупнейшими клиентами в ближайшие недели.
Почему они это делают?
Трудно не увидеть в этом предвестник. GPU становятся все более дефицитными во всем мире, поскольку мир переходит к созданию “шлака как услуги” во всех мыслимых областях. Вопрос в том, что это означает для других типов ресурсов в будущем. Означает ли глобальный дефицит оперативной памяти, что услуги, ориентированные на оперативную память, будут следующими? Вы можете игнорировать цены на ML Capacity Block, если вы не выполняете задачи машинного обучения – что описывает более 95 процентов облачных расходов большинства компаний – но оперативная память затрагивает каждую услугу, предлагаемую AWS. Ну, возможно, за исключением их функции поддержки, хотя она быстро становится “на базе искусственного интеллекта”, так что дайте ей время.
Опасение “канарейки в угольной шахте” здесь связано не с GPU, а с прецедентом, который это создает. AWS потратила два десятилетия, приучая клиентов ожидать, что цены будут только снижаться. Это ожидание теперь разрушено. Как только вы подняли цены на одну услугу, и мир не рухнул, второе повышение становится легче. И третье. Правила игры изменились.
Следите за услугами, где AWS сталкивается с реальными ограничениями поставок или где их затраты существенно возросли. Инстансы Graviton оценивались агрессивно, чтобы стимулировать внедрение – что произойдет, когда поставки чипов ARM сократятся? Затраты на передачу данных были дойной коровой в течение многих лет, но они также были стабильными; будут ли они следующими? У меня нет инсайдерской информации, но у меня есть распознавание образов, и этот образ только что изменился.
AWS долгое время извлекала выгоду из предположения, что облачные цены движутся только в одном направлении. Это предположение умерло в субботу в январе, со всей помпой обновления Условий обслуживания. Вопрос не в том, имеет ли это значение – имеет. Вопрос в том, является ли это аномалией или новой нормой. Я ставлю на последнее. ®
Всегда имейте в виду, что редакции некоторых изданий могут придерживаться предвзятых взглядов в освещении новостей.
7/9
Автор – Corey Quinn




