Расходы на ИИ взлетают вверх: подписки уперлись в ценовой потолок

ии токены подписки Api затраты модели tomshardware.com

Компании ищут более дешевые альтернативы на фоне резкого роста токен-расходов на передовые ИИ-модели, что может сказаться на прибыли OpenAI и Anthropic. Подписки также бьют по прибыльности стартапов, так как уровень утилизации выше 5,7% может привести к убыткам. — tomshardware.com

Стоимость обслуживания ИИ по подписной модели неуклонно растет для ИИ-компаний, особенно в условиях, когда снижение стоимости за токен не успевает за резким ростом использования токенов. По данным SemiAnalysis, подписки, предлагаемые как Anthropic, так и OpenAI, значительно дешевле фактической стоимости, которую приходится платить при максимальном использовании их сервисов. Исследовательская фирма приобрела все подписки у двух поставщиков ИИ и обнаружила, что приблизительные максимальные возможные расходы (исходя из цен API) намного превышают то, что пользователи платят ежемесячно. Например, Claude Max 20x стоит 200 долларов в месяц, но его максимальное использование обойдется в 8000 долларов в месяц в виде расходов на токены, в то время как ChatGPT Pro 20x, который также стоит 200 долларов в месяц, имеет максимальные возможные расходы около 14 000 долларов. Anthropic выходит на безубыточность по двум своим более дешевым тарифам (Claude Pro и Claude Max 5x) при 20% утилизации, в то время как OpenAI начинает терять деньги, если утилизация на ее базовых тарифах (ChatGPT Plus и ChatGPT Pro 5x) превышает 11,4%. Ситуация намного хуже с предложениями высшего уровня обеих компаний: Anthropic достигает 0% валовой прибыли при утилизации в 10%, в то время как OpenAI уходит в минус, если использование превышает 5,7%. Это, безусловно, неустойчиво, но сокращение функций или повышение цен на подписку, вероятно, также исключено для этих компаний. Однако не все новости плохие: по мере появления новых моделей и ввода в эксплуатацию большего числа центров обработки данных стоимость обслуживания существующих моделей обязательно снизится. SemiAnalysis прогнозирует, что обслуживание моделей уровня Opus за 20 долларов в месяц скоро станет прибыльным. С другой стороны, передовые модели, такие как Mythos, по-прежнему будут намного дороже в эксплуатации, поэтому вполне вероятно, что новейшие, самые передовые функции могут быть зарезервированы только для доступа через API, что означает, что вам придется платить за них на основе токенов. Как показал SemiAnalysis, уровни подписки более доступны, чем доступ через API. Однако последний все равно понадобится, если вы хотите получить доступ ко всем возможностям этих моделей ИИ, и именно здесь начинаются проблемы с бюджетами. Мощный агентурный ИИ потребляет до тысячи раз больше токенов, чем средняя модель, а крупные фирмы, такие как Microsoft, Meta* и Amazon, отказываются от «токеномаксинга», поскольку расходы выходят из-под контроля. Одна неназванная компания даже потратила 500 миллионов долларов за один месяц после того, как не смогла установить лимит использования на лицензии для сотрудников. Из-за этого некоторые фирмы начали использовать инструменты, которые заменяют эти дорогие передовые модели более дешевыми и доступными, включая китайские модели с открытым исходным кодом, такие как DeepSeek. В отчете The Wall Street Journal говорится, что расходы могут быть снижены до 95% за счет того, что агенты смогут переключаться между моделями ИИ по мере необходимости. «Вам не нужна модель, которая знает квантовую гравитацию», — сказал изданию Вишал Мисра, заместитель декана Колумбийского университета. «Эти модели с открытым исходным кодом очень мощные, и возможность взимать большую премию за ИИ будет снижаться». Фло Кривелло, основатель Lindy, стартапа, предоставляющего услуги ИИ-ассистентов для руководителей, также сообщил WSJ, что компания перешла на DeepSeek V4, поскольку она оказалась столь же способной, как Sonnet, при этом стоила в десять раз меньше. Хотя компания по-прежнему резервирует модели Anthropic для сложных задач, таких как кодирование, Кривелло заявил, что использование более дешевой модели «сэкономило компании миллионы долларов». Другие фирмы начали создавать собственный ИИ на основе моделей с открытым исходным кодом, адаптированных к их конкретным потребностям и обученных на внутренних данных. Хотя поначалу это может показаться сложным и дорогостоящим, в долгосрочной перспективе это может сэкономить компании средства, поскольку ей не придется полагаться на сторонних поставщиков для своих нужд в области ИИ. Некоторые даже утверждают, что это может превзойти передовые модели, поскольку они созданы для конкретных потребностей и приложений фирмы. Доступность более дешевых моделей и ИИ-агентов, оптимизирующих операционные расходы, используя более дорогие варианты только по мере необходимости, оказывает давление на OpenAI и Anthropic с целью снижения цен. Генеральный директор OpenAI Сэм Альтман обсуждал проблему растущих затрат на токены ИИ и заявил, что компания ищет способы помочь пользователям «получить больше ценности за меньшие расходы» при использовании ChatGPT.

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: