В последнее время много тревожных разговоров о том, что цены на ИИ стремительно растут. Разработчики тратят больше денег на обучение и запуск систем ИИ по мере усиления конкуренции и перегрузки электросетей. Клиенты, тем временем, раскошеливаются, чтобы получить доступ к новейшим моделям.
На этой неделе компания Anthropic, стремящаяся к историческому IPO, выпустила Fable 5 — урезанную версию секретной и предположительно чрезвычайно мощной Mythos. Fable 5 стоит вдвое дороже своего предшественника, Opus 4.8, хотя некоторые пользователи жалуются, что чрезмерно чувствительные механизмы безопасности делают ее фактически непригодной для использования в некоторых сценариях. По всей видимости, прислушиваясь к этим опасениям, OpenAI теперь рассматривает возможность значительного снижения цен, взимаемых за токены (базовую единицу измерения использования ИИ), как сообщила в четверг Wall Street Journalв своем отчете.
Для тех, кто не погружен глубоко в тонкости финансов ИИ, все это может показаться сбивающим с толку. Было бы крайне удобно, если бы существовал простой метод конвертации одного миллиона «входных токенов» для выполнения определенной задачи, но, к сожалению, это не так. Каждая задача требует своих вычислительных ресурсов, что для моделей с оплатой по мере использования означает, что пользователи будут платить разные суммы в зависимости от того, как они используют ИИ. Уровни подписки предлагают немного больше простоты, но эти планы имеют свои собственные условия и цены, которые различаются в зависимости от компании и модели.
Чтобы прояснить ситуацию, вот что вам нужно знать о моделях ценообразования трех самых мощных моделей в индустрии ИИ:
Fable 5
Начнем с последнего релиза Anthropic — знаменитой Fable 5.
Подписчики планов Claude Max, Pro, Team и корпоративных планов с оплатой за место могут использовать Fable 5 в рамках существующих лимитов токенов своего плана до 23 июня. Начиная с этой даты компания планирует перейти на модель оплаты по мере использования для всех пользователей Fable 5, что означает, что чем интенсивнее они используют модель, тем больше придется платить клиентам — независимо от того, на какой уровень подписки они оформлены.
Anthropic намерена восстановить обычные лимиты токенов по подписке для Fable «когда достаточные мощности позволят нам это сделать», согласно сообщению в блоге, опубликованному на этой неделе. Пока неясно, что произойдет с платными подписчиками Claude, которые не израсходовали весь свой лимит токенов до 23 июня; мы обратились в компанию за разъяснениями и обновим эту статью, как только узнаем больше.
Главное, что нужно помнить: Fable 5 потребляет больше токенов, чем предыдущие модели Anthropic. Так что, если вы сейчас платите 100 долларов в месяц за план Max 5x, вы продолжите платить ту же сумму, используя Fable, но есть большая вероятность, что вы быстрее достигнете лимита токенов.
Начиная с 23-го числа, всем пользователям придется платить 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов при использовании Fable.
Согласно распространенному арифметическому упрощению, один токен примерно соответствует четырем написанным словам; следовательно, требуется чертовски много текстовых запросов, чтобы набрать миллион токенов, а это значит, что вы можете получить большую пользу от 10 долларов, если используете Fable только для написания рабочих писем или генерации рецептов ужина. С другой стороны, если вам нужен ИИ только для этого, вы можете воспользоваться бесплатным чат-ботом: использование Fable для ответа на простые текстовые чаты сродни поездке на McLaren W1, чтобы доехать до дома соседа.
Fable 5 специализируется на длительных автономных задачах, таких как написание программного кода, что требует гораздо больше токенов — речь идет о сотнях тысяч или миллионах как для входов, так и для выходов. Ваш ежемесячный счет будет значительно выше, чем если бы вы просто отправляли модели простые текстовые запросы. Но если вы уже платите, скажем, 200 долларов в месяц за план Max 20x, вы можете не платить намного больше за кредиты на использование, чем платите сейчас: использование 10 миллионов входных токенов и 5 миллионов выходных токенов приведет к счету в 350 долларов (($10 x 10) + ($50 x 5)).
Иными словами, стоимость использования Fable 5 будет полностью зависеть от требований задач, для которых вы используете модель — это, конечно, основа модели оплаты по мере использования. Если вы склонны поручать моделям сложные задачи, требующие многих шагов и длительного времени, действуйте с осторожностью.
GPT-5.5 Pro
Выпущенная в апреле, GPT-5.5 Pro — это новейшая модель, лежащая в основе ChatGPT. Она доступна через план Pro от OpenAI (стоимостью 200 долларов в месяц), а также в уровнях Business (30 долларов на пользователя в месяц) и Enterprise (индивидуальное ценообразование) компании.
Разработчики, использующие GPT-5.5 через API OpenAI, напротив, оплачивают услуги по модели pay-as-you-go, аналогичной той, что начнет действовать для Fable в этом месяце. При цене 5 долларов за миллион входных токенов и 30 долларов за миллион выходных токенов она значительно дешевле Fable (и лишь немного дороже второй по ценности общедоступной модели Anthropic, Opus 4.8). Она также поставляется с опцией пакетной токенизации со скидкой 50%, которая, по сути, позволяет серверам OpenAI обрабатывать пакеты схожих запросов в виде отдельных «пакетов», повышая вычислительную эффективность, но приводя к замедлению времени отклика.
Gemini 3.5 Flash
Google подчеркнула то, что она назвала уникальным сочетанием скорости и агентных возможностей в самой мощной версии Gemini — 3.5 Flash, которая вышла в прошлом месяце.
Она доступна бесплатно с ограничениями на использование, а разработчики могут создавать на основе API по цене 1,50 доллара за миллион входных токенов и 9 долларов за миллион выходных токенов — это, безусловно, самый доступный вариант из трех рассмотренных нами моделей.
Суть
Поскольку не существует стандартизированной общеотраслевой модели ценообразования для ИИ, существует и огромный разброс в преимуществах и недостатках каждой модели.
Для многих пользователей, которым нужен лишь чат-бот в качестве улучшенного поисковика, бесплатных версий Claude, ChatGPT или Gemini, вероятно, будет достаточно. Тем, чья работа требует более продвинутой модели, например, для кодирования или исследований, скорее всего, лучше подойдет платная подписка. Просто внимательно читайте мелкий шрифт, прежде чем сделать выбор, и следите за такими ключевыми фразами, как «лимиты использования» и «оплата по мере использования».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Webb Wright




