Когда платформы ИИ взимают ежемесячную плату, подписчики ожидают работы без досадных ограничений. Однако после анонсов продуктов на последней конференции I/O компания Google незаметно внедрила структурные изменения в бэкенде своих платных тарифов. Теперь платные пользователи Gemini Pro и Ultra сталкиваются с внезапными, жесткими лимитами использования, вызывающими недовольство.
Подписчики Google Gemini Pro выражают недовольство скрытыми новыми лимитами использования
Суть изменений заключается в изменении способа расчета использования платформы. Похоже, Google ввела сложную метрику отслеживания на основе вычислительной мощности. Вместо предоставления простого ежедневного лимита запросов новая система динамически оценивает сложность запроса пользователя, задействованные активные функции и историческую длину цепочки чата.
Как только подписчик исчерпывает свою квоту, строгая пятичасовая роллирующая блокировка отключает его от премиальной модели. Поскольку длинные диалоги требуют от ИИ повторного считывания обширных контекстных логов, обычные взаимодействия с обменом репликами истощают лимиты пользователей с беспрецедентной скоростью. Несколько подписчиков сообщили, что выполнение менее пяти последовательных запросов — например, обобщение одного документа, отладка кода или генерация изображения — исчерпало половину или более всей их пятичасовой квоты.
Настройки персонализации Google Gemini быстрее истощают лимит
Усугубляя ситуацию, пользователи на сабреддите GeminiAI обнаружили, что настройки персонализации платформы агрессивно сокращают доступный лимит использования при их включении. Более того, создатели, использующие продвинутую модель Gemini Omni для генерации медиа, отметили, что компиляция менее пяти видео полностью обнулила их премиальную квоту Ultra (об этом сообщило издание Piunikaweb).
Переход оказался хаотичным для экосистемы разработчиков. Он совпал с широко распространенными сбоями в работе сервиса, такими как «Ошибка 253» в Google Flow и нарушающее работу обновление Antigravity 2.0. Что еще хуже, пользователи жалуются, что при высокой нагрузке на инфраструктуру платформа автоматически понижает качество обслуживания до более быстрой модели Flash, даже если они специально выбрали Pro. Сталкивались ли вы когда-либо с сообщениями об ошибках из-за перегрузки серверов? Так вот, даже эти неудачные попытки генерации засчитываются в квоты как выполненные запросы.
Затягивание поясов в отрасли
Google не одинок в корректировке своей премиальной инфраструктуры. Конкуренты, такие как Anthropic, давно используют пятичасовые окна, требующие от пользователей постоянно фрагментировать задачи на отдельные окна чата для экономии токенов. Аналогичным образом, xAI недавно без предупреждения ограничила доступ для своих подписчиков Grok, вызвав расплывчатое обещание Илона Маска повысить лимиты в будущем. Пользователи Perplexity также недавно жаловались на схожие ситуации.
Однако отсутствие четкой, прямой коммуникации со стороны Google вызывает разочарование. Компания внедрила раздел «Использование» с идеей, что пользователи смогут точно отслеживать свою квоту ИИ. Но вместо того, чтобы внести ясность, ситуация вызывает еще больше путаницы в том, сколько вы можете использовать свой ИИ.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Jean Leon




