Google Gemini забывает ваши переписки слишком быстро: жалуются платные пользователи

Google Gemini ии контекстное окно токены амнезия androidheadlines.com

Платные подписчики Gemini от Google сообщают об амнезии: чат-бот забывает инструкции задолго до достижения обещанного лимита в миллион токенов, в то время как в AI Studio лимит работает корректно. — androidheadlines.com

Платные подписки Google на ИИ обещают более высокие лимиты использования, более умные модели и огромное «контекстное окно», которое служит памятью чат-бота. По заявлению компании, подписчики тарифов Pro и Ultra должны получить доступ к огромному порогу до одного миллиона токенов. На бумаге это позволяет ИИ обрабатывать примерно 1500 страниц текста или 30 000 строк кода за один проход. Однако недавние жалобы от платных подписчиков Gemini указывают на значительный разрыв в памяти между маркетинговыми заявлениями Google и способностью чат-бота «помнить».

Лимит контекстного окна Gemini, вызывающий амнезию чата

Как сообщает Android Authority, пользователи обнаруживают, что реальные возможности чат-бота резко снижаются во время активных бесед. В то время как внутренняя система может успешно принять огромный статический файл при первом же запросе, динамическая память, необходимая для поддержания текущего диалога, по-видимому, сталкивается с серьезным искусственным узким местом.

Пользователь X под ником @Soso_fun_yt подробно задокументировал проблему. Он подчеркнул, что активная память разговора сокращается до жесткого лимита примерно в 16 000 токенов. Проще говоря, это дает в среднем всего 25–30 сообщений, прежде чем система поддастся искусственной амнезии. Как только Gemini достигает этого барьера, он полностью сбивает сессию, забывая предыдущие параметры. Сообщается, что помощник отбрасывает ранее использованные блоки кода, игнорируя конкретные структурные ограничения, установленные в начале разговора.

Интересно, что другие пользователи на Reddit отметили странный двойной стандарт в экосистеме Google. В то время как чат-бот, ориентированный на потребителей, страдает от этой серьезной потери памяти, заявленное миллион-токеновое контекстное окно, как сообщается, безупречно работает в Google AI Studio — платформе, предназначенной в первую очередь для разработчиков.

Необходимость прозрачности

Этот резкий контраст поднимает серьезные вопросы о прозрачности. В настоящее время маркетинг Google создает впечатление, что вся ваша история чата может хранить огромную библиотеку данных. Однако, похоже, компания не сообщает четко, что активный буфер разговора сильно ограничен. Это очень напоминает интернет-провайдера, рекламирующего молниеносную скорость загрузки, скрывая при этом медленную скорость отдачи в мелком шрифте.

Google предлагает подробную техническую документацию относительно пороговых значений ввода и вывода на своих порталах для разработчиков. Тем не менее, компания остается расплывчатой в отношении того, как эти метрики соотносятся со стандартными мобильными и настольными чат-приложениями. Представители СМИ официально обратились к Google с просьбой прояснить это расхождение в токенах и узнать, планируют ли они внедрить более четкие предупреждения в пользовательском интерфейсе для пользователей. Пока исправление не выйдет или Google не уточнит границы, вам, возможно, стоит разбивать свои масштабные проекты по кодированию и написанию текстов на гораздо более короткие, изолированные сеансы чата.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: