Шутка отсылает к вымышленному стартапу Pied Piper, который был в центре внимания телесериала HBO «Кремниевая долина», выходившего с 2014 по 2019 год.
Сериал рассказывал о том, как основатели стартапа ориентировались в технологической экосистеме, сталкиваясь с такими проблемами, как конкуренция со стороны крупных компаний, привлечение финансирования, технические и продуктовые вопросы, и даже (к нашему восторгу) поражая судей на вымышленной версии TechCrunch Disrupt.
Прорывная технология Pied Piper в сериале представляла собой алгоритм сжатия, который значительно уменьшал размеры файлов при почти сжатии без потерь. Новая разработка Google Research TurboQuant также связана с экстремальным сжатием без потери качества, но применяется к основному узкому месту в системах искусственного интеллекта. Отсюда и сравнения.
Google Research описала эту технологию как новый способ уменьшить рабочую память ИИ без ущерба для производительности. По словам исследователей, метод сжатия, использующий форму векторного квантования для устранения узких мест кэша при обработке ИИ, по сути, позволит ИИ запоминать больше информации, занимая при этом меньше места и сохраняя точность.
Они планируют представить свои результаты на конференции ICLR 2026 в следующем месяце, наряду с двумя методами, которые делают это сжатие возможным: методом квантования PolarQuant и методом обучения и оптимизации под названием QJL.
Понимание лежащей в основе математики, возможно, доступно исследователям и ученым-компьютерщикам, но результаты воодушевляют всю технологическую индустрию в целом.
В случае успешного внедрения в реальном мире TurboQuant может сделать работу ИИ дешевле за счет уменьшения его оперативной «рабочей памяти» — известной как KV-кэш — «как минимум в 6 раз».
Некоторые, например генеральный директор Cloudflare Мэттью Принс, даже называют это «моментом DeepSeek» от Google — отсылкой к повышению эффективности, обусловленному китайской моделью ИИ, которая обучалась за малую долю стоимости своих конкурентов на менее мощных чипах, при этом оставаясь конкурентоспособной по результатам.
Тем не менее, стоит отметить, что TurboQuant еще не получил широкого распространения; на данный момент это все еще лабораторный прорыв.
Это затрудняет сравнения с чем-то вроде DeepSeek или даже вымышленным Pied Piper. В сериале технология Pied Piper должна была радикально изменить правила вычислений. TurboQuant, в свою очередь, может привести к повышению эффективности и созданию систем, требующих меньше памяти при инференсе. Но это не обязательно решит более широкую проблему дефицита оперативной памяти, вызванного ИИ, поскольку технология нацелена только на память инференса, а не на обучение, которое продолжает требовать огромных объемов ОЗУ.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Sarah Perez




