На этой неделе Snowflake выпустила обновление, которое вызвало «серьезный сбой» по всему миру, оставив многих пользователей неспособными выполнять запросы к данным, столкнувшись с ошибками при загрузке файлов и получая сообщения об ошибках в течение 13 часов, сообщила компания в своем заявлении о последствиях.
«Наше первоначальное расследование выявило, что в нашем последнем выпуске было представлено обратно несовместимое обновление схемы базы данных», — написала компания в своем отчете об инциденте. «В результате предыдущие пакеты выпуска ошибочно ссылались на обновленные поля, что привело к ошибкам несоответствия версий и вызвало сбои операций или потребовало длительного времени для их завершения».
Обновление затронуло 10 из 23 глобальных регионов Snowflake. В США сбой затронул ряд клиентов Snowflake, обращающихся к центрам обработки данных Azure в Вирджинии и центрам обработки данных AWS в Орегоне. По всему миру пострадали пользователи центров обработки данных Snowflake в Ирландии, Цюрихе, Лондоне, Швеции, Мумбаи, Сингапуре и Мексике.
О сбое впервые сообщили как о проблеме с Snowflake Data Cloud в 02:55 UTC во вторник, когда запросы клиентов к их данным возвращали ошибки выполнения SQL.
Примерно через полтора часа Snowflake заявила, что проблема выявлена и ведется работа над ее устранением. Системы были восстановлены к 05:00 UTC.
«Я столкнулся с этим вчера», — посетовал один из пользователей на странице Snowflake в Reddit. «Им потребовалось слишком много времени, чтобы откатить это изменение».
Компания заявила, что опубликует анализ первопричин в течение пяти дней после закрытия инцидента, то есть к воскресенью.
«На данный момент нам нечего добавить», — сообщил представитель The Register.
Это был второй инцидент Snowflake за неделю после проблемы с инфраструктурой базы данных 10 декабря, которая привела к снижению производительности у пользователей, использующих ее программное обеспечение из дата-центра AWS в Орегоне, согласно странице статуса.
Snowflake — не единственная платформа данных с проблемами в этом месяце.
С 11 по 13 декабря заклятый соперник Snowflake, Databricks, пережил многодневный сбой обслуживания, в ходе которого клиенты в нескольких регионах США испытывали задержки или ошибки при использовании Mosaic AI, помощника компании для создания ИИ-агентов. Проблема затрагивала только пользователей центров обработки данных Azure компании в семи регионах США.
Это произошло после того, как клиенты в регионе US Gov West AWS столкнулись с «полным сбоем, когда все сервисы Databricks считались недоступными» в течение примерно двух часов 3 декабря.
В отличие от Snowflake, которая указывает предварительную причину сбоев и публикует анализ первопричин на своей странице инцидентов, Databricks не публикует причины своих сбоев.
Databricks не ответила на электронное письмо The Register с просьбой о комментарии. ®
Автор – O'Ryan Johnson




