Обновление Snowflake вызвало по всему миру лавину сбоев

snowflake,сбой,обновление по,data cloud,databricks,облачные сервисы

Крупный сбой Snowflake: обновление ПО привело к 13-часовому простою в 10 регионах. Клиенты столкнулись с ошибками при выполнении запросов и загрузке данных. Компания обещает опубликовать анализ причин сбоя.

На этой неделе Snowflake выпустила обновление, которое вызвало «серьезный сбой» по всему миру, оставив многих пользователей неспособными выполнять запросы к данным, столкнувшись с ошибками при загрузке файлов и получая сообщения об ошибках в течение 13 часов, сообщила компания в своем заявлении о последствиях.

«Наше первоначальное расследование выявило, что в нашем последнем выпуске было представлено обратно несовместимое обновление схемы базы данных», — написала компания в своем отчете об инциденте. «В результате предыдущие пакеты выпуска ошибочно ссылались на обновленные поля, что привело к ошибкам несоответствия версий и вызвало сбои операций или потребовало длительного времени для их завершения».

Обновление затронуло 10 из 23 глобальных регионов Snowflake. В США сбой затронул ряд клиентов Snowflake, обращающихся к центрам обработки данных Azure в Вирджинии и центрам обработки данных AWS в Орегоне. По всему миру пострадали пользователи центров обработки данных Snowflake в Ирландии, Цюрихе, Лондоне, Швеции, Мумбаи, Сингапуре и Мексике.

О сбое впервые сообщили как о проблеме с Snowflake Data Cloud в 02:55 UTC во вторник, когда запросы клиентов к их данным возвращали ошибки выполнения SQL.

Примерно через полтора часа Snowflake заявила, что проблема выявлена и ведется работа над ее устранением. Системы были восстановлены к 05:00 UTC.

«Я столкнулся с этим вчера», — посетовал один из пользователей на странице Snowflake в Reddit. «Им потребовалось слишком много времени, чтобы откатить это изменение».

Компания заявила, что опубликует анализ первопричин в течение пяти дней после закрытия инцидента, то есть к воскресенью.

«На данный момент нам нечего добавить», — сообщил представитель The Register.

Это был второй инцидент Snowflake за неделю после проблемы с инфраструктурой базы данных 10 декабря, которая привела к снижению производительности у пользователей, использующих ее программное обеспечение из дата-центра AWS в Орегоне, согласно странице статуса.

Snowflake — не единственная платформа данных с проблемами в этом месяце.

С 11 по 13 декабря заклятый соперник Snowflake, Databricks, пережил многодневный сбой обслуживания, в ходе которого клиенты в нескольких регионах США испытывали задержки или ошибки при использовании Mosaic AI, помощника компании для создания ИИ-агентов. Проблема затрагивала только пользователей центров обработки данных Azure компании в семи регионах США.

Это произошло после того, как клиенты в регионе US Gov West AWS столкнулись с «полным сбоем, когда все сервисы Databricks считались недоступными» в течение примерно двух часов 3 декабря.

В отличие от Snowflake, которая указывает предварительную причину сбоев и публикует анализ первопричин на своей странице инцидентов, Databricks не публикует причины своих сбоев.

Databricks не ответила на электронное письмо The Register с просьбой о комментарии. ®