Сбои в работе Azure затронули множество зависимых сервисов Microsoft в сегменте off-prem

Azure Microsoft облачные сервисы сбои Managed Identity виртуальные машины

Сбои Managed Identity и виртуальных машин вызвали цепную реакцию проблем на облачной платформе Microsoft Azure.

Microsoft сообщила о двух сбоях в работе сервисов Azure за два дня: вчера произошло нарушение в управлении виртуальными машинами, а сегодня — сбой Managed Identity для ресурсов Azure в регионах East US и West US.

Согласно сообщению Microsoft, сегодняшний сбой Managed Identity для ресурсов Azure затронул регионы East US и West US и продлился почти шесть часов, с 00:15 до 06:05 UTC. Проблема возникла при попытках пользователей создавать, обновлять, удалять ресурсы или получать токены.

Уязвимости безопасности и системные простои часто возникают из-за ручного управления секретами и сертификатами. Managed Identity для ресурсов Azure призван снять с разработчиков бремя управления учетными данными.

Сбой, который уже устранен, «повлиял на зависимые сервисы, такие как Azure Synapse Analytics, Azure Databricks, Azure Stream Analytics, Azure Kubernetes Service, Microsoft Copilot Studio, Azure Chaos Studio, Azure Database for PostgreSQL Flexible Servers, Azure Container Apps и Azure AI Video Indexer». Так что проблем было немало.

Сбой произошел вскоре после другого инцидента, когда операции управления службами для виртуальных машин приводили к уведомлениям об ошибках. Microsoft привела примеры: «создание, удаление, обновление, масштабирование, запуск, остановка».

Как и при утреннем простое, вчерашняя проблема усугублялась тем, что службы зависели от этих операций, включая Azure Arc Enabled Servers, Azure Batch, Azure Cache for Redis, Azure Container Apps, Azure DevOps (ADO), Azure Kubernetes Service (AKS), Azure Backup, Azure Load Testing, Azure Firewall, Azure Search, Azure Virtual Machine Scale Sets (VMSS) и GitHub.

Microsoft признала проблему вчера вечером в 19:46 UTC, но не предоставила сроков устранения. The Register запросил дополнительные сведения и обновит эту статью, если компания отреагирует.

GitHub отметил снижение производительности Actions в 19:03 UTC, и только к 00:56 UTC 3 февраля сервис сообщил о разрешении инцидента.

Что касается причины сбоя виртуальных машин, Microsoft заявила: «Мы определили коренную причину как изменение конфигурации, которое непреднамеренно ограничило публичный доступ к определенным учетным записям хранения, управляемым Microsoft и используемым для размещения пакетов расширений виртуальных машин».

Да, Microsoft внесла изменение в конфигурацию, которое непреднамеренно нарушило работу разработчиков в нескольких регионах. У этих же разработчиков, вероятно, нашлись бы советы для Microsoft по тестированию изменений перед развертыванием в производственной среде.

Проблемы подчеркивают взаимозависимость облачных сервисов. Неправильное изменение конфигурации в одном месте может привести к каскаду проблем в других местах. ®

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

В тренде:


Похожие новости: