GitHub берет курс на «Availability First» из-за кризиса надежности на фоне бума AI-агентов

Github ии сбои масштабирование Azure neowin.net

После череды неудачных сбоев GitHub наконец прерывает молчание о том, что происходит за кулисами, и о своих планах на будущее. — neowin.net

GitHub остается доминирующей платформой для разработчиков, обладающей массивной экосистемой для хостинга кода, совместной работы и разработки с открытым исходным кодом. Даже после приобретения компанией Microsoft GitHub продолжал органически расти до прошлого года. Однако тенденция к использованию ИИ в кодировании начала ускорять использование GitHub в начале 2025 года. Позднее, когда ИИ-агенты стали мейнстримом среди разработчиков, GitHub продемонстрировал беспрецедентный рост использования.

В октябре 2025 года GitHub начал реализацию плана по увеличению мощностей в 10 раз для удовлетворения спроса. Однако к февралю 2026 года компания осознала, что ей необходимо готовиться к будущему, требующему масштаба в 30 раз больше сегодняшнего. Этот беспрецедентный рост вызвал серьезную нагрузку на надежность платформы. Фактически, за последние несколько месяцев у GitHub было несколько серьезных проблем, затронувших разработчиков, и несколько небольших сбоев.

Сегодня команда GitHub опубликовала сообщение в блоге с объяснением происходящего. Если кратко, они сейчас перерабатывают части своей инфраструктуры для повышения доступности, масштабируемости и отказоустойчивости. Разработка программного обеспечения на базе ИИ вызвала быстрый рост во всех аспектах: создании репозиториев, активности pull request, использовании API, автоматизации и нагрузках на большие репозитории. При их масштабе даже небольшая неэффективность в любой из подсистем со временем превратится в большую проблему.

Сбои распространены для сложных веб-сервисов, но проблемы GitHub достигли точки, когда пользователи начали открыто высказывать свое недовольство. Фактически, Митчелл Хашимото, разработчик Ghostly, сегодня опубликовал сообщение в блоге, заявив, что переводит Ghostly с GitHub из-за частых проблем с надежностью за последние месяцы.

Для решения таких проблем клиентов команда GitHub установила следующие приоритеты: сначала доступность, затем мощность и только потом новые функции. За последние несколько месяцев они внесли ряд улучшений для устранения различных узких мест. Кроме того, поскольку они перешли на Azure для части своих вычислительных потребностей, они смогли масштабироваться в зависимости от нагрузки. Для дальнейшего снижения влияния GitHub изолирует критически важные сервисы, такие как Git и GitHub Actions, от других рабочих нагрузок. GitHub также подтвердил, что работает над мультиоблачной архитектурой для повышения отказоустойчивости.

GitHub также поделился подробностями о двух недавних инцидентах. 23 апреля GitHub столкнулся с регрессией, затронувшей операции очереди слияния (merge queue). Компания сообщила, что во время инцидента пострадали 658 репозиториев и 2092 pull request. 27 апреля GitHub столкнулся с отдельным инцидентом, связанным с его подсистемой Elasticsearch. Компания все еще завершает анализ первопричин этого инцидента. GitHub заявил, что потери данных не было, и операции Git и API не пострадали. Однако части пользовательского интерфейса, зависящие от поиска, не отображали результатов, что вызвало значительные перебои для пользователей.

В заключение своего сообщения команда GitHub еще раз принесла извинения и заявила, что по-прежнему привержена повышению доступности, увеличению отказоустойчивости и улучшению информирования во время инцидентов и после них.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: