Home Variedade Apagão no Azure: Microsoft explica o que derrubou serviços no mundo todo

Apagão no Azure: Microsoft explica o que derrubou serviços no mundo todo

by Fesouza
5 minutes read

A Microsoft detalhou o que causou o apagão global que tirou do ar o Azure, seu serviço de computação em nuvem, na quarta-feira (29). O problema, que durou cerca de oito horas, foi provocado por uma mudança feita por engano numa configuração interna do Azure Front Door (sistema que distribui o tráfego entre servidores da empresa no mundo todo).

A falha afetou uma série de produtos e serviços da companhia, como o Microsoft 365, o Xbox e o Copilot para Segurança, além de clientes corporativos que dependem do Azure para manter seus sistemas online. A empresa diz que o serviço foi restaurado ainda na noite de quarta, após um processo de recuperação gradual que exigiu reconfigurar e reequilibrar milhares de servidores.

Erro humano e falha de software provocaram o apagão

Segundo a própria Microsoft, o problema começou com uma alteração de configuração aplicada por engano no Azure Front Door. Esse sistema faz o roteamento e entrega de dados entre as redes da empresa. 

Essa mudança criou um estado inconsistente na infraestrutura global do serviço. Por conta disso, parte dos servidores deixou de responder, o que sobrecarregou os que ainda estavam ativos.

microsoft azure
Problema começou com uma alteração de configuração aplicada por engano no Azure Front Door, diz a Microsoft (Imagem: Ascannio/Shutterstock)

O sistema de segurança que deveria bloquear alterações incorretas também falhou. Um defeito de software permitiu que a configuração passasse pelas verificações internas sem ser barrada. 

O resultado foi uma interrupção em cadeia que afetou desde aplicações corporativas até produtos usados no dia a dia, como o Office e o Xbox.

Falha em cadeia e impacto global

O apagão começou às 12h45 (horário de Brasília) e se espalhou rapidamente, afetando serviços da própria Microsoft e de empresas que usam o Azure como base de suas operações. O problema foi sentido no mundo todo – de plataformas corporativas a jogos online.

Segundo o Downdetector, o pico de reclamações ultrapassou 18 mil registros no mundo e cerca de 700 no Brasil, concentrados em falhas de conexão, lentidão e dificuldade para acessar sites. 

Novos ícone do Microsoft 365 ficaram mais coloridos e modernos
O Microsoft 365 estava entre os serviços afetados pelo apagão no Azure (Imagem: Microsoft)

Entre os serviços da Microsoft afetados estavam o Microsoft 365, o Xbox, o Azure SQL Database e ferramentas corporativas como o Defender, o Purview e o Sentinel, usados em áreas de segurança e análise de dados.

O apagão também atingiu grandes companhias que dependem da nuvem da Microsoft. A Alaska Airlines e a Hawaiian Airlines relataram instabilidades em seus sites e aplicativos, enquanto o aeroporto de Heathrow, em Londres, e a Vodafone tiveram interrupções temporárias, segundo a Reuters.

Leia mais:

Cronologia e resposta da Microsoft

A Microsoft disse ter detectado o problema poucos minutos após o início do apagão. Assim que os alertas automáticos foram disparados, equipes de engenharia começaram a investigar o erro e bloquearam novas alterações no sistema para evitar que a falha se espalhasse. A recuperação foi feita de forma gradual e controlada, para não sobrecarregar os servidores que voltavam a operar.

Linha do tempo do incidente, segundo a Microsoft:

  • 12h45 (horário de Brasília): início da falha, com lentidão e erros de conexão em serviços que dependem do Azure;
  • 13h04: equipes internas são acionadas após alertas automáticos;
  • 14h26: o portal do Azure é removido do sistema Front Door para reduzir o impacto;
  • 14h30: bloqueio de novas configurações e início da reversão para a última versão estável da rede;
  • 15h30: início da implantação global da configuração corrigida e do reequilíbrio de tráfego entre servidores.
  • 18h40: Microsoft registra 98% de disponibilidade global, com recuperação gradual.
  • 21h05: normalização completa confirmada para a maioria dos clientes.

A companhia afirma que manteve comunicação constante com clientes corporativos por meio da ferramenta Azure Service Health. E que vai publicar um relatório final dentro de 14 dias, com mais detalhes sobre o incidente.

O post Apagão no Azure: Microsoft explica o que derrubou serviços no mundo todo apareceu primeiro em Olhar Digital.

You may also like

Leave a Comment