Apagão no Azure: Microsoft explica o que derrubou serviços no mundo todo

A Microsoft detalhou o que causou o apagão global que tirou do ar o Azure, seu serviço de computação em nuvem, na quarta-feira (29). O problema, que durou cerca de oito horas, foi provocado por uma mudança feita por engano numa configuração interna do Azure Front Door (sistema que distribui o tráfego entre servidores da empresa no mundo todo).

A falha afetou uma série de produtos e serviços da companhia, como o Microsoft 365, o Xbox e o Copilot para Segurança, além de clientes corporativos que dependem do Azure para manter seus sistemas online. A empresa diz que o serviço foi restaurado ainda na noite de quarta, após um processo de recuperação gradual que exigiu reconfigurar e reequilibrar milhares de servidores.

Erro humano e falha de software provocaram o apagão

Segundo a própria Microsoft, o problema começou com uma alteração de configuração aplicada por engano no Azure Front Door. Esse sistema faz o roteamento e entrega de dados entre as redes da empresa. 

Essa mudança criou um estado inconsistente na infraestrutura global do serviço. Por conta disso, parte dos servidores deixou de responder, o que sobrecarregou os que ainda estavam ativos.

Problema começou com uma alteração de configuração aplicada por engano no Azure Front Door, diz a Microsoft (Imagem: Ascannio/Shutterstock)

O sistema de segurança que deveria bloquear alterações incorretas também falhou. Um defeito de software permitiu que a configuração passasse pelas verificações internas sem ser barrada. 

O resultado foi uma interrupção em cadeia que afetou desde aplicações corporativas até produtos usados no dia a dia, como o Office e o Xbox.

Falha em cadeia e impacto global

O apagão começou às 12h45 (horário de Brasília) e se espalhou rapidamente, afetando serviços da própria Microsoft e de empresas que usam o Azure como base de suas operações. O problema foi sentido no mundo todo – de plataformas corporativas a jogos online.

Segundo o Downdetector, o pico de reclamações ultrapassou 18 mil registros no mundo e cerca de 700 no Brasil, concentrados em falhas de conexão, lentidão e dificuldade para acessar sites. 

O Microsoft 365 estava entre os serviços afetados pelo apagão no Azure (Imagem: Microsoft)

Entre os serviços da Microsoft afetados estavam o Microsoft 365, o Xbox, o Azure SQL Database e ferramentas corporativas como o Defender, o Purview e o Sentinel, usados em áreas de segurança e análise de dados.

O apagão também atingiu grandes companhias que dependem da nuvem da Microsoft. A Alaska Airlines e a Hawaiian Airlines relataram instabilidades em seus sites e aplicativos, enquanto o aeroporto de Heathrow, em Londres, e a Vodafone tiveram interrupções temporárias, segundo a Reuters.

Leia mais:

Cronologia e resposta da Microsoft

A Microsoft disse ter detectado o problema poucos minutos após o início do apagão. Assim que os alertas automáticos foram disparados, equipes de engenharia começaram a investigar o erro e bloquearam novas alterações no sistema para evitar que a falha se espalhasse. A recuperação foi feita de forma gradual e controlada, para não sobrecarregar os servidores que voltavam a operar.

Linha do tempo do incidente, segundo a Microsoft:

  • 12h45 (horário de Brasília): início da falha, com lentidão e erros de conexão em serviços que dependem do Azure;
  • 13h04: equipes internas são acionadas após alertas automáticos;
  • 14h26: o portal do Azure é removido do sistema Front Door para reduzir o impacto;
  • 14h30: bloqueio de novas configurações e início da reversão para a última versão estável da rede;
  • 15h30: início da implantação global da configuração corrigida e do reequilíbrio de tráfego entre servidores.
  • 18h40: Microsoft registra 98% de disponibilidade global, com recuperação gradual.
  • 21h05: normalização completa confirmada para a maioria dos clientes.

A companhia afirma que manteve comunicação constante com clientes corporativos por meio da ferramenta Azure Service Health. E que vai publicar um relatório final dentro de 14 dias, com mais detalhes sobre o incidente.

O post Apagão no Azure: Microsoft explica o que derrubou serviços no mundo todo apareceu primeiro em Olhar Digital.

Related posts

China aprova acordo do TikTok, afirma secretário do Tesouro dos EUA

Astronauta mais jovem da China será lançado junto com ratos ao espaço

WhatsApp vai adicionar nova opção de segurança para usuários; veja como usar