Ontem (18), cerca de 20% dos sites que dependem da Cloudflare ficaram offline após uma instabilidade em larga escala na empresa — uma das maiores provedoras de DNS e CDN do mundo. Raras, mas de grande impacto, panes desse porte escancaram um problema antigo da arquitetura cliente-servidor: a dependência total de uma única plataforma para manter serviços no ar.
O apagão foi o pior desde 2019, confirmou o CEO Matthew Prince. A instabilidade começou às 8h20 (horário de Brasília) e só foi completamente resolvida cerca de cinco horas depois. Mesmo com milhares de servidores distribuídos globalmente e ampla redundância, a Cloudflare mostrou que ainda é vulnerável a falhas críticas capazes de derrubar parte significativa da internet.
O que aconteceu com a Cloudflare?
Em um comunicado publicado no mesmo dia, Prince explicou que a falha não teve relação com ciberataques ou qualquer atividade maliciosa. O problema veio de dentro: uma pane na infraestrutura da própria Cloudflare.
A instabilidade foi causada por uma mudança inesperada no ClickHouse, sistema interno de análise de dados. Uma consulta mal configurada passou a listar colunas duplicadas após alterações de permissões, o que fez o arquivo dobrar de tamanho. Quando o serviço corrompido foi carregado, o sistema de proxy entrou em colapso e começou a gerar erros HTTP 5xx — normalmente raríssimos.
Serviços como Workers KV e Cloudflare Access também caíram. Apenas clientes que não utilizavam a proteção anti-bot ficaram imunes ao apagão.
O impacto no mundo
A pane desencadeou um efeito cascata global. Serviços essenciais, plataformas de pagamento, provedores online, sites de conteúdo e até páginas da própria Cloudflare ficaram inacessíveis. Entre os afetados mais conhecidos estão o X (antigo Twitter) e o ChatGPT, da OpenAI.

“Dada a importância da Cloudflare no ecossistema da internet, qualquer interrupção em um dos nossos sistemas é inaceitável. O fato de ter havido um período em que nossa rede não conseguiu rotear tráfego é profundamente doloroso para cada membro da nossa equipe”, afirmou Prince.
Falha escancara problemas da infraestrutura da internet mundial
O incidente reforça uma fragilidade amplamente conhecida: depender de um único provedor de infraestrutura representa uma vulnerabilidade séria para qualquer empresa. Apesar das vantagens — como presença global, segurança robusta, escalabilidade e custos reduzidos — a centralização coloca todos os serviços sob o risco de um ponto único de falha.
“Essas plataformas são vastas, eficientes e usadas em praticamente todos os setores da vida moderna. A vantagem é óbvia […] No entanto, a desvantagem é igualmente clara: quando uma plataforma desse porte apresenta problemas, o impacto se espalha de forma rápida e ampla”, explica Fernando de Falchi, gerente de Engenharia de Segurança da Check Point Software Brasil.
A Cloudflare afirmou que implementará medidas para evitar problemas semelhantes. Elas são:
- Validação rigorosa de arquivos internos;
- Botões de emergência globais;
- Controle de relatórios de erro;
- Testes de cenários extremos.
Para os clientes, porém, fica o recado: diversificar provedores de entrega de conteúdo e infraestrutura é essencial para reduzir o risco de instabilidade e manter operações funcionando mesmo diante de falhas críticas.
Quer entender mais sobre infraestrutura, segurança digital e os bastidores da internet? Continue acompanhando as análises, explicações e atualizações completas no TecMundo.
