O que une Greggs, fabricante dos rolos de salsicha mais populares da Grã-Bretanha, e os gigantes da tecnologia Apple e Meta?
Em março e abril de 2024, todos nós passamos por interrupções de TI que fizeram com que os clientes tivessem dificuldade para acessar alguns serviços, desde produtos assados a Big Macs e mensagens do WhatsApp.
Coincidência? Especialistas dizem que essas interrupções de energia estão acontecendo com mais frequência.
Incidentes recentes de grande repercussão colocaram um site específico no centro das atenções.
Downdetector é uma plataforma de monitoramento de interrupções na web. Esses dados dirão a extensão dos problemas que as empresas enfrentam atualmente.
O site informou que até 3 de abril havia mais de 1,75 milhão de problemas relatados por usuários do WhatsApp em todo o mundo.
Também houve dezenas de milhares de reportagens na App Store e na Apple TV.
Nenhuma das empresas respondeu às perguntas da BBC sobre a causa da falha.
Mas Brennen Smith, vice-presidente de tecnologia da Ookla, empresa controladora do Downdetector, disse que incidentes como esse resultam em mais interrupções e o número de relatórios de usuários aumenta cada vez que ocorrem.
“A internet não é exatamente estável”, disse ele à BBC.
Para entender o porquê, precisamos entender um pouco mais sobre a própria Internet.
Assim como o software, ele é composto de muitas camadas. E novas camadas são adicionadas cada vez que os reguladores exigem mudanças de plataforma, os consumidores exigem acesso contínuo aos dados e os investidores procuram novos recursos como os chatbots de IA.
A introdução de mais camadas e complexidade aumenta o risco de ocorrência de problemas.
“Estas empresas gigantescas estão agora a ser solicitadas a incorporar tecnologias novas e altamente inovadoras nos seus produtos e serviços”, disse Smith.
“Acho que veremos as empresas de tecnologia começarem a se mover mais rapidamente porque há muita inovação acontecendo agora.” [but] Existe o risco de coisas potencialmente prejudiciais. ”
Peças móveis e enxames rugindo
Outra coisa a ter em mente sobre a Internet é que existem muitos fatores diferentes que podem causar seu colapso. Tipos de código, falhas de hardware, quedas de energia e ataques cibernéticos são apenas alguns dos motivos pelos quais o serviço pode estar fora de serviço.
O clima severo, como ondas de calor, tempestades e desastres naturais, também pode afetar os data centers, as salas gigantes que abrigam computadores poderosos, conhecidos como servidores, dos quais dependem os serviços online.
“Há muitas peças móveis, por isso, se uma delas der errado, poderá causar problemas”, disse Sam Kirkman, da empresa de segurança cibernética NetSPI.
Outra questão é que, na última década, muitas empresas passaram do gerenciamento interno de servidores e infraestrutura para o gerenciamento na nuvem.
Kirkman disse à BBC que isso permitiu que essas empresas fossem “mais rápidas do que nunca”. Mas também significa que uma única interrupção em um local com um provedor de serviços em nuvem pode afetar “muitas plataformas, tecnologias e empresas das quais dependemos hoje”.
Algumas das maiores empresas do setor, incluindo Amazon Web Services (AWS), Microsoft Azure e Google Cloud, enfrentaram falhas que causaram tempo de inatividade para milhares de clientes.
Provedores pequenos, mas altamente confiáveis, como Fastly e Cloudflare, também estão tendo um efeito cascata em seus serviços.
O portal do governo do Reino Unido gov.uk foi uma das principais plataformas colocadas offline quando o Fastly enfrentou um problema em junho de 2021.
Picos repentinos na demanda por seus serviços podem resultar em interrupções longas e complexas, especialmente durante eventos de alto tráfego, como a Black Friday, ou períodos de baixo volume, como feriados e fins de semana.
A teoria de que há mais cortes de energia às sextas-feiras do que em qualquer outro dia da semana pode ser apenas especulação, disse Smith.
No entanto, ele observa que muitas empresas têm uma política de não distribuir atualizações ou alterações.
“Há menos pessoas tocando em teclados, menos pessoas olhando para sistemas de vigilância. É um momento em que você não quer implementar mudanças”, diz ele.
As falhas de TI que afetaram a Nationwide, McDonald's e Sainsbury's ocorreram ou começaram em uma sexta-feira de março, mas acredita-se que as causas sejam diferentes.
De forma mais ampla, os engenheiros que tentam corrigir problemas e colocar os serviços online novamente durante uma interrupção também podem se deparar com um fluxo de usuários que tentam colocar as mãos no serviço.
A Cloudflare disse que encontrou um dos chamados “enxames de raios” durante uma interrupção causada por uma queda de energia no data center em novembro de 2023, quando um grande volume de solicitações inicialmente sobrecarregou o site de recuperação.
“Dívida técnica”
Subjacente a tudo isto está outra verdade fundamental do mundo online. Embora os serviços e produtos oferecidos sejam cada vez mais sofisticados, a sua arquitetura básica está muitas vezes muito desatualizada.
Em outras palavras, a Internet moderna depende de “uma arquitetura tecnológica muito antiga”, disse Kirkman.
Ele destaca o Border Gateway Protocol (BGP), um dos protocolos mais importantes da Internet que determina para onde vai o tráfego, como um bom exemplo do que ilustra a interrupção de seis horas do Meta em outubro de 2021.
A configuração incorreta de uma atualização do BGP pelo Facebook interrompeu efetivamente a comunicação com o resto da Internet.
E os utilizadores da plataforma também não conseguiam comunicar com as suas famílias ou gerir os seus negócios.
Kirkman disse que embora o BGP precise ser mantido, ele representa um desafio contínuo porque não pode ser facilmente atualizado e uma configuração menor pode derrubar toda a plataforma.
Isto realça que, segundo ele, algumas pessoas podem pensar na “dívida técnica” como uma questão que pode afectar a Internet como um todo.
Estas questões não são novas. Mas a crescente dependência de serviços online significa que eles são um desafio maior do que nunca para as empresas que tentam bloqueá-los.
“O que realmente estamos vendo é que as pessoas estão se tornando cada vez mais conscientes”, disse Smith.
“Agora, mais do que nunca, é fundamental que os serviços permaneçam online e resilientes para trazer novas inovações e funcionalidades ao mercado”, acrescentou.

