Uma das frases que mais temos repetido ao longo dos anos aqui no Diolinux é que nenhum software está livre da possibilidade de bugs, nem mesmo aqueles utilizados pelos mais qualificados profissionais responsáveis por manter os serviços do Facebook online.

Na segunda-feira, 4 de outubro de 2021, todos os serviços providos pelo Facebook, incluindo o Instagram e o WhatsApp ficaram fora de funcionamento por cerca de seis horas. Além de ter sido um inconveniente para milhões de usuários ao redor do mundo, o ocorrido também se tornou uma enorme “dor de cabeça” para os funcionários da empresa e um golpe na conta bancária de Mark Zuckerberg.

Era tudo rotina, até que…

O número de instalações que compõem a infraestrutura do Facebook é gigantesca, e, naturalmente, diariamente partes específicas desse grande conglomerado têm que ser desativadas para procedimentos rotineiros de manutenção ou upgrade de hardware.

Foi exatamente em um desses programas de manutenção que tudo veio abaixo.

O que aconteceu com o Facebook?

O que à princípio era apenas mais um dia de trabalho, um dos profissionais responsáveis pela manutenção do Facebook rodou um comando com a intenção de avaliar o quão próximo da sua capacidade máxima aquela determinada infraestrutura estava trabalhando.

Rodar esse comando fez com que, não intencionalmente, todos os centros de dados que formam a parte principal da “network” do Facebook perdessem a conexão entre si e com a internet como um todo.

Por que aconteceu?

Até mesmo nós, leigos, sabemos que uma rede tão complexa quanto a do Facebook jamais deveria ser completamente derrubada por um erro de uma pessoa ao rodar um único comando.

E nós não estamos errados!

Os sistemas utilizados pelo Facebook são desenhados para auditar todos os comandos inseridos pelos seus utilizadores, o que em uma situação normal resolveria todo o problema antes mesmo dele começar. Porém, um bug nesta ferramenta de auditoria fez com que a mesma fosse incapaz de impedir a execução do comando.

A reação em cadeia dos “bugs”

Como “desgraça pouca é bobagem”, a queda dos “data centers” causou uma reação em cadeia que resultou em um mau funcionamento no sistema de DNS do Facebook. Isso fez com que todas as ferramentas que a equipe normalmente utilizaria para resolver os problemas em uma situação como essa também parassem de funcionar.

Como consequência do problema com o sistema de DNS, que foi um sintoma causado pela queda dos servidores, equipes tiveram que ser enviadas a todos os “data centers” afetados, já que acesso físico aos servidores era a única opção restante.

O obstáculo da segurança

Dentre esses obstáculos encontra-se o alto nível de segurança física e virtual aplicada nesses “data centers”. Tais instalações foram construídas para que, mesmo com acesso físico ao local, os hardwares e softwares sejam difíceis de serem modificados.

Embora nessa altura todos os problemas já houvessem sido identificados, tais obstáculos dificultaram bastante a vida das equipes e consequentemente aumentaram consideravelmente o tempo necessário para a realização dos devidos reparos.

Um prejuízo de 1 bilhão de dólares por hora

Segundo o que foi apurado pelo site Bloomberg, a queda nos serviços do Facebook fez com que Mark Zuckerberg perdesse cerca de 6 bilhões de dólares ao longo das 6 horas em que o Facebook ficou fora do ar, caindo do quarto para o quinto lugar no ranking das pessoas mais ricas do mundo.

facebook
Gráfico mostrando o ranking das cinco pessoas mais ricas do mundo.

A fortuna do criador do Facebook atualmente encontra-se avaliada em “míseros” 121.6 bilhões de dólares, logo atrás de Bill Gates com os seus 124 bilhões.

Nada é tão bom que não possa falhar

Seja por um erro humano ao rodar o comando errado ou um pequeno erro no código-fonte de um software, eventos como este provam que mesmo as equipes mais bem treinadas trabalhando com os melhores softwares e hardwares que o dinheiro pode comprar ainda estão sujeitas a falhas.

Isso coloca sob uma nova perspectiva o trabalho fantástico de desenvolvedores que criam e distribuem softwares de maneira gratuita, investindo o seu tempo e conhecimento em projetos que muitas vezes sobrevivem apenas de doações, para frequentemente terem que ouvir pessoas apenas reclamando de bugs e em nada contribuindo para o crescimento do mesmo.

Isso é tudo pessoal! 😉


Newsletter Diolinux
Talvez Você Também Goste