A recente experiência da Authress durante a queda da AWS em outubro de 2025 trouxe à tona um assunto muito importante: a resiliência na arquitretura de software. Como um arquiteto de software, sempre acreditei que a capacidade de um sistema de se manter operante em situações adversas é fundamental para qualquer negócio que dependa da tecnologia. E, convenhamos, quem não depende hoje em dia?

Entendendo a Resiliência na Arquitetura

A resiliência, em termos de software, refere-se à habilidade de um sistema de continuar funcionando mesmo diante de falhas. O caso da Authress é uma excelente ilustração de como uma boa estratégia pode mitigar os impactos de uma queda catastrófica de infraestrutura. O CTO da empresa, Warren Parad, detalhou como eles implementaram um design focado em confiabilidade e como isso os ajudou a cumprir seus compromissos de SLA durante um dos piores incidentes da última década.

Estratégias utilizadas pela Authress

Para garantir a continuidade dos serviços, a Authress optou por uma arquitetura de multi-região e minimizou a dependência dos serviços do plano de controle da AWS. Um dos pilares dessa estratégia é o uso de DNS dinâmico para roteamento de tráfego. Isso significa que, em caso de falha, o sistema automaticamente redireciona as requisições para uma região de backup. Legal, né?

Além disso, a detecção rápida de incidentes é crucial. Em vez de confiar nos checadores de saúde padrão da AWS, eles desenvolveram uma solução personalizada que monitora a saúde das bases de dados e do sistema de autorização em tempo real. Isso permite que eles identifiquem problemas de forma mais eficaz e troquem o tráfego conforme necessário.

Dicas para Construir Sistemas Resilientes

A partir da experiência da Authress, aqui estão algumas dicas avançadas para você que quer garantir a resiliência do seu sistema:

Reflexões Finais

Quando se trata de arquitetura de software, a resiliência não deve ser uma opção, mas uma prioriade.. O que vimos com a Authress é apenas um lembrete de que, independentemente de quão confiável seja sua infraestrutura, sempre haverá a possibilidade de falhas. Por isso, investir em uma arquitetura resiliente pode ser a diferença entre a continuidade do seu negócio ou uma queda catastrófica. E, como sempre digo, “prevenir é melhor que remediar”. Então, se você ainda não começou a pensar nisso, é hora de agir!