Instabilidade na Plataforma Neoway e APIs

Incident Report for Trillia B3

Postmortem

PROBLEMA

Durante o período, devido a instabilidades da Google Cloud com determinado tipo de instâncias e zona, bem como carga de transferência irregular entre provedores Cloud, Plataforma e API passaram por indisponibilidade e instabilidade.

PERÍODOS

  • Data início da instabilidade: 01/06/2026 15:44; 
  • Data início da indisponibilidade: 01/06/2026 15:45; 
  • Data término da indisponibilidade: 01/06/2026 15:51; 
  • Data término da instabilidade: 01/06/2026 16:20; 
  • Totais: 36 minutos de instabilidade sendo 6 minutos de indisponibilidade. 

IMPACTO

Indisponibilidade de meios de autenticação, autorização e navegação na Plataforma Neoway e utilização das suas APIs. 

CAUSA RAIZ

Durante o período do incidente, houve uma saturação no link de conectividade entre provedores Cloud, o que provocou um aumento abrupto e concentrado de tráfego na plataforma. Esse comportamento pressionou diretamente os serviços de autenticação e autorização, que passaram a operar sem recursos suficientes e, em seguida, ficaram indisponíveis.  

Em condições normais, o ambiente reagiria com escalonamento automático para recompor a capacidade. No entanto, no mesmo intervalo ocorreu uma instabilidade simultânea em instâncias e em uma zona do Google Cloud, o que comprometeu o funcionamento do escalonamento automático e atrasou a recuperação (automática) dos serviços.  

Em resumo, o incidente foi resultado da combinação de dois fatores no mesmo período: alta excepcional de tráfego causada por saturação de link entre Clouds e degradação de infraestrutura do provedor. Essa sobreposição reduziu a resiliência esperada do ambiente e elevou o tempo de normalização.

SOLUÇÃO

Com a atuação do time de engenharia, o tráfego foi estabilizado, a capacidade foi recomposta e os serviços foram restabelecidos de forma gradual e segura. 

AÇÕES FUTURAS

  • Reforço de capacidade em componentes críticos de autenticação/autorização; 
  • Ajustes finos no monitoramento de link entre provedores Cloud
  • Definir contrato para o uso do link entre provedores Cloud.
Posted Jun 08, 2026 - 20:11 GMT-03:00

Resolved

Não foi observada mais nenhuma instabilidade nas soluções, sendo assim estamos considerando este incidente como resolvido.
Posted Jun 01, 2026 - 19:07 GMT-03:00

Monitoring

As soluções já estão respondendo normalmente. Mesmo assim, continuamos monitorando para garantir a completa normalização.
Posted Jun 01, 2026 - 16:24 GMT-03:00

Identified

Nosso time já identificou a causa raiz do incidente. Estamos monitorando a situação de perto e atuando para garantir a normalização completa das soluções.
Posted Jun 01, 2026 - 16:20 GMT-03:00

Investigating

Estamos monitorando e investigando possíveis causas.
Posted Jun 01, 2026 - 16:14 GMT-03:00
This incident affected: Neoway | API and Neoway | Plataforma.