Latência = tempo de resposta → solicitação (ms). Quanto mais baixo, melhor—mas o verdadeiro vilão é a latência da cauda: aqueles picos 😫 lentos ocasionais Quando a latência oscila, os apps ficam instáveis, as tentativas se acumulam e a infraestrutura fica mais barulhenta sob carga.