Latência = tempo de pedido → resposta (ms). Menor é melhor—mas o verdadeiro vilão é a latência de cauda: aqueles picos lentos ocasionais 😫 Quando a latência oscila, as aplicações parecem instáveis, as tentativas se acumulam e a infraestrutura fica mais barulhenta sob carga.