Latence = temps de demande → temps de réponse (ms). Moins c'est mieux—mais le véritable méchant est la latence de queue : ces pics lents occasionnels 😫 Lorsque la latence fluctue, les applications semblent instables, les nouvelles tentatives s'accumulent et l'infrastructure devient plus bruyante sous charge.