Vazamento GPT-5.4: contexto de token de 2M + estado persistente = explosão do cache KV Esta é a Memória Wars em tempo real HBM para pesos. SRAM para inferência crítica de latência. Interconexões ópticas para vincular tudo A bifurcação sobre a qual venho escrevendo não é mais teórica.