Утечка GPT-5.4: 2M токенов контекста + постоянное состояние = взрыв KV кеша Это Войны Памяти в реальном времени HBM для весов. SRAM для критически важных по задержке выводов. Оптические соединения, чтобы связать это все Разделение, о котором я писал, больше не теоретическое.