K-significa é simples. Tornar rápido em GPUs não é. Por isso construímos o Flash-KMeans — uma implementação consciente de IO de k-means exatos que repensa o algoritmo em torno dos gargalos modernos da GPU. Ao atacar diretamente os gargalos de memória, o Flash-KMeans alcança 30x de aceleração sobre o cuML e 200x sobre o FAISS — com exatamente o mesmo algoritmo, só que projetado para o hardware atual. Na escala milionária, os Flash-KMeans podem completar uma iteração k-means em milissegundos. Um algoritmo clássico — redesenhado para GPUs modernas. Papel: Código: