Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
A Parte I da nossa Trilogia zkVM defendeu a substituição do HAL por uma arquitetura de prova orientada a grafos.
Agora aqui estão os dados. Avaliámos o Venus – o nosso backend orientado a grafos no ZisK – em GPU e FPGA, e revisitámos a nossa tese original sobre hardware ZK.
Aqui está o que os números mostram. 🧵

2/ O graph-first proporciona ganhos mensuráveis em GPUs.
Sob o HAL, os kernels são lançados sequencialmente.
Com o cudaGraph, capturamos e reproduzimos todo o fluxo de prova como um gráfico agendado. Isso reduz a sobrecarga de lançamento da CPU e diminui a oscilação de sincronização host↔dispositivo, especialmente em fases iterativas como a verificação de soma.
Resultados abaixo (comparando com ZisK 0.15).

3/ Também testámos FPGA em dois dispositivos: VU47P (classe F2 da AWS) e VH1782 (classe V80 da AMD).
Tempo de relógio da GPU medido: ~47.8s
FPGA (estimado por HLS): ~335–404s
Nota: os tempos da GPU são medidos; os tempos da FPGA são estimados a partir da latência de síntese ÷ Fmax. Não é uma comparação direta, mas é claramente direcional.
Diferença por chip: ~7–8×, em grande parte devido aos limites de frequência da FPGA (74–98 MHz).
Nem o desempenho bruto nem o desempenho/watt justificam a substituição da GPU pela FPGA hoje.
4/ Mas "FPGA é mais lento" não é a conclusão.
O trabalho com FPGA forçou definições precisas de layouts de memória, contratos de interface e dependências entre estágios de prova. Exatamente a base que você precisa antes de projetar um ASIC.
FPGA é a ponte de prototipagem de gráfico para hardware.
5/ Porque o provador é um grafo de computação, a mesma lógica compila para qualquer backend:
GPU → núcleos cudaGraph
FPGA → módulos de fluxo de dados
ASIC → blocos de computação fixos
Apenas o backend muda. O grafo permanece o mesmo.
6/ GPU → FPGA → ASIC é, portanto, uma evolução coerente.
Implantamos GPU com configurações otimizadas para a Venus para extrair desempenho estável e crescente.
Embora o FPGA não seja competitivo em termos de desempenho, ele confirma a correção estrutural da nossa direção de hardware.
A arquitetura orientada a gráficos é a ponte que permite a otimização a nível de gráfico cuda hoje e a compilação nativa de hardware ASIC amanhã.

167
Top
Classificação
Favoritos
