Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Часть I нашей трилогии zkVM обосновала замену HAL на архитектуру доказательства с приоритетом графов.
Теперь вот данные. Мы провели бенчмаркинг Venus – нашего бэкенда с приоритетом графов на ZisK – на GPU и FPGA и пересмотрели нашу оригинальную тезу о ZK-аппаратном обеспечении.
Вот что показывают цифры. 🧵

2/ Graph-first обеспечивает измеримые преимущества на GPU.
В рамках HAL ядра запускаются последовательно.
С помощью cudaGraph мы захватываем и воспроизводим весь процесс доказательства в виде запланированного графа. Это сокращает накладные расходы на запуск CPU и уменьшает дрожание синхронизации хоста и устройства, особенно на итеративных этапах, таких как sumcheck.
Результаты ниже (по сравнению с ZisK 0.15).

3/ Мы также протестировали FPGA на двух устройствах: VU47P (класс F2 от AWS) и VH1782 (класс V80 от AMD).
Измеренное время работы GPU: ~47.8с
FPGA (оценка HLS): ~335–404с
Примечание: времена GPU измерены; времена FPGA оценены на основе задержки синтеза ÷ Fmax. Это не совсем сопоставимо, но направление ясно.
Разница на чип: ~7–8×, в основном из-за пределов частоты FPGA (74–98 МГц).
Ни сырая производительность, ни производительность на ватт не оправдывают замену GPU на FPGA сегодня.
4/ Но "FPGA медленнее" не является выводом.
Работа с FPGA заставила точно определить макеты памяти, контракты интерфейсов и зависимости между этапами доказательства. Именно тот фундамент, который вам нужен перед проектированием ASIC.
FPGA — это мост между графами и аппаратным прототипированием.
5/ Поскольку доказательство является графом вычислений, та же логика компилируется для любого бэкенда:
GPU → ядра cudaGraph
FPGA → модули потоковой передачи данных
ASIC → фиксированные вычислительные блоки
Меняется только бэкенд. Граф остается тем же.
6/ GPU → FPGA → ASIC является последовательной эволюцией.
Мы используем GPU с оптимизированными для Venus конфигурациями для достижения стабильной, нарастающей производительности.
Хотя FPGA не конкурентоспособен по производительности, он подтверждает структурную правильность нашего направления в аппаратном обеспечении.
Архитектура с приоритетом графа является мостом, который позволяет сегодня оптимизировать на уровне графа cuda и компилировать аппаратное обеспечение ASIC завтра.

138
Топ
Рейтинг
Избранное
