Nikdo to nepochopil správně. Ve skutečnosti se dříve hlavní váhy týkaly BF16, takže gradienty u 60 % parametrů Lora byly menší než u ULP