Greutățile deschise nu sunt antrenament deschis. @AddieF38654 din echipa noastră și-a prezentat experiența încercând să post-antreneze un model MoE cu parametri 1T folosind infrastructura open source existentă. Să vedem câte patch-uri de maimuță sunt necesare pentru a post-antrena un model cu greutăți deschise. Un fir de ață🧵