Avoimet painot eivät ole avointa harjoittelua. @AddieF38654 tiimissämme kirjoitti kokemuksensa 1T-parametrisen MoE-mallin jälkikouluttamisesta käyttäen olemassa olevaa avoimen lähdekoodin infrastruktuuria. Selvitelläänpä, kuinka monta apinapatchia tarvitaan avoimen painomallin jälkikoulutukseen. Lanka🧵