Autocercetare pentru eficiența probelor! Am urmat autocercetarea lui @karpathy și am schimbat obiectivul pentru a minimiza pierderea de validare pentru un buget fix de tokenuri de 10 milioane de tokenuri. L-am rulat peste noapte și sistemul a descoperit ajustări care au dus la o îmbunătățire de 14% față de linia de bază. Atât de nebunie!
Ce a funcționat și ce nu.
98