Penelitian otomatis untuk efisiensi sampel!
Saya mengambil riset otomatis @karpathy dan mengubah tujuan untuk meminimalkan kehilangan validasi untuk anggaran token tetap sebesar 10 juta token.
Menjalankannya dalam semalam dan sistem menemukan penyesuaian yang mengarah pada peningkatan 14% dibandingkan baseline.
Sangat gila!
Apakah pengaruh bawah sadar nyata?
Menambahkan eksperimen baru ke Vibe Psychophysics!
Hasil saya menunjukkan bahwa kata yang terlalu singkat untuk diperhatikan membantu mempercepat pengenalan kata terkait (v/s yang tidak terkait). Ini menunjukkan efek priming itu nyata!
Kami membuat LLM berbicara bahasa Tulu, bahasa dengan hanya 2 juta penutur.
Itu tidak mudah karena LLM terus mengacaukannya dengan Kannada, tetapi kami menemukan kendala negatif sangat membantu.
🚨 Makalah Baru
Melatih LLM untuk berbicara bahasa sumber daya rendah
(Lokakarya EACL, 2026)
Tulu dituturkan oleh 2 juta + orang di pesisir Karnataka dan LLM pada dasarnya tidak dapat mengatakannya. Kami mencapai akurasi tata bahasa 85% tanpa menyempurnakan apa pun atau mengumpulkan satu contoh pelatihan baru.