Saya telah mengajar 100.000 siswa palsu selama 2 minggu. dan menggunakannya untuk membangun sistem persiapan AP terbaik di dunia. Saya mengambil model Qwen 3 8B dan memberi mereka simulasi memori manusia. Sekarang setiap malam ribuan siswa simulasi memulai dengan pengetahuan nol tentang ilmu sosial. Satu-satunya pelatihan mereka adalah kurikulum adaptif kami. Mereka mengerjakannya, kemudian mengikuti ujian praktik AP (penempatan lanjutan) penuh. Angkatan pertama rata-rata 3 pada ujian mereka. (~ persentil ke-45) Kemudian agen melihat di mana mereka gagal, dan meningkatkan algoritma. Lagi, dan lagi, dan lagi. Dua minggu kemudian, rata-rata adalah 4,43 (~ persentil ke-80) Ini adalah angka yang gila karena kurikulum yang mereka kerjakan HANYA pengetahuan dan pemahaman dasar. Mereka tidak pernah diajarkan cara membangun argumen, mengontekstualisasikan bukti, atau bahkan diperlihatkan rubrik ujian. ... Namun mereka rata-rata persentil ke-80 pada ujian yang membutuhkan semuanya. Pada dasarnya membangun loop umpan balik pembelajaran mesin untuk edtech. Berbicara tentang ini di @clawcon & @sxsw minggu lalu. Ini baru permulaan.