Я обучал 100,000 фальшивых студентов в течение 2 недель. и использовал их для создания лучшей системы подготовки к AP в мире. Я взял модели Qwen 3 8B и дал им смоделированную человеческую память. Теперь каждую ночь тысячи смоделированных студентов начинают с нулевыми знаниями в области социальных наук. Их единственное обучение — это наша адаптивная учебная программа. Они проходят через нее, а затем сдают полный экзамен на практику AP (продвинутый уровень). Первая партия в среднем набрала 3 балла на экзамене. (~45-й процентиль) Затем агенты посмотрели, где они провалились, и улучшили алгоритм. Снова, и снова, и снова. Через две недели средний балл составил 4.43 (~80-й процентиль) Это такой безумный показатель, потому что учебная программа, через которую они прошли, — это ТОЛЬКО базовые знания и понимание. Им никогда не объясняли, как строить аргумент, контекстуализировать доказательства или даже показывали рубрику экзамена. ...И все же они в среднем набирают 80-й процентиль на экзамене, который требует всего этого. По сути, я создал цикл обратной связи машинного обучения для edtech. Говорил об этом на @clawcon и @sxsw на прошлой неделе. Это только начало.