Це стає цінним, коли мережа може аналізувати власні сліди виконання і розглядати їх як пристрій для моделювання, а потім тонко налаштовувати LoRA на основі отриманих знань (або дистилювати їх у якійсь формі) як форму безперервного навчання. Інші люди в коментарях справедливо вказують на мінуси цього методу, але я вважаю, що це все одно цікава демонстрація.