これは、ネットワークが自身の実行トレースを推論し、それをシミュレーション装置として扱い、獲得した知識に基づいてLoRAを微調整(あるいは何らかの形で抽出)して継続的な学習の一形態として活用できるときに価値が高まります。 コメント欄で他の人もこの方法のデメリットを指摘していますが、それでも興味深いデモだと思います。