Điều này trở nên có giá trị khi mạng có thể lý luận về các dấu vết thực thi của chính nó và coi đó như một thiết bị mô phỏng, sau đó tinh chỉnh một LoRA dựa trên kiến thức thu được (hoặc chưng cất nó theo một hình thức nào đó) như một hình thức học tập liên tục. Những người khác trong các bình luận đã chỉ ra đúng những điểm tiêu cực của phương pháp này, nhưng tôi nghĩ đây vẫn là một bản demo thú vị.