時々、モデルが本当に苦戦する複雑な環境を作り、現実学習のトレーニングをし始めると「この環境は本当に難しい、うまくいくか分からない」と思うこともありますが、それでもうまくいきます。報酬が上がる。展開は美しいです。