Très réel Dans un sens, tous ces modèles ouverts ne sont encore que des preuves de concept. Ce n'est pas tant une question de calcul (bien que cela compte beaucoup) que de siècles de travail consacrés aux données, aux modèles de récompense et aux EVALS. Les "environnements RL" sont un nouveau gadget mignon. Plus petits en échelle.