Muito real De certa forma, todos esses modelos abertos ainda são provas de conceito. Não se trata tanto de computação (embora isso importe muito) quanto de séculos de trabalho que foram investidos nos dados, nos modelos de recompensa e nas EVALS. "Ambientes RL" é um novo truque interessante. Menor em escala.