C'est vraiment amusant de voir Naman travailler. Les évaluations sont un domaine de recherche si difficile et intéressant à mesure que les modèles deviennent si performants. C'est au cœur de ce que fait Cursor.