Deux des trois vulnérabilités de haute gravité sur EVMBench détectées par AuditAgent. Avant que toute révision manuelle ne commence. EVMBench est un benchmark standardisé pour la détection de vulnérabilités par IA, construit par @OpenAI. Nous avons analysé tous les 40 dépôts. AuditAgent : 80/120 (67 %). Meilleur modèle de base : 56/120 (47 %). Aucun dépôt omis, exécuté dans l'ordre. Le rappel est une dimension. Nous évaluons à la fois le rappel et la précision, et nous avons rendu notre méthodologie d'évaluation open source. Analyse complète à venir.