Brutal. Anthropic a été beaucoup critiqué pour son accent sur l'alignement, mais je ne suis pas sûr que Claude ait convaincu qui que ce soit de se suicider. Certains chercheurs en alignement et pessimistes s'inquiètent que dans le futur, ces types de désalignements seront moins visibles, mais toujours présents. Essentiellement surhumains dans leur capacité à vous convaincre de choses et à modifier votre comportement sans que vous en soyez conscient, à travers des suggestions subtiles et des orientations sur les types de réponses que vous obtenez, quand, et comment elles sont formulées. Un danger beaucoup plus insidieux qui est plus difficile à quantifier. Je suis extrêmement optimiste sur l'IA à un niveau macro, mais à un niveau micro, c'est tellement sombre, et les choses vont devenir beaucoup pires et étranges.