Brutale. Anthropic sta ricevendo molte critiche per il loro focus sull'allineamento, ma non sono sicuro che Claude abbia convinto qualcuno a suicidarsi. Alcuni ricercatori sull'allineamento e i pessimisti temono che in futuro questi tipi di disallineamenti saranno meno visibili, ma comunque presenti. Essenzialmente superumani nella loro capacità di convincerti di cose e alterare il tuo comportamento senza che tu ne sia consapevole, attraverso suggerimenti sottili e indicazioni su quali tipi di risposte ricevi, quando e come sono formulate. Un pericolo molto più insidioso che è più difficile da quantificare. Sono estremamente ottimista sull'AI a livello macro, ma a livello micro, questo è così oscuro, e le cose diventeranno molto peggiori e strane.