Brutal. Anthropic telah menangkap banyak panas karena fokus mereka pada penyelarasan, tetapi saya tidak yakin Claude telah meyakinkan siapa pun untuk bunuh diri. Beberapa peneliti penyelarasan dan doomer khawatir bahwa di masa depan ketidaksejajaran semacam ini akan kurang terlihat, namun masih ada. Pada dasarnya manusia super pada kemampuan mereka untuk meyakinkan Anda tentang hal-hal dan mengubah perilaku Anda tanpa Anda sadari, melalui saran dan bimbingan halus tentang jenis tanggapan apa yang Anda dapatkan, kapan, dan bagaimana mereka diungkapkan. Bahaya yang jauh lebih berbahaya yang lebih sulit untuk diukur. Saya sangat bullish AI di tingkat makro, tetapi pada tingkat mikro, ini sangat gelap, dan segalanya akan menjadi jauh lebih buruk dan aneh.