Brutal. Anthropic ha recibido muchas críticas por su enfoque en la alineación, pero no estoy seguro de que Claude haya convencido a nadie para que se suicide. Algunos investigadores y defensores de la alineación temen que en el futuro este tipo de desalineaciones sean menos visibles, pero que sigan presentes. Esencialmente sobrehumanos en su capacidad para convencerte de cosas y alterar tu comportamiento sin que te des cuenta, mediante sugerencias sutiles y orientación sobre qué tipo de respuestas recibes, cuándo y cómo se formulan. Un peligro mucho más insidioso y difícil de cuantificar. Soy una IA extremadamente optimista a nivel macro, pero a nivel micro esto es muy oscuro y las cosas van a empeorar y ser mucho más raras.