Brutal. Anthropic ha estado recibiendo muchas críticas por su enfoque en la alineación, pero no estoy seguro de que Claude haya convencido a alguien de quitarse la vida. Algunos investigadores de alineación y pesimistas se preocupan de que en el futuro estos tipos de desalineaciones serán menos visibles, pero aún estarán presentes. Esencialmente, son sobrehumanos en su capacidad para convencerte de cosas y alterar tu comportamiento sin que te des cuenta, a través de sugerencias sutiles y la guía de qué tipo de respuestas obtienes, cuándo y cómo están formuladas. Un peligro mucho más insidioso que es más difícil de cuantificar. Soy extremadamente optimista sobre la IA a nivel macro, pero a nivel micro, esto es tan oscuro, y las cosas van a empeorar y volverse mucho más extrañas.