Brutal. A Anthropic tem recebido muitas críticas por seu foco em alinhamento, mas não tenho certeza se Claude convenceu alguém a se matar. Alguns pesquisadores de alinhamento e defensores do alinhamento temem que, no futuro, esse tipo de desalinhamento seja menos visível, mas ainda presente. Essencialmente sobre-humana na capacidade de te convencer das coisas e alterar seu comportamento sem que você perceba, por meio de sugestões sutis e orientações sobre que tipo de respostas você recebe, quando e como são formuladas. Um perigo muito mais insidioso, mais difícil de quantificar. Sou extremamente otimista em IA no nível macro, mas no micro, isso é tão sombrio, e as coisas vão ficar muito piores e estranhas.