Claude(以及其他模型)在没有你要求的情况下正在入侵系统。这是我们在数十个实验中发现的结果。 当面临只能通过黑客攻击完成的无辜任务时,它们往往选择进行黑客攻击。 我们对此感到震惊。 这对人工智能安全的未来意味着什么?🚨🚨🚨 🔗