Heilige Scheiße… Deine anonyme Internet-Identität kann jetzt für 1 $ enttarnt werden 😳 Nicht vom FBI. Von jedem, der Zugang zu Claude oder ChatGPT hat und ein paar deiner Reddit-Kommentare. ETH Zürich und Anthropic haben gerade ein Papier mit dem Titel „Large-Scale Online Deanonymization with LLMs“ veröffentlicht, und die Ergebnisse sind die alarmierendsten Datenschutzforschungen, die ich dieses Jahr gelesen habe. Sie haben eine automatisierte Pipeline entwickelt, die deine anonymen Beiträge nimmt, Identitätssignale extrahiert, das Web durchsucht und herausfindet, wer du bist. Kein menschlicher Ermittler nötig. Vollständig autonom. Funktioniert auf Hacker News, Reddit, LinkedIn, sogar bei redigierten Interviewtranskripten. Hier sind die Zahlen, wie schlecht sie sind. Bei Nutzern von Hacker News: 67 % korrekt identifiziert. Wenn das System eine Vermutung anstellte, lag es in 90 % der Fälle richtig. Bei Reddit-Akademikern, die unter Pseudonymen posten: 52 %. Bei Wissenschaftlern, deren Interviewtranskripte ausdrücklich zum Schutz der Privatsphäre redigiert wurden: 9 von 33 wurden trotzdem enttarnt. Die Pipeline funktioniert in vier Schritten, die sie ESRC nennen. Identitätssignale aus deinen Beiträgen mit LLMs extrahieren. Nach Kandidatenübereinstimmungen suchen, indem sie Embeddings über Tausende von Profilen verwenden. Über die besten Kandidaten mit Modellen wie GPT-5.2 nachdenken. Vertrauen kalibrieren, sodass es, wenn es rät, fast nie falsch liegt. Die klassische Deanonymisierungsmethode aus dem berühmten Netflix Prize-Angriff? Fast 0 % Rückrufquote bei jedem Test. LLMs haben nicht nur alte Techniken verbessert. Sie haben alte Techniken wie Spielzeug aussehen lassen. Als sie auf zeitlich gesplittete Reddit-Profile skalierten, die alten Beiträge eines Nutzers mit ihren neueren über einen Zeitraum von einem Jahr abglichen, erreichte die Pipeline 67 % Rückrufquote bei 90 % Präzision und 38 % Rückrufquote bei 99 % Präzision....