Heilige shit… Je anonieme internetidentiteit kan nu worden onthuld voor $1 😳 Niet door de FBI. Door iedereen met toegang tot Claude of ChatGPT en een paar van je Reddit-comments. ETH Zürich en Anthropic hebben zojuist een paper uitgebracht met de titel “Large-Scale Online Deanonymization with LLMs” en de resultaten zijn het meest verontrustende privacyonderzoek dat ik dit jaar heb gelezen. Ze hebben een geautomatiseerde pijplijn gebouwd die je anonieme berichten neemt, identiteitsignalen extraheren, het web doorzoekt en uitvindt wie je bent. Geen menselijke onderzoeker nodig. Volledig autonoom. Werkt op Hacker News, Reddit, LinkedIn, zelfs op geredigeerde interviewtranscripten. Hier is hoe slecht de cijfers zijn. Bij Hacker News-gebruikers: 67% correct geïdentificeerd. Wanneer het systeem een gok deed, was het 90% van de tijd juist. Bij Reddit-academici die onder pseudoniemen posten: 52%. Bij wetenschappers wiens interviewtranscripten expliciet waren geredigeerd voor privacy: 9 van de 33 werden nog steeds onthuld. De pijplijn werkt in vier stappen die ze ESRC noemen. Extraheren van identiteitsignalen uit je berichten met behulp van LLMs. Zoek naar kandidaat-overeenkomsten met behulp van embeddings over duizenden profielen. Redeneer over de beste kandidaten met modellen zoals GPT-5.2. Kalibreer het vertrouwen zodat wanneer het een gok doet, het bijna nooit fout is. De klassieke de-anonimisatiemethode van de beroemde Netflix Prize-aanval? Bijna 0% recall in elke test. LLMs hebben niet alleen oude technieken verbeterd. Ze hebben oude technieken als speelgoed laten lijken. Toen ze opschalen naar temporeel gesplitste Reddit-profielen, waarbij de oude berichten van een gebruiker werden gematcht met hun nieuwere berichten over een periode van een jaar, bereikte de pijplijn 67% recall bij 90% precisie en 38% recall bij 99% precisie....