بئسًا... يمكن الآن كشف هويتك المجهولة على الإنترنت مقابل دولار واحد 😳 ليس من قبل مكتب التحقيقات الفيدرالي. من أي شخص لديه وصول إلى كلود أو ChatGPT وبعض تعليقاتك على ريديت. أصدرت ETH Zurich وAnthropic مؤخرا ورقة بعنوان "إزالة الهوية على نطاق واسع عبر الإنترنت باستخدام نماذج اللغة الكبيرة"، وكانت النتائج أكثر أبحاث الخصوصية إثارة للقلق قرأتها هذا العام. لقد بنوا خط أنابيب آلي يأخذ منشوراتك المجهولة، ويستخرج إشارات الهوية، ويبحث في الويب، ويكتشف من أنت. لا حاجة لمحقق بشري. مستقلة تماما. يعمل على Hacker News، ريديت، لينكدإن، وحتى نصوص مقابلات محذوفة. إليك مدى سوء الأرقام. بالنسبة لمستخدمي Hacker News: 67٪ عرفوا أنفسهم بشكل صحيح. عندما يخمن النظام، يكون صحيحا بنسبة 90٪ من الوقت. على أكاديميين على ريديت ينشرون تحت أسماء مستعارة: 52٪. عن العلماء الذين تم حذف نصوص مقابلاتهم صراحة للخصوصية: 9 من أصل 33 تم الكشف عن هويتهم. يعمل خط الأنابيب على أربع خطوات يسمونها ESRC. استخرج إشارات الهوية من منشوراتك باستخدام نماذج اللغة الكبيرة (LLMs). ابحث عن تطابقات مرشحين باستخدام التضمين عبر آلاف الملفات الشخصية. المنطق على المرشحين المتقدمين باستخدام نماذج مثل GPT-5.2. قم بضبط الثقة بحيث عندما يخمن، نادرا ما يكون خاطئا. طريقة كشف الهوية الكلاسيكية من هجوم جائزة نتفليكس الشهير؟ ما يقارب 0٪ من الاستدعاء في كل اختبار. نماذج اللغة الكبيرة لم تحسن فقط التقنيات القديمة. جعلوا التقنيات القديمة تبدو كالألعاب. عندما توسعت لتقسيم ملفات Reddit مؤقتا، ومطابقة منشورات المستخدم القديمة مع الأحدث خلال فجوة سنة كاملة، وصلت الأنابيب إلى 67٪ استدعاء بدقة 90٪ و38٪ عند دقة 99٪....