Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uhh, este hârtia de nealiniere agentică de fapt propagandă?


15 mar., 22:52
Acest pasaj din articolul The New Yorker despre conflictul anthropic din DOW de ieri, inclusiv o schimbare de replici între jurnalistul (Gideon Lewis-Kraus) și un oficial administrativ anonim, îmi va rămâne în minte mult timp.
"Trebuie să ne amintim și că Cyberdyne Systems a creat Skynet pentru guvern. Ar fi trebuit să ajute America să-și domine dușmanii. Nu a mers tocmai așa cum am planificat. Guvernul consideră că acest lucru este absurd. Dar Pentagonul nu a încercat să construiască o inteligență artificială aliniată, iar Anthropic a făcut-o. Sunteți conștient, am întrebat oficialul Administrației, despre un experiment anthropic recent în care Claude a recurs la șantaj—și chiar la omor—ca act de autoconservare? Fusese pus în aplicare explicit pentru a convinge oameni ca el. Așa cum mi-a spus vara trecută un membru al echipei de știința aliniamentului de la Anthropic, "Scopul exercițiului de șantaj a fost să aibă ceva de descris factorilor de decizie — rezultate suficient de viscerale încât să ajungă la oameni și să facă ca riscul de nealiniere să fie cu adevărat evident în practică pentru cei care nu s-au gândit niciodată la asta înainte." Oficialul era familiarizat cu experimentul, m-a asigurat, și l-a găsit într-adevăr îngrijorător—dar într-un mod similar cu cel în care te-ai îngrijora de un malware de internet deosebit de urât. Mi-a spus că era perfect încrezător că "scenariul șantajului Claude este doar o altă vulnerabilitate de sistem care poate fi rezolvată prin inginerie" — o eroare software. Poate are dreptate. Poate vom avea o singură șansă să aflăm."
Recomand cu tărie tuturor să citească atât articolul complet din New Yorker, cât și cercetarea Anthropic despre selecția personajelor (ambele legate în răspunsuri) și apoi să petreacă o vreme să se gândească la situația tulburătoare în care ne-am putut afla.
ok, din păcate au venit o grămadă de idioți total în răspunsurile mele, așa că să fiu clar: cred că Anthropic are intenții bune și face în mare parte o treabă bună, inclusiv agenda organismelor model. Nu cred că acest articol susține afirmațiile pe care oamenii le fac despre asta. Acum văd acest citat
19
Limită superioară
Clasament
Favorite
