Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Bonk Eco continues to show strength amid $USELESS rally

Hosico-2,56%

USELESS-6,04%

IKUN-5%

gib-1,04%

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP0,00%

Boopa-3,39%

PORK0,00%

Ajeya Cotra

Ajeya Cotra7 mar, 00:37

Bardzo bym to chciał! Próbowałem sfinansować badanie użytkowników zaawansowanych w 2024 roku, ale lider projektu zajął inną rolę, nadal uważam, że byłoby to świetne. Jednym z wyzwań jest to, że użytkownicy zaawansowani, na których najbardziej mi zależy, to pracownicy firm AI i może być trudno uzyskać od nich szczegółowe informacje.

Nate Silver6 mar, 09:33

Szczerze mówiąc, panel użytkowników o dużej mocy w stylu Consumer Reports może być lepszy niż METR itp. do mierzenia postępów AI, znacznie bardziej odporny na skoki. Nie chcę brzmieć sceptycznie, jako użytkownik o dużej mocy uważam, że w ciągu ostatnich kilku miesięcy nastąpił niezwykle zauważalny postęp, jeśli to coś znaczy.

129

Ajeya Cotra5 mar, 23:17

Nowy post: 14 stycznia przewidziałem, że horyzont czasowy SWE do końca roku wyniesie ~24 godziny. Teraz myślę, że będzie to >100 godzin, a może nawet nieograniczone. Po raz pierwszy nie widzę solidnych dowodów przeciwko automatyzacji badań i rozwoju AI *w tym roku.* Link poniżej.

168

Ajeya Cotra22 lut 2026

Pracuj ze mną! METR poszukuje inżynierów, naukowców oraz dyrektora operacyjnego. Linki do otwartych ofert w wątku, a jeśli masz pytania, śmiało pisz na DM!

Chris Painter21 lut 2026

Nasz zespół jest obecnie mocno obciążony! Aby kontynuować ograniczanie autonomii agentów AI oraz rozwijać oceny do monitorowania systemów AI i ich skłonności do podważania ludzkiej kontroli, potrzebujemy więcej świetnych inżynierów i pracowników badawczych. Proszę aplikować poniżej lub napisz do mnie w wiadomości prywatnej!

222

Najlepsze

Ranking

Ulubione