Bunu çok isterim! 2024'te güçlü kullanıcı anketi için finanse etmeye çalıştım ama proje lideri başka bir rol aldı, yine de harika olacağını düşünüyorum. Şu anda en çok önem verdiğim güçlü kullanıcıların yapay zeka şirketi çalışanları olması ve onlardan detaylı bilgi almak zor olabiliyor
Dürüst olmak gerekirse, Tüketici Raporları tarzı güçlü kullanıcılar paneli, yapay zeka ilerlemesini ölçmek için METR vb.'den daha iyi olabilir, sivliğe karşı çok daha dayanıklı.
Şüpheci görünmek istemedim, ama güçlü bir kullanıcı olarak son birkaç ayda son birkaç ayda çok belirgin bir ilerleme olduğunu düşünüyorum.
Yeni gönderi: 14 Ocak'ta, EOY ile SWE zaman ufkunun ~24 saat olacağını tahmin etmiştim. Şimdi sanırım >100 saat olacak ve belki sınırsız. İlk kez, bu yıl yapay zeka AR-GE otomasyonuna karşı sağlam bir kanıt göremiyorum.* Aşağıdaki bağlantı.
Benimle birlikte çalış! METR, mühendisler, bilim insanları ve operasyonlar direktörü arıyor. Açık gönderiler için başlıkta bağlantılar var, sorularınız olursa DM atmaktan çekinmeyin!
Ekibimiz şu anda çok zorlandı!
Yapay zeka ajanlarının özerkliğini üst sınırlara taşımaya devam etmek ve yapay zeka sistemlerini ve insan kontrolünü alt etme eğilimlerini izlemek için değerlendirmeler geliştirmek için daha fazla iyi mühendislik ve araştırma personeline ihtiyacımız var. Lütfen aşağıya başvurun ya da bana DM at!