DApp Store | Pusat Web3 untuk Event & Game

Topik trending

Bagan ini sudah ketinggalan zaman dan tidak ada yang membicarakannya. Papan peringkat menunjukkan "Anthropic Opus 4.5" di 76.1%. Opus 4.6 diluncurkan pada 5 Februari, satu hari setelah Perplexity memposting hasil ini. Catatan rilis Anthropic sendiri mengatakan Opus 4.6 "meningkatkan BrowseComp dan DeepSearchQA." Di BrowseComp, peningkatan itu adalah 16 poin persentase (67,8% menjadi 84,0%). Kami belum memiliki nomor DeepSearchQA, tetapi jika lompatannya bahkan setengah dari ukuran itu, Opus 4.6 mandiri akan duduk di atas 79,5% Perplexity. Di sinilah menjadi menarik. Perplexity's Advanced Deep Research menjalankan setiap kueri di Opus 4.5. Itu dikonfirmasi dalam pengumuman mereka sendiri. Opus 4.6 sudah tersedia di API Perplexity untuk Komet, tetapi Deep Research belum beralih. Jadi hasil "canggih" yang disebut Kobeissi sebagai berita terkini dibandingkan dengan model yang digantikan 24 jam kemudian. Pembingkaian "Perplexity beats Anthropic" juga mengubur fakta bahwa mesin Perplexity ADALAH Anthropic. Setiap kueri Advanced Deep Research menjalankan Opus 4.5 melalui harness pencarian agen Perplexity. Antropik adalah fondasinya. Kebingungan adalah perancah. Kesenjangan 3,4 poin di antara mereka (79,5% vs 76,1%) adalah nilai dari saluran pengambilan Perplexity di atas penalaran Anthropic. Tiga hal akan terjadi. Anthropic menyerahkan Opus 4.6 ke papan peringkat. Perplexity meningkatkan Deep Research dari 4.5 menjadi 4.6. Dan seluruh grafik ini akan dirombak dalam beberapa minggu. Berbagi cuplikan balapan tolok ukur di tengah langkah dan menyebutnya "breaking" adalah cara Anda mendapatkan 186 ribu tampilan dan wawasan nol.

Teratas

Peringkat

Favorit