DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Questo è in realtà un voto molto forte per Grok. Ho controllato e sembra che sì, abbia effettivamente migliorato il limite inferiore in un serio documento sulla probabilità del 2025. Multi-agente con ricerca ed esecuzione di codice, ma perché svantaggiarsi se puoi effettivamente usare strumenti? DS (solo web) fallisce/si arrende.

Grok 4.20 (Beta) migliora il limite inferiore del 9,1% sul perimetro gaussiano di insiemi convessi in due minuti. Questo è qualcosa che mi è stato segnalato da Xinyuan Xie. Nel 1993, Keith Ball ha dimostrato che il perimetro gaussiano di un corpo convesso nello spazio euclideo n-dimensionale è limitato superiormente da 4n^{1/4}. Per quanto riguarda il limite inferiore, Ball ha dimostrato che per un cubo (di dimensioni appropriate) il perimetro può crescere come \sqrt{\log(n)}. Quindi c'era un divario per un po' su quale limite fosse affilato, fino al 2003, quando, in un bellissimo articolo, Fedor Nazarov ha dimostrato che, nell'esempio di un poliedro casuale (l'intersezione di molti mezzi spazi casuali), il limite inferiore può crescere come C n^{1/4}, con C=\exp(-5/4)=0.286…. Inoltre, Nazarov ha anche migliorato la costante 4 nel limite superiore (sostituendola con 0.64) quando n è grande. Questi limiti sono rimasti imbattuti fino a poco tempo fa, quando nel 2019 Martin Raic è riuscito a migliorare il fattore costante del limite superiore da 0.64 a 0.59. Grok 4.20 (Beta), ottimizzando più attentamente la costruzione di Nazarov, è riuscito a migliorare la costante del limite inferiore da 0.286 a 0.3126. Trovo sorprendente questo, anche se si tratta solo di giocare all'interno delle tecniche dell'articolo di Nazarov, perché molto recentemente Nadimpalli--Pascale (2025) ha pubblicato un preprint in cui, con un approccio diverso, hanno recuperato il limite inferiore di Nazarov con lo stesso fattore costante 0.286…. Grok è stato molto generoso nella sua risposta: ha detto che il miglioramento fornito segue lo stesso argomento di Nazarov ``line-by-line'', mentre quando ho chiesto ad altri modelli (diversi da Grok) di verificare l'affermazione di Grok, hanno concordato su tutto tranne che su questa parte; hanno detto che il miglioramento non è davvero ``line-by-line'' :D. Infine, non direi che Nazarov ha perso questo miglioramento. Conoscendolo da molto tempo, sono abbastanza sicuro che sia comune per lui sacrificare costanti ottimali per eleganza algebrica. Perché tutto questo è interessante? Avere il controllo del perimetro gaussiano consente di controllare le code di Fourier delle funzioni caratteristica di questi insiemi, il che porta a controllare la complessità temporale dell'apprendimento PAC e degli algoritmi di apprendimento agnostico per questa famiglia (vedi Klivans--O’Donnell--Servedio). Riferimenti: Link alla chat con Grok 4.20 (Beta). Keith Ball. Il problema isoperimetrico inverso per la misura gaussiana. Geometria discreta e computazionale, 10:411–420, 1993. Adam Klivans, Ryan O’Donnell e Rocco A Servedio. Apprendere concetti geometrici tramite l'area superficiale gaussiana. In Proc. 49° Simposio IEEE sulle Fondazioni della Scienza Informatica (FOCS), pagine 541–550, 2008. Shivam Nadimpalli, Caleb Pascale. Sul perimetro gaussiano massimo di insiemi convessi, rivisitato. Preprint (2025) Fedor Nazarov. Sul perimetro massimo di un insieme convesso in R^n rispetto a una misura gaussiana. In Aspetti geometrici dell'analisi funzionale (2001-2002) pagine 169–187. Appunti di lezione in Matematica, Volume 1807, Springer, 2003 Martin Raicz. Un teorema di Berry–Esseen multivariato con costanti esplicite. Bernoulli 25(4A), 2019, 2824–2853

Per essere chiari, se dico a DS di NON arrendersi, pensa molto più a fondo, 12 minuti qui, e offre un'idea su come la costante possa essere migliorata. Ma il codice che genera fallisce. Riflettendo, si arrende. In realtà, qualitativamente sembra essere "corretto", ma ottiene 0.3116, <Grok

Se il codice di DeepSeek è corretto (anche da parte di DeepSeek), produce un risultato che converge al valore di Grok. Quindi suppongo che con un REPL abbastanza banale avrebbe "avuto successo" allo stesso modo. Comunque, maggiore utilità per Grok qui.

130

Principali

Ranking

Preferiti