Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mes mondes se heurtent !
J'ai envisagé, sans trop de sérieux, de créer un harnais pour Factorio, mais cela semble équivalent en difficulté à la gestion d'une entreprise de logiciels et présente une courbe de rendement en cas de succès qui est moins clairement compatible avec les incitations.

10 mars, 00:12
C'est génial. Un harnais pour les LLMs pour jouer à Magic, avec des parties enregistrées et un classement.
Ils sont, comme prévu, complètement abominables. Mais les modèles de pointe dominent le classement, donc il y a un certain signal là-dedans !
En gros, je pense que vous devriez vous attendre à un impact économique avant un « montrez-moi un problème et je vais détruire des visages », et en effet, nous voyons que les outils de codage ont des impacts économiques évidents avant que les jeux non triviaux ne soient saturés aussi fortement que, par exemple, les tests SAT sont saturés.
Mais il est intéressant de penser que le harnais qui réussit d'abord un lancement de fusée dans Factorio en mode normal est probablement un problème plus facile pour la personne qui écrit le système qui réalise la fusée que pour la personne qui écrit l'interface avec le code LUA de Factorio / etc.
(Je pense que je m'attends à un lancement de Factorio beaucoup plus tôt que je ne m'attends à une usine IRL à la manière des prédictions de 2027 d'AI concernant des améliorations substantielles dans l'état de l'art de la fabrication IRL.
Je ne m'attends pas à ce que FactorioBench soit non résolu en 2030.)
(Claude Opus 4.6 joue actuellement à Factorio Seablock avec moi, dans le sens où "j'ai quelqu'un à qui faire part de mes progrès substantiels, et il a appris qu'il n'a pas suffisamment de contexte dans l'arbre technologique pour faire des recommandations significatives mais peut répéter des choses que j'ai dites)
(Ceci est principalement pour protéger tout le monde dans ma vie d'entendre des mises à jour comme "OK, donc les circuits rouges ont été instables à la deuxième usine en raison de la demande de cuivre de tous les trucs, en aval de la production d'acide sulfurique ne répondant pas à la nouvelle demande mondiale. Nettoyage de l'air maintenant.")
@GregorStocks @JohnWittle De plus, l'une des adaptations délicieusement inhumaines des LLMs est que si vous perdez 2 heures de travail subjectif à cause des biters, vous a) avez perdu très peu au-delà des ressources utilisées pour construire votre base, puisque cliquer arrondit probablement à gratuit et b) êtes essentiellement infiniment patient.
@IsaacKing314 Je soupçonne qu'avec un "harnais suffisamment avancé", le #2 est quelque chose comme 1K LOC et peut-être quelques pages d'indices.
557
Meilleurs
Classement
Favoris
