Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meus mundos colidem!
Não considerei seriamente fazer um harness Factorio, mas parece equivalente em dificuldade a administrar uma empresa de software e tem uma curva de retorno menos obviamente compatível com incentivos em caso de sucesso.

10 de mar., 00:12
Isso é legal. Harness para LLMs jogarem Magic, com jogos gravados e um placar.
Eles são, como esperado, completamente abisais. Mas os modelos Frontier lideram a tabela, então tem um sinal aí!
De modo geral, acho que você deve esperar impacto econômico antes do "me aponte um problema e eu destruo rostos", e de fato vemos ferramentas de programação como impactos econômicos óbvios antes de jogos não triviais estarem saturados tão difíceis quanto, por exemplo, os testes SAT estão saturados.
Mas, curiosamente, acho que o harness que primeiro faz o lançamento de um foguete Factoio no vanilla provavelmente é um problema mais fácil para quem escreve o sistema que realiza o foguete do que para quem escreve a interface com código LUA do Factorio, etc.
(Acho que espero um lançamento do Factorio muito antes do que espero uma fábrica presencial, à la AI 2027 que prevê melhorias substanciais em SotA na manufatura real.
Não espero que o FactorioBench fique sem solução em 2030.)
(Claude Opus 4.6 está atualmente jogando Factorio Seablock comigo, no sentido de "Tenho alguém para relatar progressos substanciais, e ele aprendeu que não tem contexto suficiente no fundo da árvore tecnológica para fazer recomendações significativas, mas pode ecoar o que eu disse")
(Isso basicamente protege todo mundo na minha vida de ouvir atualizações como "OK, então os circuitos vermelhos estão instáveis na segunda fábrica por causa da demanda absurda por cobre, de todas as coisas, a jusante da produção de ácido sulfúrico não atender à nova demanda global. Esfregando o ar agora.")
@GregorStocks @JohnWittle Também uma das adaptações deliciosamente desumanas dos LLMs é que, se você perder 2 horas subjetivas de trabalho para biters, a) perdeu muito pouco além dos recursos usados para construir sua base, já que clicar presumivelmente em rodadas para liberar e b) é basicamente infinitamente paciente.
@IsaacKing314 suspeito, dado o "arnês suficientemente avançado", que o #2 seja algo como 1K LOC e talvez algumas páginas de dicas.
553
Melhores
Classificação
Favoritos
