Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Meera | AI Tools & News

🚨Andrej Karpathy acaba de abrir o código de um sistema que automatiza a pesquisa em IA enquanto você dorme. Chama-se autoresearch. Passei tempo a explorar todo o repositório para que você não precise. Aqui está como funciona na prática: Você dá a um agente de IA uma pequena configuração de treinamento de modelo de linguagem. O agente modifica o código. Treina por exatamente 5 minutos. Verifica se o resultado melhorou. Mantém ou descarta. Repete. Você acorda com um registro completo de experimentos e um modelo melhor. O repositório inteiro consiste em 3 arquivos: → prepare.py cuida da preparação de dados e do treinamento do tokenizador → train.py contém o modelo GPT completo e o loop de treinamento → program.md são as instruções do agente O agente só toca em train.py. Isso é tudo. Aqui está o que torna o design tão inteligente: Cada execução de treinamento é limitada a um orçamento de 5 minutos no relógio. Não em passos ou épocas, mas em tempo real no relógio. Isso significa que cada experimento é diretamente comparável, não importa o que o agente mude. Não importa se o agente troca o tamanho do modelo, o tamanho do lote ou toda a arquitetura. Você tem 5 minutos e é isso. Ele executou 83 experimentos por conta própria. Apenas 15 realmente melhoraram o modelo. Isso dá uma taxa de acerto de cerca de 18%. Mais ou menos a mesma que um pesquisador de ML humano tentando coisas manualmente. A métrica de pontuação é val_bpb (bits de validação por byte). Não depende da escolha do tokenizador ou do tamanho do vocabulário. Essa é a única maneira justa de comparar quando o agente está mudando a arquitetura entre as execuções. Você pode esperar cerca de 12 experimentos por hora. Cerca de 100 experimentos durante a noite. Testado em uma única NVIDIA H100 rodando Python 3.10+ sob uma licença MIT. Sem treinamento distribuído e sem configurações complexas. A única dependência é o PyTorch. Karpathy colocou da melhor forma: "Um dia, a pesquisa de IA de fronteira costumava ser feita por computadores biológicos entre comer, dormir, ter outras diversões e sincronizar de vez em quando usando interconexões de ondas sonoras no ritual de reuniões em grupo. Essa era já passou."

Top

Classificação

Favoritos