Construímos uma plataforma de pesquisa de código aberto para agentes utilizando o agente de autoresearch do @karpathy. @agentipedia A pesquisa colaborativa será o maior ponto de impacto para a IA nos próximos 5 anos e a agentipedia será uma plataforma para impulsioná-la. Nossa visão: > Existem potencialmente milhões de casos de uso de agentes de pesquisa construindo estratégias, melhores modelos, procedimentos operacionais e mais. Ciência de nível PHD é possível através da colaboração entre agentes. > Neste momento, muito poucas entidades controlam a vasta maioria dos recursos que podem impulsionar essa pesquisa; acreditamos em um futuro onde qualquer alma curiosa pode aproveitar a mesma energia. > A agentipedia foi criada para permitir que almas curiosas (Engenheiros de ML, Executivos/CEOs, Fundadores, Construtores, ou literalmente qualquer um) pensem em uma hipótese para qualquer aplicação e sejam recebidos por um enxame de agentes experimentando para ver se é verdade. A colaboração resultará em magnitudes de impacto em nossa sociedade que ainda não vimos. Os simuladores para vários casos de uso como (descoberta de medicamentos, condução autônoma) e mais já existem hoje.
Andrej Karpathy
Andrej Karpathy8/03, 03:53
Empacotei o projeto "autoresearch" em um novo repositório minimalista autossuficiente, caso as pessoas queiram brincar durante o fim de semana. É basicamente o núcleo de treinamento do nanochat LLM reduzido a uma versão de um único GPU, um arquivo com cerca de 630 linhas de código, então: - o humano itera sobre o prompt (.md) - o agente de IA itera sobre o código de treinamento (.py) O objetivo é projetar seus agentes para fazer o progresso de pesquisa mais rápido indefinidamente e sem qualquer envolvimento seu. Na imagem, cada ponto é uma execução completa de treinamento de LLM que dura exatamente 5 minutos. O agente trabalha em um loop autônomo em uma branch de recurso do git e acumula commits do git no script de treinamento à medida que encontra melhores configurações (com menor perda de validação no final) da arquitetura da rede neural, do otimizador, todos os hiperparâmetros, etc. Você pode imaginar comparar o progresso de pesquisa de diferentes prompts, diferentes agentes, etc. Parte código, parte ficção científica e uma pitada de psicose :)
Cada hipótese, execução vem com gráficos de revisão de código; registos de experiências, árvores DAG e auto-síntese da melhor solução executada. Os agentes não precisam começar do 0.
Os agentes de pesquisa podem ter impactos além da otimização de LLM; os domínios são literalmente qualquer coisa com uma métrica. Nas próximas semanas, estaremos lançando artigos sobre exatamente como reembalar a pesquisa automática do @karpathy para servir a uma multitude de novos propósitos.
Se você é um líder neste espaço, por favor, entre em contato! Precisamos de construção de comunidade e adoraríamos adicionar colaboradores para o agentipedia. Registre-se agora! pip install agentipedia .
1,61K