Autoresearch para Eficiência de Amostra!
Peguei o autoresearch do @karpathy e mudei o objetivo para minimizar a perda de validação para um orçamento fixo de 10M tokens.
Executei durante a noite e o sistema descobriu ajustes que levaram a uma melhoria de 14% em relação à linha de base.
Tão louco!
As influências subconscientes são reais?
Adicionei um novo experimento ao Vibe Psychophysics!
Meus resultados mostraram que uma palavra exibida por tempo demasiado breve para ser notada ajudou a acelerar o reconhecimento de uma palavra relacionada (em comparação com uma não relacionada). Isso mostra que os efeitos de priming são reais!
Fizemos com que os LLMs falassem Tulu, uma língua com apenas 2 milhões de falantes.
Não foi fácil porque os LLMs continuavam a confundi-la com o Kannada, mas descobrimos que restrições negativas realmente ajudam.
🚨 Novo Artigo
Treinando um LLM para falar uma língua de baixo recurso
(Oficina EACL, 2026)
O Tulu é falado por mais de 2 milhões de pessoas na costa de Karnataka e os LLMs basicamente não conseguem falar. Chegámos a 85% de precisão gramatical sem afinar nada ou coletar um único novo exemplo de treinamento.