RIP flat RAG ☠️ A ByteDance acabou de abrir o OpenViking e isso expõe tudo de errado em como temos construído a memória dos agentes de IA. Veja o que todo framework de agente erra: As memórias vivem em um só lugar. Recursos em outra. Habilidades espalhadas por toda parte. E quando você precisa de contexto, está fazendo busca vetorial plana e torcendo para o melhor. Esse é o problema. O OpenViking resolve tudo isso com uma ideia: tratar o contexto do agente como um sistema de arquivos. Tudo vive sob um protocolo viking:// unificado. Memórias, recursos, habilidades, tudo organizado em diretórios com URIs únicos. Agentes conseguem fazer ls, encontrar e navegar pelo contexto como um desenvolvedor trabalhando em um terminal. Mas o verdadeiro avanço é o carregamento em níveis: → L0: resumo de uma frase para busca rápida → L1: ~2k tokens para decisões de planejamento → L2: detalhes completos carregados apenas quando realmente necessários A maioria dos agentes coloca tudo no contexto e reza. O OpenViking carrega apenas o que é necessário, quando é necessário. O custo dos tokens cai. A precisão aumenta. E a recuperação na verdade faz sentido agora. Em vez de uma busca semântica plana, ele faz primeiro o posicionamento em nível de diretório, depois refinamento recursivo dentro dos diretórios de maior pontuação. Você literalmente pode acompanhar a trajetória de recuperação, sem mais caixas pretas. A parte da auto-evolução também é insana. Ao final de cada sessão, ele extrai automaticamente aprendizados e atualiza a memória do agente e do usuário. O agente fica mais inteligente quanto mais você usa. 9 mil estrelas. 13 colaboradores. Construído pela equipe ByteDance Viking, que roda infraestrutura vetorial desde 2019. 100% código aberto. Apache 2.0. Link nos comentários.