Hvil i fred, flat RAG ☠️ ByteDance har nettopp åpnet OpenViking, og det avdekker alt som er galt med hvordan vi har bygget AI-agentminne. Her er hva alle agentrammeverk gjør feil: Minnene lever på ett sted. Ressurser i en annen. Ferdigheter spredt overalt. Og når du trenger kontekst, gjør du flat vektorsøk og håper på det beste. Det er problemet. OpenViking fikser alt med én idé: behandle agentens kontekst som et filsystem. Alt lever under en samlet viking:// protokoll. Minner, ressurser, ferdigheter, alt organisert i kataloger med unike URI-er. Agenter kan LS-e, finne og navigere i kontekst som en utvikler som jobber på en terminal. Men det virkelige gjennombruddet er lagdelt lasting: → L0: én-setnings sammendrag for raskt oppslag → L1: ~2k tokenoversikt for planleggingsbeslutninger → L2: fullstendige detaljer lastet kun inn når det faktisk trengs De fleste agenter setter alt i kontekst og ber. OpenViking laster bare det som trengs, når det trengs. Token-kostnadene faller. Presisjonen øker. Og uthenting gir faktisk mening nå. I stedet for ett flatt semantisk søk, gjør den først plassering på katalognivå, deretter rekursiv forbedring inne i highscore-kataloger. Du kan bokstavelig talt se på innhentingsbanen, ikke mer svart boks. Selvevolusjonsdelen er også vill. På slutten av hver økt henter den automatisk ut læringer og oppdaterer agent- og brukerminne. Agenten blir bare smartere jo mer du bruker den. 9 000 stjerner. 13 bidragsytere. Bygget av ByteDance Viking-teamet som har kjørt vektorinfrastruktur siden 2019. 100 % åpen kildekode. Apache 2.0. Lenke i kommentarfeltet.