Sociální vědci pracující s materiály vyžadujícími digitalizaci mohou studovat jen to, co stroje dokážou číst. V praxi to znamená tištěné latinkou psané dokumenty z dobře financovaných archivů. V novém pracovním dokumentu ukazujem, že Vision Language Models používané nulové střely překonávají všechny stávající OCR systémy napříč všemi vyhodnocovanými skripty a navrhuji pipeline pro jejich nasazení v nových kolekcích. Aplikuji ji na šest archivních sbírek o rozloze 1,8 milionu stran v šesti zemích za méně než 1 900 dolarů.