Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Соціальні науковці, які працюють із матеріалами, що потребують оцифрування, можуть вивчати лише те, що можуть читати машини. На практиці це означає надруковані латинські документи з добре фінансованих архівів. У новому робочому документі я показую, що Vision Language Models з використанням zero-shot перевершують усі існуючі OCR-системи в кожному оціненому скрипті, і пропоную конвеєр для їх розгортання на нових колекціях. Я застосовую його до шести архівних колекцій, що охоплюють 1,8 мільйона сторінок у шести країнах за ціною менш ніж $1,900.

Найкращі

Рейтинг

Вибране