Ny AI-modell tolkar historiska texter

Riksarkivet presenterar nu en AI-modell som kan tolka handskrivna texter på svenska från 1600-, 1700- och 1800-talen och uppnå en noggrannhetsgrad på 95 procent. ”The Swedish Lion I” har tränats med hjälp av data från texter som omfattar 3,3 miljoner textrader och totalt 15,6 miljoner ord.

– Nu blir det möjlighet att maskintolka och tillgängliggöra digitaliserade arkiv, flera miljoner ovärderliga handskrivna dokument kan tolkas med modellen. Möjligheterna som detta framsteg ger oss kan inte överskattas, berättar Olof Karsvall, forskningsledare på Riksarkivet och en av skaparna av AI-modellen.

AI-modellen är resultatet av ett samarbete mellan Riksarkivet i både Sverige och Finland, som arbetat tillsammans med Stockholms stadsarkiv, Jämtlands läns fornskriftsällskap, medborgarforskare och forskare från Stockholms och Uppsala universitet.

”The Swedish Lion I ” är en basmodell som lätt kan finjusteras för än mer exakta tolkningar av praktiskt taget alla arkiv och olika typer av handskrivna dokument. Modellen är nu tillgänglig via Transkribus som tillhandahålls av READ-COOP – ett samarbete som omfattar mer än 100 olika europeiska aktörer inom handskriftstolkning. Dessutom kommer Riksarkivet inom kort att släppa en fristående version som är baserad på öppen källkod.

(2024-02-11)

Se även Artificiell intelligens öppnar upp arkiven (2021-02-06)