”Trollpackan hade slagit dem i Nacken och förbannat dheras minne, när hon dhem uthur Blåkulla tillbaka förde”.
Så lyder ett exempel från Trolldomskommissionens protokoll, nu tillgängligt utan att kunna tyda 1600-talets handstil.
– Från 25 000 sidor träningsdata får vi fem miljoner transkriberade sidor, berättar David Haskiya, chef för Riksarkivets AI-labb och datatjänster.
Digitaliseringen har förändrat hur allmänheten använder Riksarkivet. I dag kan forskare och privatpersoner söka i arkiv hemifrån, beställa handlingar i förväg och fortsätta läsa dem digitalt efter besök. Samtidigt är allt färre vana vid äldre handstilar – ett hinder för tillgång till historiskt material.
I år har Riksarkivets enhet för AI-labb och datatjänster, AI-labbet i vardagligt tal, börjat transkribera miljontals sidor handskriven text med hjälp av AI-baserad handskriftsigenkänning, och gjort materialet sökbart i Nationella arkivdatabasen.
– Vi följer teknikutvecklingen inom AI-området, men inte genom att följa Linkedin och Twitter, utan genom att göra tekniska experiment, prototyper och utvärderingar, säger David Haskiya.
Projektet började som experiment 2019 och blev permanent 2023 när AI-modellen Swedish Lion lanserades.
– Den klarar svensk handskrift från 1650 till 1900, förklarar Linnea Karlberg Lundin, verksamhetsutvecklare på enheten och som har arbetat med att göra det AI-transkriberade materialet sökbart i arkivdatabasen.
De handskrivna dokument som nu har gjorts till sökbar text kommer från Svea hovrätt och Trolldomskommissionens arkiv – material med både mycket befintlig träningsdata och kulturhistoriskt intresse.
– Många tycker att särskilt Trolldomskommissionen är väldigt spännande. Och även om Svea hovrätts-protokollen kan bestå av ganska tråkiga bråk om arv så finns det en del saftiga historier där också, säger David Haskiya.
– När man motiverar att man har ett nationalarkiv så är det ju bland annat just för att kunna följa rättskipningens historia, fyller Linnea Karlberg Lundin i.

Nästa steg för AI-labbet är miljontals fler domstolsprotokoll, brev och dokument.
Foto: Jonas Eng
De fem miljoner sidorna har tränats upp med hjälp av cirka 25 000 manuellt transkriberade sidor. Träningsdatan bygger varken på generativ AI eller på att anställda har avsatt tid åt att transkribera. En handfull frivilliga medborgarforskare, främst släktforskare, har deltagit i jobbet att skapa träningsdata. Riksarkivet har också fått tillgång till träningsdata som skapats av Stockholms stadsarkiv, finska nationalarkivet, och Jämtlands läns fornskriftssällskap.
– Vi hade inte kunnat göra all den här träningsdatan själva. AI lär sig, liksom ett barn, genom att observera vad andra gör, säger David Haskiya.
AI-labbet samarbetar även med Finlands nationalarkiv, som arbetar på liknande sätt och har mycket material på svenska. För att lära en AI att transkribera handskrift måste man ge AI en stor mängd manuellt väl transkriberad text, så att den kan lära sig mönstret.
– För den förstår ju egentligen inte språket, förklarar David Haskiya.
AI-modellen hanterar både prydlig skrift och svårtydda kråkfötter, överstrykningar och marginalanteckningar – om de har förekommit tillräckligt i träningsmaterialet. Men utmaningar finns fortfarande, som tabeller i kyrkoböcker och skadade dokument.
– Är ett dokument eller brev jättedåligt inskannat, otroligt slitet, spillt över eller bränt, då kan det vara lite komplicerat, konstaterar Linnea Karlberg Lundin.


AI-labbets ambition är demokratisk: att göra källmaterial tillgängligt för fler. Släktforskare, akademiker och studenter får ett kraftfullt verktyg.
– Historiker kan gräva betydligt bredare i källmaterial än tidigare och släktforskare får ett effektivt verktyg tillgängligt. En forskare sa att hade det här funnits när han skrev sin avhandling så hade han använt 50 år av arkivmaterial och inte bara två, berättar David Haskiya.
Han sveper med handen över en tjock volym från Trolldomskommissionen – tätt skriven, svårtydd och omfattande.Linnea Karlberg Lundin söker parallellt i databasen på “Blåkulla” för att demonstrera hur den exakta förekomsten av ordet hittas, transkriberas och får en kontext.
Maskinläsbar text innebär dessutom att personer med synnedsättning kan få materialet uppläst – vilket digitala bildfiler aldrig möjliggör.

David Haskiya och Linnea Karlberg Lundin visar hur AI-modellen fungerar.
Foto: Jonas Eng
Förståelsen av gammalsvenska återstår som en utmaning. Just nu hjälper AI:n användare att läsa, men inte att tolka orden. Ett mål är därför att kunna söka med nutida svenska och få träffar i äldre texter, och på sikt även förklara ålderdomliga ord. I väntan på det kan viss språkmodeller, som Chat GPT, omvandla äldre svenska till nutida. Men man behöver vara medveten om generativ AI:s svagheter:
– Det finns alltid en risk för hallucinationer, jag skulle till exempel aldrig använda en AI-tolkning i historisk forskning, säger David Haskiya.
Nästa steg i år är miljontals fler domstolsprotokoll, brev och dokument. AI-labbet utvecklar också teknik för att tolka tabeller från folkräkningar, kyrkoböcker och skattelängder.
Målet är ambitiöst: att täcka material från 1300-talet till sent 1900-tal. Men arbetet försvåras ju äldre texterna blir, konstaterar David Haskiya.
– Bland annat blir det ju svårare att hitta volontärer som kan tyda handskriven text ju längre bak i tiden man går.