Kunstig intelligens i slektsforskning

Hvordan kan kunstig intelligens hjelpe deg i jakten på slektshistorien? I denne artikkelen ser jeg på hva AI egentlig er, hvorfor det er relevant for slektsforskning, og konkrete måter teknologien kan brukes på. Målet er å vise hvordan AI kan forsterke og støtte – ikke erstatte – slektsforskeren i arbeidet.

Kjell Arne Brudvik

Født 1981 i Horten som eldste sønn av Jarle Brudvik (1957-2022) og Brit Mari Nygård (1961). Alltid hatt en dyp interesse for både lokalhistorie, slektshistorie og de lange linjer.

Publisert: 12. april 2025 | Se flere artikler fra skribenten

Lesetid
Denne artikkelen har 6067 ord. Estimert lesetid er 20 minutt(er)

Kunstig intelligens (AI) er et bredt begrep som handler om at datamaskiner kan utføre oppgaver som vanligvis krever menneskelig intelligens. Dette inkluderer maskinlæring, der systemene “lærer” mønstre fra data. Innen slektsforskning betyr dette for eksempel at en datamaskin kan trenes opp til å gjenkjenne håndskrift, foreslå sammenhenger i slektstredata eller finne mønstre i DNA-sekvenser. Hvorfor er dette relevant?

Slektsforskning genererer enorme mengder informasjon – millioner av sider med kirkebøker, folketellinger, brev, bilder og DNA-data. AI kan tråle gjennom disse dataene mye raskere enn et menneske, og den kan oppdage mønstre eller detaljer vi lett overser. For eksempel kan språkteknologi forstå at “Ole Olsen” og “Ole Olsøn” sannsynligvis er samme navn skrevet på ulik måte. Mønster-gjenkjenning kan koble sammen personer i ulike kilder. Kort sagt kan AI automatisere rutineoppgaver, gi oss smartere søk og nye analyser, slik at vi kan bruke mer tid på selve tolkningen og historiene.

Det er viktig å merke seg at AI ikke er noe mystisk som erstatter tradisjonelle metoder – det er snarere avanserte verktøy som integreres i eksisterende tjenester. For eksempel har slektsnettsteder i årevis brukt algoritmer for å matche personer og dokumenter. Den nyeste generasjonen AI tar dette et steg videre med språkforståelse og læring. Et eksempel er MyHeritages nye AI Record Finder™, en chat-assistent drevet av OpenAI-teknologi som lar deg søke i 20 milliarder historiske dokumenter ved å stille spørsmål i vanlig språk​. Slik AI-drevet søk revolusjonerer opplevelsen – du kan “snakke” med arkivmaterialet ditt og få hjelp til å finne relevant info mye raskere enn før. La oss dykke ned i de konkrete bruksområdene for AI i slektsforskning – spesielt med Norske eksempler i fokus.

Automatisert tekstanalyse av gamle kilder (OCR og håndskriftgjenkjenning)

En av de største utfordringene for slektsforskere er å lese gamle kilder. Mange av våre viktigste slektskilder – kirkebøker, folketellinger, skifteprotokoller – eksisterer kun som skannede bilder av gamle trykte tekster eller håndskrevne dokumenter. Optisk tegngjenkjenning (OCR) har i lengre tid blitt brukt for trykte tekster, mens håndskriftgjenkjenning (HTR) med AI nå gjør det mulig å transkribere håndskrift automatisk.

Arkivverket digitaliserer enorme mengder arkivmateriale med høyhastighetsskannere. Når bildene er klare, kan AI brukes til å gjenkjenne teksten – både trykt skrift og gotisk håndskrift. OCR for trykte kilder: Norske aviser og bøker fra 1800- og 1900-tallet har blitt skannet av Nasjonalbiblioteket, som deretter bruker OCR-teknologi for å gjøre dem søkbare. For slektsforskere betyr det at man kan søke etter navn og steder i aviser (f.eks. dødsannonser, gårdsannonser) i Nettbiblioteket. OCR har også blitt brukt på trykte folketellinger og adressebøker.

Kvaliteten på OCR har tradisjonelt variert – gotiske trykkskrifter og gammel ortografi gir feiltolkninger – men moderne AI-modeller forbedrer OCR-presisjonen ved å trenes spesifikt på gamle skrifttyper. Resultatet er at stadig flere gamle trykte kilder blir fullt søkbare digitalt. HTR for håndskrift: Dette er et felt der AI virkelig har gjort sitt inntog de siste årene. Arkivverket anslår at de har ca. 600 millioner håndskrevne sider i sine magasiner, og maskinlæring er et viktig verktøy for å gjøre disse kildene søkbart lesbare i Digitalarkivet​. Håndskriftgjenkjenning bruker nevrale nettverk som er trent opp på avskrifter av gamle dokumenter.

Prosessen fungerer slik at man først skanner dokumentene (Arkivverket har allerede publisert over 25 millioner bilder av håndskrevne sider), så må AI-modellen trenes på et sett av disse bildene med korrekte transkripsjoner som fasit​. Når modellen har “lært” skriften, kan den anvendes på tusenvis av nye sider. I Norge har Arkivverket hatt stor nytte av et samarbeid med det danske Rigsarkivet. Fordi Norske arkivkilder fra 1600–1800-tallet stort sett er skrevet på dansk (den gang offisielt språk i Norge), kan man gjenbruke modeller trent på Danske dokumenter​. Dette sparer mye arbeid, da Norsk og Dansk gotisk håndskrift på 1700-tallet er svært like.

I 2023 demonstrerte Arkivverket dette ved å kjøre en dansktrent HTR-modell (via verktøyet Transkribus) på en branntakstprotokoll fra Trondheim 1766​. Den maskinelle transkripsjonen var så presis at den i prinsippet kunne blitt publisert direkte i Digitalarkivet for søk – men Arkivverket valgte likevel å la mennesker korrekturlese alt for å sikre 100% riktig resultat​. Dette illustrerer hvor langt teknologien er kommet: AI kan lese en gotisk protokoll fra 1700-tallet nesten like godt som en trent arkivar!

Plattformer som Transkribus er tilgjengelige for alle og lar brukere laste opp bilder av dokumenter og få tilbake maskintranskribert tekst ved hjelp av ulike AI-modeller​. Over 300 000 brukere har tatt i bruk Transkribus internasjonalt, og mer enn 50 millioner sider er blitt behandlet på denne måten​. Man kan også trene opp sin egen modell ved å korrigere nok sider – nyttig hvis du har mange brev eller dagbøker i samme håndskrift. For Norske slektsforskere betyr dette at man f.eks. kan mate inn sider fra en kirkebok eller folketelling og få ut et førsteutkast til avskrift som man så retter opp.

Selv om AI-transkripsjonen inneholder noen feil, er det langt bedre enn å taste alt fra bunnen – og viktigst: teksten blir søkbar. Da kan du finne navn, datoer og steder med et søk i stedet for å bla side for side. Fordelene med automatisert tekstanalyse er enorme: det sparer tid, åpner opp kilder som før var utilgjengelige, og gjør det mulig å søke gjennom store tekstmengder lynraskt. Men man må også være klar over begrensningene.

Maskinlæring er statistisk, så det vil aldri treffe 100% riktig. Gamle gotiske bokstaver som s og f kan forveksles, tall kan tolkes feil (f.eks. 3 vs 5), og utydelig skrift gir feil output. Likevel, som Arkivverket påpeker, en transkripsjon med noen feil er bedre enn ingen – for selv med feil kan man søke og filtrere​. Det blir slektsforskerens jobb å kontrollere mot originalen, men AI har gjort grovarbeidet.

Allerede i dag ser vi resultater i Digitalarkivet: Flere nye kilder er publisert med søkbare transkripsjoner ved siden av det skannede bildet. Blant annet er enkelte kirkebøker og emigrantprotokoller gjort søkbare ved maskinell hjelp (gjerne kombinert med dugnadsinnsats for korrektur). Vi kan forvente at mange av de 600 millioner håndskrevne sidene gradvis vil bli tilgjengelige på lignende måte i årene som kommer.

Språklig og historisk tolkning med AI (oversettelser, datoer og gamle språkformer)

Når teksten først er lest av, enten av mennesker eller maskin, gjenstår ofte en annen nøtt: Forstå hva som står der. Gamle kilder kan være preget av foreldet språk, lokale dialekter, gotisk skrift, forkortelser og referanser som er fremmede for moderne lesere. Her kan AI-baserte språkteknologier være til stor hjelp. Oversettelse og språkforståelse: Som nevnt var formelt språk i Norge før 1900-tallet ofte dansk. En vanlig slektsforsker-utfordring er å oversette tekster fra gammeldags dansk/norsk til moderne norsk. AI-verktøy som Google Translate har blitt overraskende gode på å oversette eldre språkvarianter, og kan gi en røff oversettelse av f.eks. et skannet brev fra 1850.

Enda mer spennende er bruken av store språkmodeller (som ChatGPT) til å forstå konteksten: Du kan kopiere inn et vanskelig formulert gammelnorsk avsnitt og be om en forklaring eller modernisert omskrivning. Modellen kan da tolke arkaiske uttrykk, utvidede forkortelser og gi deg meningen med teksten i klartekst. For dialekt og folkeminneskrift (for eksempel nedtegnelser av muntlig tale på dialekt) kan dette være gull verdt – AI kan gjenkjenne ordene basert på lignende stavemønstre den har sett før, og foreslå hvilken moderne betydning de har.

Datotolkning: Gamle dokumenter bruker ofte andre kalendere og måter å angi dato på. En kirkebok kan angi en dåpsdato som “3. søndag etter trefoldighet 1785”. For et utrent øye er det ikke opplagt hvilken dato det er snakk om. AI kan automatisk konvertere historiske datoformater til moderne kalenderdatoer. For eksempel kan en algoritme slå opp at påske i 1785 var 27. mars, dermed blir 3. søndag etter trefoldighet 19. juni 1785. Tilsvarende kan AI tolke månedsnavn som “8br” (ofte brukt om oktober i gamle latinske notasjoner, ettersom oktober var den åttende måneden i den gamle romerske kalenderen).

Det finnes allerede kodesnutter og småprogrammer genealogene har laget for slikt, men en AI-assistent kan gjøre det ad hoc: Man kunne spørre en chatbot “Hvilken dato er ‘Dominica 3 p. Trinitatis 1785’?” og få riktig svar, med forklaring.

Tyding av forkortelser og begreper: Arkivmateriale flommer over av forkortelser (“d.e.” = dette eksemplar, “hv.” = hjemmeværende), høflighetsformer (“velærverdige hr.”) og begreper som ikke lenger er i bruk. AI med treningsdata fra ordbøker og historiske tekster kan utvide forkortelser og definere begrepene. For eksempel: “afdød” betyr avdød, “Ungk.” = ungkar, “Stiftsprost” = en prestestilling. Dette kunne tidligere krevd oppslag i spesialordbøker; nå kan språkteknologi gjøre det på sekundet.

Gamle navn og stedsnavn: Språklig tolkning inkluderer også navnevarianter. AI kan lære at “Karen Olsdatter” i én kilde kan stå som “Karen Olsdtr.” i en annen og “Kari Olsdotter” i en tredje – og forstå at det trolig er samme navn med variant ortografi. Stedsnavn kan ha endret seg (Christiania vs. Oslo, Trondhjem vs. Trondheim). AI kan koble gamle og nye navn. Det finnes egne gazetteers (stednavnsregister) for slikt, men AI kan integrere alt i én prosess: lese en gammel tekst og presentere den i moderne språkdrakt med kjente navn.

Historisk kontekst: En interessant vri er å bruke AI til å legge til historisk bakgrunn. Slektsforskning handler ikke bare om navn og datoer, men også om de sosiale forholdene forfedrene levde under. Med AI kan man for eksempel få forklart hva en “husmann” var, eller hva et bestemt yrke innebar på 1800-tallet. En AI kan trekke veksler på store tekstkilder (til og med Wikipedia) for å gi små leksikalske notiser. Noen slektsforskere har begynt å eksperimentere med å la AI skrive narrativer basert på slektsdata nettopp med slik kontekst. MyHeritage lanserte i 2024 AI Biographer™, et verktøy som automatisk forfatter en biografisk tekst om en person i treet ditt​. Den tar fakta (fødselsdato, bosted, familie) og vever det sammen med generell historisk informasjon fra samme tid og sted, slik at man får en Wikipedia-lignende livshistorie for en vanlig ane​.

Resultatet kan for eksempel være en fortelling om oldemor som inkluderer de viktigste hendelsene i livet hennes, hvilke historiske begivenheter som skjedde i hennes levetid og litt om opphavet til etternavnet i familien. Slik tekstgenerering må selvfølgelig brukes kritisk – AI kan finne på ting hvis det mangler data – men det illustrerer potensialet for å gjøre slektshistorien levende.

Norske verktøy og tjenester: På Norsk side har Nasjonalbiblioteket eksperimentert med AI i sin tjeneste Maken som hjelper brukere å oppdage relevant litteratur uten å vite eksakt søkeord, ved å finne likhetstrekk mellom bøker​. Selv om dette primært er for bøker, kan slektsforskere benytte slike oppdagelsesfunksjoner for å finne f.eks. bygdebøker eller lokalhistorie som omhandler slekta. En annen spennende tjeneste er Universitetet i Oslos Autotekst, som bruker AI til tale-til-tekst (primært for samtidige intervjuer, men teknologien kan fint brukes på gamle dialektopptak dersom slike finnes, f.eks. intervjuer av tidsvitner).

Arkivverket selv har laget en læringsapp for gotisk håndskrift som viser eksempelord man kan øve på​ – ikke AI i seg selv, men et tegn på at teknologi og læring går hånd i hånd. Kort oppsummert hjelper AI oss ikke bare å lese kildene, men også å tolke dem. For Norske slektsforskere med begrensede kunnskaper i gotisk skrift, dansk språk eller latin kan AI fungere som en alltid tilgjengelig oversetter og “historielærer” som øker forståelsen av materialet.

Slektstre-analyse og mønstergjenkjenning i slektsdata

De fleste aktive slektsforskere ender opp med store mengder strukturerte data: slektstrær med hundrevis eller tusenvis av personer, hver med navn, datoer, steder og relasjoner. Her kan AI brukes til å analysere dataene for mønstre, kvalitetssikre sammenhenger og finne nye koblinger. Automatisk matching og oppdagelser: De store kommersielle aktørene har lenge brukt algoritmer for å finne matcher mellom trær og kilder. MyHeritage’s Smart Matches og Ancestry’s Hints er eksempler der systemet foreslår at “Person X i ditt tre ser ut til å være den samme som Person Y i en annen brukers tre eller i en kirkebok.”

Dette er basert på algoritmer som sammenligner navn, datoer og slektskap. Nå bruker disse plattformene stadig mer AI for å forbedre treffene – for eksempel ved å tillate litt stavevariasjon, beregne sannsynlighet for at to profiler er samme person selv om enkelte opplysninger avviker, osv. Slektsforskerne merker dette ved at treffene blir mer relevante over tid. Et eksempel på nyvinning er AI Record Finder™ hos MyHeritage (nevnt tidligere): en chat-bot hvor du kan skrive inn noe sånt som “Jeg leter etter foreldre til Ole Olsen født ca. 1850 i nærheten av Bergen”.

AI-en vil da forstå intensjonen og stille oppfølgingsspørsmål (“Kjenner du til noen søsken? Har du estimert dødsår?”) og deretter søke i databasen. Dette kombinerer språkforståelse med tradisjonell datasøk og kan avdekke kilder du selv ikke hadde kommet på å søke etter​. På den måten “tenker” AI-en litt som en slektsekspert som hjelper deg å avgrense søket. Mønstergjenkjenning i slektstrær: Når man har et stort tre, kan AI analysere det som en helhetlig graf (nettverk). Den kan identifisere interessante mønstre, f.eks.:

Navnetrender: AI kan finne at etternavnet “Jonsen” opptrer hyppig blant etterkommere av en viss ane, eller at bestemte fornavn går igjen i hver generasjon (nyttig i kildesammenheng, da gjenbruk av navn kan indikere familietilknytninger).

Geografiske flyttemønstre: Ved å plotte fødested og dødssted for alle i treet, kan AI finne migrasjonsstrømmer, f.eks. “din slekt flyttet fra Østerdalen til Oslo omkring 1880-årene, og så videre til Amerika etter 1900”. Dette kunne man selvfølgelig se selv ved å studere data, men AI kan oppdage det raskt og kanskje koble det opp mot historiske hendelser (som industriutvikling eller kriser).

Anomalier og feil: Viktig for datakvalitet – AI kan flagge “unormaliteter” som at en person er registrert med barn født etter personens dødsår, eller giftermål i en alder av 12 år – ting som tyder på feilregistrering. Mange slektsprogrammer har innebygde konsistenskontroller, men AI kan ta det lenger ved å vurdere sannsynlighet: “Det er 90% sannsynlig feil at Ole Olsen f.1720 er far til barn født 1790 – kanskje det skal være Ole (Jensen) f.1750 i neste generasjon?”. Slike forslag må tas med skepsis, men de kan hjelpe i å rydde opp i store trær.

Verktøy for slektstre-analyse: Allerede nå finnes det AI-drevne verktøy man kan kjøre på sine data. Et eksempel er Family Tree Expert, en ny plugin til ChatGPT som lar deg laste opp en GEDCOM-fil (standardformatet for slektstrær) og stille spørsmål om den​. ChatGPT vil da analysere slektstreet ditt og kan svare på ting som “Hvem levde lengst av mine direkte forfedre?” eller “Var det vanlig at folk i min slekt giftet seg med søskenbarn?”. Det blir som å ha en samtale med sitt eget slektstre, der AI-en trekker ut fakta.

Et annet eksempel er AI & Genealogy Research GPT, også en plugin spesiallaget for slektsforskning, som kan hjelpe med research-tips når den ser hull i treet (f.eks. “Har du sjekket sjømannsrullene for denne personen i Bergen?”). Slike eksperimentelle verktøy er ganske nye, men de viser hva som kommer.

Bildegjenkjenning i slektsforskning: Mønstergjenkjenning er ikke begrenset til tekstdata. Mange slektsforskere har gamle fotografier og dokumenter. AI kan analysere bilder for å gi slektsforskningsrelevant info. For eksempel:

Ansiktsgjenkjenning på tvers av bilder: Har du en eske med gamle fotografier uten navn? AI-bildetjenester kan gruppere bilder som sannsynligvis er av samme person (ansiktsgjenkjenning), selv om bildene er tatt i ulike aldre. Dette kan hjelpe deg å identifisere at “den ukjente mannen på det bryllupsbildet er samme person som bestefar på det barndomsbildet”. MyHeritage har en fotofunksjon som automatisk tagger ansikter, og slike systemer vil bli smartere med AI.

Klesstil og tidsperiode: Et AI-verktøy kan analysere klærne og omgivelsene i et foto og anslå når og hvor bildet kan være tatt. For eksempel kan den se at damen på bildet har en kjole som ligner 1880-talls mote, eller at typen av kartongfoto (visittkortformat vs kabinettkort) tilhører en bestemt periode. Det finnes faktisk en ChatGPT-plugin kalt Genealogy Eyes som er laget for å analysere bilder og dokumenter, og gi historiske fakta om personer og klesdrakter​. Slik kan AI fungere som en “fotohistoriker” som supplerer det en slektsforsker selv ser.

Dokumentinnhold fra bilder: Kombinasjonen av OCR og visuell gjenkjenning gjør at man kan ta et foto av en gravstein eller et monument og få tekstinnholdet ut plusset på med kontekst. En AI kan lese inskripsjonen på en slitt gravstein (bedre enn øyet makter) og koble navnet til data i slektstreet ditt – plutselig har du funnet dødsdatoen til en slektning via mobilkamera og AI. Dette er ikke lenger science fiction; allerede i dag finnes det mobilapper som scanner og leser gravsteiner.

Eksempler på verktøy (internasjonale og norske):

MyHeritage – Har ledet an med flere AI-funksjoner: Photo Enhancer (forbedrer ansikt på gamle foto), Deep Nostalgia (animerer gamle portretter med AI), AI Time Machine (lager kunstneriske fremstillinger av deg som viking, middelalderperson, m.m.) – disse er kanskje mest for moro og visualisering, men veldig populære. I tillegg selvfølgelig AI Record Finder for dokumentsøk​ og AI Biographer for historieskriving​.

Transkribus – Europeisk plattform for AI-transkripsjon av historiske dokumenter, mye brukt av arkiver​. Arkivverket benytter Transkribus i sin HTR-satsing og har fått imponerende resultater​. Tjenesten er åpen for privatpersoner (frem til et visst volum gratis, deretter betaling).

Digitalarkivet (Arkivverkets digitale tjenester) – Alltid en førstestopp for norske slektsforskere. Nå forbedres søkefunksjonaliteten jevnlig, og det ryktes at AI benyttes under panseret for å gi bedre treff. Blant annet får man nå treff på ord selv om de står i et skannet bilde (takket være maskinell lesing av bildene) – altså en kombinasjon av tekst- og bildesøk med AI, ifølge Arkivverkets egne eksperter​. Vi kan forvente en mer «intelligent» søkemotor i Digitalarkivet framover, kanskje lignende en chat-assistent som kan svare på spørsmål basert på arkivmaterialet (Arkivverket har gjort en vellykket proof-of-concept på akkurat det, ved å kombinere sine digitaliserte kilder med en språkmodell).

Slekt og Datas verktøyliste – Slekt og Data (Norges største slektsforskingsorganisasjon) har begynt å kuratere oversikter over KI-verktøy for slektsforskere. I en presentasjon av Hans-Olav O. Johnsen (jan 2025) nevnes bl.a. Family Tree Expert (GEDCOM-analyse), Genealogy Eyes (bildeanalyse), Write for Me (tekstforfatter-hjelp for slektshistorier), Midjourney/DALL-E (for generering av illustrasjonsbilder, f.eks. kart eller familievåpen) og Perplexity.ai (en AI-basert søkemotor som er flink til å oppgi kilder)​. Poenget er at verktøykassen er i rask utvikling. Mange av disse verktøyene er eksperimentelle, men slektsforskere tar dem i bruk og finner kreative måter å bruke dem på.

Slektstre-analysene og mønstergjenkjenningen til AI kan gi oss nye forskningsspor. For eksempel kan AI oppdage at “du har mange DNA-treff som stammer fra et bestemt ektepar på 1700-tallet – kanskje finnes det en hittil ukjent slektslinje der?” eller “flere personer i treet ditt døde i 1918 – kan det skyldes spanskesyken?”. Slike innsikter kan inspirere deg til å undersøke nærmere i historiebøkene. Igjen må vi huske at AI ikke vet sannheten – den ser bare mønstre og trekker mulige slutninger – men det kan være et verdifullt beslutningsstøtte.

DNA-analyse og genetisk matching

Bruken av DNA-tester har eksplodert blant slektsforskere det siste tiåret. Gjennom aktører som FamilyTreeDNA, AncestryDNA, 23andMe og MyHeritage DNA kan man få kartlagt sitt autosomale DNA og dermed finne nålevende (eller nylig avdøde) slektninger man deler segmenter med. Algoritmene bak disse tjenestene er i seg selv avanserte, om ikke AI i snever forstand. Men ettersom DNA-databaser vokser, tas maskinlæring og AI-teknikker i bruk for å tolke DNA-dataene bedre. Genetisk matching: Når du laster opp DNA-et ditt, sammenlignes det mot millioner av andre.

Dataprogrammet identifiserer segmenter der to personer deler identiske sekvenser – dette indikerer felles aner. Tradisjonelt har dette vært en deterministic prosess (harde algoritmer), men nå brukes også sannsynlighetsmodeller for å estimere hvor nært beslektet to personer er gitt størrelsen på delt DNA. For eksempel kan AI beregne at “det er 85% sannsynlig at dere er tremenninger, og 15% sannsynlig at dere er firmenninger med én ekstra felles ane.”

Slike beregninger tar hensyn til kjente fallgruver som innavl/anesammenfall i befolkningen – i Norge, med små bygdesamfunn, kan to personer dele DNA fra flere felles forfedre (de er i slekt gjennom flere linjer). Dette gjør at de ser mer beslektet ut genetisk enn det slektstreet skulle tilsi​. AI-modeller trenes på simulerte data for å skille slike tilfeller fra ekte nær slektskap.

Verktøy for DNA-slekt:

Autoklustering: MyHeritage tilbyr en AutoClusters-funksjon som grupperer dine DNA-matcher i klynger antatt å stamme fra samme gren av slekten. Dette gjøres ved en form for klyngingalgoritme (som vi kan kalle AI-light) hvor den ser hvilke kusiner som også matcher hverandre, etc. Resultatet er interaktive grafer hvor man kan se “denne gruppen på 20 personer stammer alle fra dine oldeforeldre på farssiden”. Dette er uvurderlig for å organisere matchene dine.

Triangulering og segmentanalyse: Nettjenester som GEDmatch gir deg avanserte verktøy for å se nøyaktig hvilke DNA-segmenter du deler med andre og om flere personer deler samme segment (= sannsynlig felles ane). Dette er komplekse data som typisk krever ekspertise å tolke. Vi begynner å se AI-assistenter som kan ta DNA-segmentdata og foreslå tolkninger. Tenk deg å kunne spørre: “AI, jeg har fem personer som alle matcher meg på segmentet på kromosom 15 posisjon 20-40 Mb. Hva betyr det?” og AI svarer “Disse kan alle stamme fra samme tippoldeforeldrepar. Sjekk om du finner det paret i slektstrærne deres.”

Slektskapssimulatorer: En annen bruk av AI er å simulere genealogiske scenarier for å se hva som passer DNA-funnene. For eksempel: du og en ukjent har såpass mye delt DNA at dere trolig er i slekt ca. 3.–4. ledd (tremenning eller firmenning). Det finnes AI-verktøy som kan generere mulige hypotetiske slektstrær som forklarer matchen (f.eks. at din oldefar hadde en ukjent bror som er den andres oldefar). MyHeritage’s Theory of Family Relativity gjør noe lignende ved å søke i slektstrær og historiske registre for mulige koblinger mellom to DNA-matcher – en slags intelligent “felles ane”-detektiv. Noen ganger kan det hoste opp en komplett teori (med kilder) om at “matchen din er din tipptante’s oldebarn, gjennom denne linjen…”. Dette er kombinasjon av slektsdata-søk og DNA-match, men drevet av ganske smarte algoritmer.

Haplogrupper og etnisitet: AI hjelper også til med å fininndele etnisitetsestimatene. De fleste selskaper oppgir etnisitetsprosentene dine (f.eks. 37% skandinavisk, 20% finsk etc.). Dette baseres på referansepopulasjoner og statistiske modeller. Maskinlæring brukes her for å forbedre treffsikkerheten – for eksempel ved å oppdage undersignaturer i DNA som er unike for Norge vs. Sverige (som ofte slås sammen som “Skandinavia”). Et godt eksempel er MyHeritage’s etnisitetsoppdatering som introduserte Norge som egen kategori (skilt fra dansk/svensk), basert på analyse av testdata fra mange nordmenn. De lanserte også “Genetiske grupper” som går mye dypere – f.eks. kan den si at du tilhører en genetisk gruppe knyttet til “Nord-Norge og Finnmark” eller “Trøndere med røtter i Jämtland”, basert på klynger i DNA-data. Dette er absolutt AI-arbeid under panseret.

For norske brukere er DNA-slektsforskning spesielt spennende men også utfordrende. Den norske befolkningen har historisk sett hatt lommer av endemisk befolkning (f.eks. øy-samfunn, dalfører) der det ble mange inngifte over generasjoner, noe som gir mye delt DNA mellom mange. AI må takle slike data for å unngå å overdrive slektskapet.

Samtidig har utvandring (som den store emigrasjonen til Amerika) gjort at nordmenn får tusenvis av fjerne amerikanske DNA-fetterer. Å navigere i dette krever verktøy. Plattformen GEDmatch er populær blant erfarne slektsgenetikere, fordi man kan laste opp rådata fra ulike selskaper og bruke avanserte analyser der. GEDmatch har til og med noen eksperimentelle forutsigelsesmodeller der du kan laste opp et “phantom kit” (en tenkt persons DNA) og se om det passer dine matcher, for slik å teste ut hypoteser om slektskap.

Etisk bruk av DNA-data

DNA-data er svært sensitive – de avslører ikke bare informasjon om deg, men også om din familie. Personvern og etikk er derfor en viktig del av AI-bruken her. Datatilsynet har rådet alle som tar en DNA-test til å lese personvernerklæringen nøye: vær oppmerksom på formuleringer om viderebruk av data​. Mange selskaper forbeholder seg retten til å dele anonymiserte data til forskning eller til kommersielle partnere. I Norge regnes faktisk ikke engang avidentifisert DNA som anonymt, siden DNA er unikt for hver person​. Man bør altså tenke gjennom hvor komfortabel man er med at dataene potensielt deles videre. I tillegg må man ta hensyn til familie: Når du laster opp ditt DNA avslører du også genetisk informasjon om dine søsken, foreldre, barn og fettere/kusiner (som deler store segmenter med deg)​.

Kanskje har disse slektningene ikke lyst til å bli “oppdaget” av ukjente, eller vite om visse genetiske disposisjoner. Det er god skikk å snakke med nærmeste familie før man tester seg, og i det minste være åpen om hva man finner ut. AI kan faktisk bidra her ved å legge inn personvernfiltre. For eksempel kunne en AI-assistent advare deg: “Denne DNA-matchen ser ut til å kunne være et resultat av en nylig familiehemmelighet (f.eks. ukjent far).

Er du sikker på at du vil kontakte vedkommende uten videre?” Lokalhistoriewiki beskriver hvordan DNA-basert slektsforskning kan avvike fra tradisjonell slektsforskning nettopp fordi den kan avsløre biologiske relasjoner som strider mot det de skriftlige kildene sier (adopsjon, ukjent farskap etc.)​. Dermed står man fort i et etisk dilemma: Skal man fortelle vidt og bredt at tippoldefar hadde et “uekte” barn, nå som DNA beviser det, selv om familien ikke visste det fra før? Slike spørsmål må hver slektsforsker ta stilling til. AI kan gi råd, men kan ikke erstatte god dømmekraft og respekt for personvern og følsom informasjon.

Etiske og metodiske betraktninger: kildekritikk, personvern og troverdighet

Vi har sett at AI kan levere imponerende resultater – lese gamle dokumenter, oversette språk, finne slektninger og skrive sammenhengende historier. Men med stor kraft følger stort ansvar. Her er noen viktige punkter å ha i mente når man tar i bruk AI i slektsforskning:

Kildekritikk og verifisering: Slektsforskning hviler på nøyaktighet og troverdige kilder. AI-verktøy kan hjelpe deg finne en opplysning, men du må fortsatt være kildekritisk. For eksempel, hvis en AI-chatbot gir deg en opplysning om en ane, må du sjekke om den faktisk kommer fra en kilde (og ikke er en “hallusinasjon” AI-en fant på). Det positive er at noen moderne AI-søk, som Arkivverkets eksperimentelle løsninger, gir kildehenvisninger sammen med svarene nettopp for at du skal kunne verifisere​.

Bruk alltid originalkilden som fasit. AI kan også gjøre feil i transkripsjoner – kanskje leser den “Arne” der det står “Anne”. Slike feil kan forplante seg hvis man ukritisk fører det inn i slektstreet. Så stol på AI med et våkent øye, på samme måte som du ville stolt på en transkribert kirkebok med forbehold om mulige avskriftsfeil.

Bias og skjevheter: AI-modeller er trent på data som kan ha skjevheter. Et oversettelsesverktøy kan f.eks. tolke gamle yrkesbetegnelser feil hvis de ligner moderne ord det kjenner bedre. Eller et ansiktsgjenkjenningsverktøy kan være trent mest på bilder av menn og derfor feiler oftere på kvinneportretter. Man bør være klar over at AI ikke er nøytral magi; den reflekterer kvaliteten og innholdet i treningsdataene. Heldigvis kan mange verktøy finjusteres med bedre data over tid – og genealogiske data er noe som stadig forbedres (flere korrekte transkripsjoner -> bedre HTR-modeller, flere norske DNA-prøver -> bedre estimater for norske regioner, osv.).

Personvern: Som vi berørte med DNA, men også aktuelt for levende slektsdata. Mange bruker online slektstrær der man legger inn nålevende familiemedlemmer. Seriøse aktører har personverninnstillinger som skjuler informasjon om nulevende for andre brukere. Men hvis du bruker en ekstern AI-tjeneste (f.eks. laster opp en GEDCOM til en chatbot), tenk over at du potensielt deler personopplysninger. Del aldri sensitiv informasjon ukritisk. Når det gjelder bilder, unngå å offentliggjøre bilder av nålevende personer uten samtykke selv om AI gjør det fristende å lage morsomme montasjer. Et annet aspekt er at AI-verktøy for ansiktsgjenkjenning og animasjon, som MyHeritage Deep Nostalgia, kjører på servere i utlandet – selv om selskapet forsikrer om datasikkerhet, så er det greit å vite hvor dataene dine havner.

Tolkningstroverdighet: AI kan generere flotte tekster – men er historiene helt sanne? Da AI Biographer ble lansert, var det litt debatt blant slektsforskere: Kan vi “pyntre” fortiden med informasjon AI henter fra generelle kilder? Blir det historie eller fiksjon? MyHeritage hevder at AI Biographer kun bruker verifiserte fakta fra slektstre og historiske kilder, og bare legger til allmenn historisk kontekst​. Likevel bør man skille mellom hva som er dokumentert om din forfader og hva som er AI-ens generelle bakgrunnsinformasjon. Kanskje skriver AI-en at “Hans Olsen vokste opp i en tid preget av napoleonskrigene” – det er sant som bakteppe, men vi vet ikke om det påvirket Hans direkte. Slike nyanser må man selv passe på i formidlingen. Altså, AI kan hjelpe deg å formidle slektshistorie mer levende, men troverdigheten må forankres i kildene du faktisk har.

“Black box” utfordringen: Ofte vet vi ikke hvordan AI kom frem til et gitt resultat. En transkripsjonsmodell kan f.eks. ha misforstått en bokstav fordi originalen var utydelig – men den gir ikke alltid beskjed om sin egen usikkerhet. Noen nye løsninger prøver å adressere dette ved å gi en sannsynlighetsskåre eller markere usikre tegn med annen farge. Som slektsforsker kan det være lurt å spørre seg: “Kan AI-en ha misforstått noe her?” hvis du ser noe som skurrer. En av styrkene med å involvere oss selv er at vi har kontekstuell kunnskap – f.eks. vet du kanskje at ingen het “Xristian” på 1800-tallet, så hvis AI leser et navn som det, er det nok “Christian” med gotisk C.

Til syvende og sist skal AI være et verktøy i verktøykassen. Slektsforskeren må fortsatt være prosjektlederen som setter mål, tar beslutninger og vurderer bevis. AI kan gjøre gruntarbeidet, komme med forslag og noen ganger gi deg aha-opplevelser, men det kan ikke erstatte din kritiske sans eller din kreativitet i å løse slektsgåter.

Konklusjon: AI som hjelpende hånd – slektsforskeren styrer skuta

Utviklingen innen kunstig intelligens går raskt, og slektsforskning er et felt som allerede drar nytte av denne utviklingen. For norske slektsforskere kan AI bety: lettere tilgang til kilder (gjennom automatisk transkribering og smart søk), bedre forståelse av materialet (gjennom oversettelse og kontekstanalyse) og nye funn (gjennom mønstergjenkjenning i trær og DNA). Samtidig vil ikke AI endre de grunnleggende prinsippene i slektsforskning – nøysom kildegransking, dokumentasjon av funn og etisk refleksjon forblir hjørnesteiner.

En treffende analogi er at AI fungerer som en dyktig research-assistent. Den kan lete frem kilder du ellers ville brukt uker på å finne, lese gjennom tungleste dokumenter i løpet av minutter, og komme med hypotetiske løsninger på floker. Men i likhet med en menneskelig assistent, må du sjekke arbeidet dens, gi den instrukser og noen ganger rette opp feil. AI forsterker slektsforskerens egne evner – du får kanskje superkrefter, men du må fortsatt bruke dem klokt. For Norge spesielt ser vi at kulturarvinstitusjoner som Arkivverket og Nasjonalbiblioteket omfavner AI for å åpne arkivene på nye måter. Samtidig er det flott å se at norske slektsforskere tar i bruk internasjonale nyvinninger (som MyHeritage sine AI-verktøy) og deltar i diskusjonen om hvordan dette best kan brukes. Det er viktig at brukergruppen (oss slektsforskere) gir tilbakemeldinger, slik at teknologien utvikles i tråd med våre behov og verdier.

Fremtiden: Vi kan bare ane hva som kommer. Kanskje om noen år kan du ha en helhetlig “AI-slektsguide” der du muntlig spør “Finn ut hvem oldemor sin biologiske far var” og AI-en setter i gang: søker i kirkebøker, analyserer DNA-sekvenser fra fetteren din, leser gjennom bygdeboka – og presenterer en rangert liste over kandidater med kildereferanser. Kanskje vil vi se AI som rekonstruerer ansikter av forfedre fra DNA (allerede på eksperimentstadiet), eller simulerer “virtuelle slektstreff” hvor man kan chatte med avatarer av forfedrene basert på alt vi vet om dem.

Uansett teknologiens høyder: slektsforskning vil fortsatt være drevet av nysgjerrighet og gleden av å knytte fortid og nåtid sammen. AI er bare en ny nøkkel som hjelper oss å låse opp flere dører i slektshistorien. Så ta den i bruk med iver, men også med omtanke – og lykke til videre på forskningsreisen din!

Referanser:

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.