torsdag 4. april 2024

Den nye at-DNA normalen


I oktober 2023 opplevde 23andMe et betydelig datainnbrudd som innebar uautorisert tilgang til en stor mengde brukerinformasjon med hovedfokus på asjkenasiske jøder og etnisk kinesiske brukere. Hendelse vekket bekymring blant de ledende DNA-testfirmaer. Dette førte til umiddelbare tiltak for å styrke datasikkerheten, inkludert en midlertidig stans i muligheten for brukere til å laste ned sin egen DNA-informasjon for å dele den med andre testtjenester. Dette ble omtalt i et tidligere blogginnlegg.  

I tiden etter innbruddet har bransjen tatt flere skritt for å styrke brukersikkerheten, blant annet ved å innføre tofaktorautentisering hos Ancestry, MyHeritage og 23andMe. Disse endringene har gradvis gjenopprettet tilliten til disse tjenestene og bidratt til en ny normal for hvordan DNA-data håndteres. 

Gradvis har også mulighetene til å overføre DNA-data blitt delvis gjenopprettet. Nylig ble det også mulig å laste ned DNA-data fra 23andMe igjen, noe som markerer et steg mot å gjenopprette tidligere funksjonalitet. 

Imidlertid er det fortsatt en tjeneste som ikke ser ut til å komme tilbake i nær fremtid: muligheten til å laste ned alle DNA-treff segment data fra MyHeritage. Denne funksjonen var spesielt verdsatt for å enkelt overføre store mengder DNA-treff segment data til DNA Painter, et verktøy som kan benyttes for presentasjon av DNA-segment informasjon på kromosomnivå. Riktig nok så er det lite trolig at MyHeritage vil gjenopprette muligheten til å laste ned alle DNA-treff segment data som tidligere. Dette representerer en betydelig endring i hvordan brukere kan utnytte sine egne og andres genetiske data. For å gi et klarere bilde av de nåværende mulighetene for dataoverføring innen DNA-testing, illustrerer figuren over tilgjengelige alternativer og begrensninger.

Denne utviklingen reflekterer en viktig balanse mellom brukervennlighet og datasikkerhet innen genetisk testing og slektsforskning. Det understreker betydningen av å beskytte personlig informasjon i en tid hvor digitale trusler stadig er til stede, samtidig som det opprettholdes en viss grad av fleksibilitet for brukerne til å utforske sin genetiske arv.

onsdag 28. februar 2024

Mine 10 favoritt slektsforskning nettsider

Her følger min topp 10 liste for slektsforskning.

  • MyHeritage slektstrær og DNA database – husk å sjekke slektstre data
  • ChatGPT4 - din nye venn som kan fortelle deg det meste og også finne slekt - husk å sjekke dataene

I 2009 utarbeidet jeg en tilsvarende liste over de 10 mest relevante nettsider for slektsforskning, og det er interessant å observere at kun fire av disse nettstedene fortsatt er med i dag. En bemerkelsesverdig endring siden den gang er at Slekt og Data, som tidligere var representert med fire forskjellige nettsider, ikke lenger figurerer på listen.

fredag 26. januar 2024

Erfaringer med MyHeritage AI Record Finder

AIRF søkeresultat

Jeg har sett litt på MyHeritage sin nye kunstige intelligens-funksjon, kjent som «AI Record Finder» (AIRF), og sammenlignet den med deres eksisterende «Søk i historiske dokumenter» (SHD). Her er noen inntrykk så langt.

Min første observasjon er at jeg vanligvis får flere treff i SHD sammenlignet med AIRF. Dette kan skyldes at SHD er mer generøs med å inkludere resultater som kan være relatert til søket, selv om de ikke nødvendigvis er et nøyaktig treff. AIRF derimot, synes å være mer selektivt i sine resultater og gir færre treff. Dette kan være en fordel eller ulempe, avhengig av dine behov.

En annen forskjell er tiden det tar før søkeresultatet foreligger. SHD er raskere til å presentere søkeresultater, mens AIRF tar litt lengre tid. Imidlertid er forskjellen så liten at den sjelden utgjør en betydelig forskjell. 

En av de mest interessante funksjonene med AIRF er muligheten til å generere biografier basert på søkeresultatene. Dette kan være en enkel måte å kvalitetskontrollere data på. Det er viktig å merke seg at ikke alle treff i AIRF gir muligheten til å lage en biografi, spesielt når det gjelder treff i kirkebøker, hvor kildematerialet kanskje ikke er egnet for dette. Imidlertid gir treff i folketellinger og slektstrær ofte muligheten til å generere en biografi. Selv om AIRF kommer opp med flere riktige treff er det ikke alltid at alle disse treffene blir tatt med. 

Når det gjelder referanselisten for biografiene, er det viktig å merke seg at biografiene i AIRF baserer seg kun på noen få treff i MyHeritage-databasen. Dette betyr at de ikke inkluderer annen informasjon som kan være tilgjengelig på internett. Dette kan imidlertid gi en verdifull indikasjon på usikkerheten i dataene, da kildene blir oppgitt for alle opplysningene.

Samlet sett er det vanskelig å konkludere med at AIRF gir betydelige fordeler i forhold til SHD. Valget avhenger i stor grad av dine personlige preferanser og behov. Jeg foretrekker fremdeles å bruke SHD, spesielt fordi det gir bedre kontroll på søkeparameterne, flere søkeresultater og er raskere. Likevel kan AIRF være et verdifullt verktøy for de som ønsker å lage enkle biografier. Det er også verdt å merke seg at kunstig intelligens-teknologi stadig utvikler seg, så AIRF vil trolig forbedres ytterligere i fremtiden.

Samlet sett er både AIRF og SHD nyttige verktøy for slektsforskere, og det riktige valget avhenger av dine spesifikke mål og preferanser. Uansett hvilket verktøy du velger, er det spennende å se hvordan teknologien fortsetter å endre landskapet for slektsforskning.

onsdag 17. januar 2024

KI og slektsforskning

En DALL-E fremstilling av KI og slektsforskning
 i Norge i fremtiden.
I 2023 har kunstig intelligens (KI) gjennomgått betydelige fremskritt også innenfor slektsforskning, med avanserte språkmodeller som f.eks. ChatGPT som har revolusjonert tekstbehandling og dataanalyse. Denne utviklingen har ført til mer effektive metoder for å behandle og analysere historiske data.

Et markant eksempel på KI i slektsforskning er Ancestrys 2022  transkriberingen av den amerikanske folketellingen fra 1950Der gjorde KI det mulig å gjøre store datamengder søkbare i løpet av noen måneder. Dette illustrerer en viktig milepæl i datainnsamling og tilgjengeliggjøring. Ancestry har også gjort den kanadiske 1931 folketellingen søkbar ved hjelp av KI og anvender verktøyet i forbindelse med slektstre og DNA.

FamilySearch benytter KI til å transkribere håndskrevne dokumenter på flere språk som engelsk, spansk, portugisisk og italiensk. Også her gjøres dette arbeidet mye raskere enn hva som har vært mulig med transkribering utført av mennesker.

MyHeritage har integrert KI i bildebehandling for å fargelegge historiske fotografier og har tatt i bruk ChatGPT som en alternativ søkemotor for sin database, samt til å generere biografier, noe som kan forbedre brukeropplevelsen og tilgjengeligheten av slektsforskningsdata.

Nasjonalbiblioteket har også engasjert seg i KI-utvikling, spesielt gjennom bruk av Whisper-verktøyet for automatisk konvertering av norsk tale og dialekt til tekst. 

Digitalarkivet har laget et nytt bildesøk, hvor KI og nye søkemåter, sammen med en ny utforming, vil vi gi en annen bruksopplevelse enn tidligere. Der det tidligere kun var mulig å søke på tekstlig beskrivelse av bildet, kan du nå også søke med KI som tolker motivet. Bildesøket er også starten på det nye Digitalarkivet, slik det vil se ut for de som skal søke og finne arkivmateriale. Arkivverket jobber også med bruk av KI i transkribering av håndskrevne dokumenter.

KI anvendes også av slektsforskere for å lage oppsummeringer av tekster, noe som sparer tid og øker effektiviteten. Dette er spesielt nyttig når man arbeider med omfattende dokumenter eller historiske opptegnelser som krever betydelig tid til analyse. Det er imidlertid viktig å være oppmerksom på utfordringene knyttet til KI i slektsforskning. En av disse er risikoen for unøyaktigheter eller "hallusinasjoner" fra KI-modeller, noe som krever grundig menneskelig vurdering og fakta sjekking. 

I 2024 antas det at KI vil fortsette å bli en mer integrert del av slektsforskning, både gjennom forbedring av eksisterende verktøy og innføring av nye metoder for håndtering av slektsforskningsdata. Dette representerer en spennende tid for de med interesse for både teknologi og slektsforskning.

Joda, ChatGPT hjelper meg nesten daglig 😊

torsdag 28. desember 2023

Årets slektsforskerbragd

Årets Slektsforskerbragd glimret med sitt fravær i 2022, men det betyr ikke at det har manglet spennende utviklinger innenfor slektsforskningens verden. Dette året har vi vært heldige nok til å få tilgang til en imponerende mengde nye kilder, takket være en betydelig utvidelse av Nasjonalbibliotekets nettsamling

Nasjonalbiblioteket har virkelig trappet opp ved å øke antallet bøker tilgjengelig for søk og utforskning. Tidligere lå det omtrent 0,4 mill bøker tilgjengelig, men nå har dette tallet økt til imponerende 0,6 mill. En økning som gir oss enda mer å utforske og oppdage i våre aners historie.

Det er verdt å merke seg at av de 0,6 mill bøkene, er rundt 0,4 mill rettighetsbelagte. Dette gjenspeiler et dedikert arbeid fra Nasjonalbiblioteket for å gi oss tilgang til verdifull informasjon samtidig som de respekterer opphavsrettigheter. Vi må heller ikke glemme at Nasjonalbibliotek har hele 4,6 mill aviser. 

Denne økningen i tilgjengelige kilder styrker Nasjonalbibliotekets posisjon som et uvurderlig verktøy for norske slektsforskere. Det er viktig å ha en omfattende samling av bøker og ressurser lett tilgjengelig, spesielt når man dykker ned i slektenes historie.

Slektsforskning i Norge blir stadig enklere og mer spennende, og med Nasjonalbibliotekets bidrag, er vi bedre rustet enn noensinne for å utforske våre røtter. Så, slå deg ned, åpne din digitale skattkiste på Nasjonalbibliotekets nettside, og fortsett jakten på slektsfortellingene.

Husk at du må være innlogget og ha søkt om digital tilgang til pliktavleverte bøker, aviser og tidsskrift i Nettbiblioteket for å kunne få full tilgang.

Tidligere vinnere av årets slektsforskerbragd

torsdag 14. desember 2023

Hvor bør man ta en DNA test?

 

Dette er det nok like mange meninger om hvilke slektsprogram eller bilmerke som er best.

 

For yDNA eller mtDNA tester er FamilyTreeDNA det anbefalte stedet. For helsefokuserte tester velger man 23andMe.

 

Når det gjelder autosomal DNA testing så kan man, for å få størst sannsynlighet for gode treff, teste seg hos alle de fire største selskapene; Ancestry, 23andMe, MyHeritage og FamilyTreeDNA. Hvis man foretrekker å teste seg kun hos ett selskap, blir bildet litt mer komplekst. For de med hovedsakelig norske aner, er tilgang til MyHeritage sin DNA database avgjørende, da den er den suverent største. Globalt sett er derimot bildet annerledes da Ancestry sin DNA database er omtrent tre ganger større enn MyHeritage sin. Derimot er sjansen for å få relativt gode treff hos Ancestry og de andre databasene betydelig mindre enn hos MyHeritage for etnisk nordmenn. Men de fleste av oss har slekt i Amerika og da kan det være lurt å teste seg hos Ancestry og deretter overføre dataene til MyHeritage for å utnytte begge databasene. Dessverre er det ikke mulig å overføre data fra andre selskaper til Ancestry og 23andMe.

 

Før datainnbruddet hos 23andMe, tidligere i høst, var det relativt enkelt å overføre DNA data mellom noen av selskapene, som vist på figuren. Etter denne hendelsen har muligheten for dataoverføring blitt sterkt redusert, som indikert med spørsmålstegnene. Det er imidlertid håp om å gjenopprette denne muligheten, men det krever nok at den enkelte bruker benytter seg av tofaktor-pålogging, noe som vil gjøre bruken av disse databasene sikrere. Så vi får håpe at de fleste vil begynne å bruke tofaktor-pålogging. Hos Ancestry, 23andMe og MyHeritage kan man nå foreta tofaktor-pålogging ved å få tilsendt kode på epost slik at man ikke behøver å bruke en app.     

tirsdag 7. november 2023

Avtagende aktivitet i slektsfora

 

Som illustrert i figuren har aktiviteten i de mest aktive norske slektsforskerfora gradvis avtatt de siste årene. Først ute var Slekt og Data sitt «Slektsforum» hvor aktiviteten begynte å avta i 2019. At aktiviteten har avtatt der er kanskje ikke så rart når vi ser at også tidligere sentrale og erfarne medlemmer av Slekt og Data velger å bruke andre plattformer når de søker hjelp. I Facebook-gruppen «Slektshjørnet» har vi sett en tilsvarende reduksjon i aktiviteten siden 2020. Det ser ut til at begge disse fora står overfor en sakte død.

Når vi ser på «Brukernes eget forum» på Digitalarkivet, har aktiviteten begynt å minke fra 2021. Til slutt, for det mest aktive norske slektsforskningsforumet, nemlig Facebook-gruppen "Vi som driver slektsforskning," har vi observert redusert aktivitet siden 2022.

 

Årsakene til denne utviklingen er ikke nødvendigvis åpenbare. Det kan skyldes en generell nedgang i interessen for slektsforskning, men det kan også være et resultat av stadig flere slektsforskningsfora som tar over en del av aktiviteten. I min ideelle verden foretrekker jeg et begrenset antall større fora  fremfor mange mindre, da dette gjør det enklere å drive slektsforskning. Halvdøde fora gir vanligvis begrenset nytte, og det er vanligvis enklere å finne relevant informasjon ved å benytte seg av fora med høy aktivitet.

 

Når de to nasjonale slektsforskerforeningene selv har opprettet Facebook-grupper for generelle etterlysninger med liten aktivitet de siste årene, kan dette ha motsatt effekt og gjøre det mer utfordrende å drive slektsforskning, selv om det kanskje var deres intensjon å hjelpe. I stedet kan disse foreningene hjelpe medlemmene sine ved å henvise dem til  allerede etablerte, store slektsforskningsfora.