torsdag 4. april 2024

Den nye at-DNA normalen


I oktober 2023 opplevde 23andMe et betydelig datainnbrudd som innebar uautorisert tilgang til en stor mengde brukerinformasjon med hovedfokus på asjkenasiske jøder og etnisk kinesiske brukere. Hendelse vekket bekymring blant de ledende DNA-testfirmaer. Dette førte til umiddelbare tiltak for å styrke datasikkerheten, inkludert en midlertidig stans i muligheten for brukere til å laste ned sin egen DNA-informasjon for å dele den med andre testtjenester. Dette ble omtalt i et tidligere blogginnlegg.  

I tiden etter innbruddet har bransjen tatt flere skritt for å styrke brukersikkerheten, blant annet ved å innføre tofaktorautentisering hos Ancestry, MyHeritage og 23andMe. Disse endringene har gradvis gjenopprettet tilliten til disse tjenestene og bidratt til en ny normal for hvordan DNA-data håndteres. 

Gradvis har også mulighetene til å overføre DNA-data blitt delvis gjenopprettet. Nylig ble det også mulig å laste ned DNA-data fra 23andMe igjen, noe som markerer et steg mot å gjenopprette tidligere funksjonalitet. 

Imidlertid er det fortsatt en tjeneste som ikke ser ut til å komme tilbake i nær fremtid: muligheten til å laste ned alle DNA-treff segment data fra MyHeritage. Denne funksjonen var spesielt verdsatt for å enkelt overføre store mengder DNA-treff segment data til DNA Painter, et verktøy som kan benyttes for presentasjon av DNA-segment informasjon på kromosomnivå. Riktig nok så er det lite trolig at MyHeritage vil gjenopprette muligheten til å laste ned alle DNA-treff segment data som tidligere. Dette representerer en betydelig endring i hvordan brukere kan utnytte sine egne og andres genetiske data. For å gi et klarere bilde av de nåværende mulighetene for dataoverføring innen DNA-testing, illustrerer figuren over tilgjengelige alternativer og begrensninger.

Denne utviklingen reflekterer en viktig balanse mellom brukervennlighet og datasikkerhet innen genetisk testing og slektsforskning. Det understreker betydningen av å beskytte personlig informasjon i en tid hvor digitale trusler stadig er til stede, samtidig som det opprettholdes en viss grad av fleksibilitet for brukerne til å utforske sin genetiske arv.

onsdag 28. februar 2024

Mine 10 favoritt slektsforskning nettsider

Her følger min topp 10 liste for slektsforskning.

  • MyHeritage slektstrær og DNA database – husk å sjekke slektstre data
  • ChatGPT4 - din nye venn som kan fortelle deg det meste og også finne slekt - husk å sjekke dataene

I 2009 utarbeidet jeg en tilsvarende liste over de 10 mest relevante nettsider for slektsforskning, og det er interessant å observere at kun fire av disse nettstedene fortsatt er med i dag. En bemerkelsesverdig endring siden den gang er at Slekt og Data, som tidligere var representert med fire forskjellige nettsider, ikke lenger figurerer på listen.

fredag 26. januar 2024

Erfaringer med MyHeritage AI Record Finder

AIRF søkeresultat

Jeg har sett litt på MyHeritage sin nye kunstige intelligens-funksjon, kjent som «AI Record Finder» (AIRF), og sammenlignet den med deres eksisterende «Søk i historiske dokumenter» (SHD). Her er noen inntrykk så langt.

Min første observasjon er at jeg vanligvis får flere treff i SHD sammenlignet med AIRF. Dette kan skyldes at SHD er mer generøs med å inkludere resultater som kan være relatert til søket, selv om de ikke nødvendigvis er et nøyaktig treff. AIRF derimot, synes å være mer selektivt i sine resultater og gir færre treff. Dette kan være en fordel eller ulempe, avhengig av dine behov.

En annen forskjell er tiden det tar før søkeresultatet foreligger. SHD er raskere til å presentere søkeresultater, mens AIRF tar litt lengre tid. Imidlertid er forskjellen så liten at den sjelden utgjør en betydelig forskjell. 

En av de mest interessante funksjonene med AIRF er muligheten til å generere biografier basert på søkeresultatene. Dette kan være en enkel måte å kvalitetskontrollere data på. Det er viktig å merke seg at ikke alle treff i AIRF gir muligheten til å lage en biografi, spesielt når det gjelder treff i kirkebøker, hvor kildematerialet kanskje ikke er egnet for dette. Imidlertid gir treff i folketellinger og slektstrær ofte muligheten til å generere en biografi. Selv om AIRF kommer opp med flere riktige treff er det ikke alltid at alle disse treffene blir tatt med. 

Når det gjelder referanselisten for biografiene, er det viktig å merke seg at biografiene i AIRF baserer seg kun på noen få treff i MyHeritage-databasen. Dette betyr at de ikke inkluderer annen informasjon som kan være tilgjengelig på internett. Dette kan imidlertid gi en verdifull indikasjon på usikkerheten i dataene, da kildene blir oppgitt for alle opplysningene.

Samlet sett er det vanskelig å konkludere med at AIRF gir betydelige fordeler i forhold til SHD. Valget avhenger i stor grad av dine personlige preferanser og behov. Jeg foretrekker fremdeles å bruke SHD, spesielt fordi det gir bedre kontroll på søkeparameterne, flere søkeresultater og er raskere. Likevel kan AIRF være et verdifullt verktøy for de som ønsker å lage enkle biografier. Det er også verdt å merke seg at kunstig intelligens-teknologi stadig utvikler seg, så AIRF vil trolig forbedres ytterligere i fremtiden.

Samlet sett er både AIRF og SHD nyttige verktøy for slektsforskere, og det riktige valget avhenger av dine spesifikke mål og preferanser. Uansett hvilket verktøy du velger, er det spennende å se hvordan teknologien fortsetter å endre landskapet for slektsforskning.

onsdag 17. januar 2024

KI og slektsforskning

En DALL-E fremstilling av KI og slektsforskning
 i Norge i fremtiden.
I 2023 har kunstig intelligens (KI) gjennomgått betydelige fremskritt også innenfor slektsforskning, med avanserte språkmodeller som f.eks. ChatGPT som har revolusjonert tekstbehandling og dataanalyse. Denne utviklingen har ført til mer effektive metoder for å behandle og analysere historiske data.

Et markant eksempel på KI i slektsforskning er Ancestrys 2022  transkriberingen av den amerikanske folketellingen fra 1950Der gjorde KI det mulig å gjøre store datamengder søkbare i løpet av noen måneder. Dette illustrerer en viktig milepæl i datainnsamling og tilgjengeliggjøring. Ancestry har også gjort den kanadiske 1931 folketellingen søkbar ved hjelp av KI og anvender verktøyet i forbindelse med slektstre og DNA.

FamilySearch benytter KI til å transkribere håndskrevne dokumenter på flere språk som engelsk, spansk, portugisisk og italiensk. Også her gjøres dette arbeidet mye raskere enn hva som har vært mulig med transkribering utført av mennesker.

MyHeritage har integrert KI i bildebehandling for å fargelegge historiske fotografier og har tatt i bruk ChatGPT som en alternativ søkemotor for sin database, samt til å generere biografier, noe som kan forbedre brukeropplevelsen og tilgjengeligheten av slektsforskningsdata.

Nasjonalbiblioteket har også engasjert seg i KI-utvikling, spesielt gjennom bruk av Whisper-verktøyet for automatisk konvertering av norsk tale og dialekt til tekst. 

Digitalarkivet har laget et nytt bildesøk, hvor KI og nye søkemåter, sammen med en ny utforming, vil vi gi en annen bruksopplevelse enn tidligere. Der det tidligere kun var mulig å søke på tekstlig beskrivelse av bildet, kan du nå også søke med KI som tolker motivet. Bildesøket er også starten på det nye Digitalarkivet, slik det vil se ut for de som skal søke og finne arkivmateriale. Arkivverket jobber også med bruk av KI i transkribering av håndskrevne dokumenter.

KI anvendes også av slektsforskere for å lage oppsummeringer av tekster, noe som sparer tid og øker effektiviteten. Dette er spesielt nyttig når man arbeider med omfattende dokumenter eller historiske opptegnelser som krever betydelig tid til analyse. Det er imidlertid viktig å være oppmerksom på utfordringene knyttet til KI i slektsforskning. En av disse er risikoen for unøyaktigheter eller "hallusinasjoner" fra KI-modeller, noe som krever grundig menneskelig vurdering og fakta sjekking. 

I 2024 antas det at KI vil fortsette å bli en mer integrert del av slektsforskning, både gjennom forbedring av eksisterende verktøy og innføring av nye metoder for håndtering av slektsforskningsdata. Dette representerer en spennende tid for de med interesse for både teknologi og slektsforskning.

Joda, ChatGPT hjelper meg nesten daglig 😊