Kronikk punlisert på forskning.no 27. februar 2014

Norge er i en særstilling med sine store registre om utdanning, arbeid, inntekt, trygd, helse og andre opplysninger om befolkningen. De utgjør også en ressurs for forskningen, selv om slett ikke alle er etablert primært for dette formålet.

Siden registerforskning er forskning på allerede innsamlede data, er dette på en måte den enkleste typen forskning du kan være med på som forskningsdeltaker. Faktisk krever den så lite av deg at det kan hende du blir registerforsket på akkurat nå, uten en gang å kjenne noe til det.

Men nettopp denne fordelen innebærer også en utfordring i noen sammenhenger. I mye forskning regner vi det informerte, frivillige samtykket som en slags gullstandard.

Før man i et forskningsprosjekt skal samle inn opplysninger om enkeltpersoner, kreves det normalt at individene blir informert om prosjektet—om formål, metoder, hvem som skal gjøre hva og hva alt dette kan forventes å innebære for den enkelte deltakeren.

Mye registerforskning ville ikke vært gjennomførbar hvis man skulle sette samtykke som krav. Den ville krevd så mange arbeidstimer, og så store utgifter, at forskningen ikke kunne finne sted selv om prosessen på andre måter lot seg gjennomføre.

Dette skaper en diskusjon som har både etiske og juridiske sider. Når kan forskning finne sted uten samtykke? Hvordan går man best frem for å sikre forsvarlig og god registerforskning med andre tiltak? Vesentlig i denne sammenhengen er at forskningen har vår rettmessige tillit.

Å vinne felles goder

Tanken om rettmessig tillit innebærer at forskningen som utføres, kan forventes å bidra til reelle og viktige goder.

Registerforskning kan for eksempel dreie seg om å se sammenhenger mellom samfunnsmessige tiltak og deres virkninger, om korrelasjoner mellom levesett og risiko for sykdommer, eller analyser av sosiale ulikheter. Her er registerforskningens styrke ikke minst at den gir tilgang til de store tallene og lengre tidshorisonter.

Dette lar oss se det store bildet på en måte som ellers kanskje ikke er tilgjengelig, med hele eller store deler av befolkningen representert. Og det kan også la oss se de små bildene, i betydningen sjeldenheter, fordi man trenger store populasjoner for å skaffe pålitelige og dekkende tall om ting som ikke skjer så ofte.

En rekke offentlige registre muliggjør nyttig og viktig forskning, som i sin tur muliggjør bedre underbygde beslutninger på politisk og administrativt plan.

Forskning uten tårer

Rettmessig tillit betyr kanskje først og fremst at forskningen skal skje uten at noen av oss løper unødig risiko—for eksempel for at informasjon om oss havner i feil hender, eller at den blir misbrukt på noen måte.

En metodisk utfordring i registerforskning har naturlig nok å gjøre med å sikre at informasjon som slippes ut, ikke er unødig avslørende for enkeltindivider. ”Vanlige”, identifiserbare personopplysninger er opplysninger som inkluderer informasjon om hvem opplysningene gjelder, slik at man kan peke ut individet ved hjelp av informasjonen.

Anonyme opplysninger, derimot, er opplysninger som er av en slik art at pekerne til individene er fjernet slik at man ikke kan hekte dem tilbake på den enkelte. Anonyme opplysninger er dermed strengt tatt ikke lenger personopplysninger.

Såkalte ”av-identifiserte opplysninger” utgjør en slags mellomklasse. De skal se ut som anonyme opplysninger for dem som får dem, men samtidig finnes det måter å spore seg tilbake til enkeltindividene på. For eksempel kan den som deler ut data til forskeren beholde en nøkkel som gjør dette mulig.

Hva skal til for å sikre at data ikke er av en slik art at man kan trekke linjen tilbake til enkeltpersonene? Dette er gjerne spørsmål som krever enda mer kompetanse å svare trygt og troverdig på i tilfeller der forskningen inkluderer kopling av data mellom flere registre.

Identifiseringens grenser

Jeg kjenner ikke til tilfeller der norsk registerforskning har vært uforsiktig her.

Men vi kan skjele til registerforskningens vill vest-fetter, Big Data, for å se utfordringene klarere. Den enorme mengden med data om individer som den digitale revolusjonen innebærer, gjør at spørsmålet om muligheten for re-identifisering har fått en ny aktualitet, fordi begrensede datasett som i seg selv er blitt stemplet som anonyme, nå kan koples til annen tilgjengelig informasjon, slik at resultatet iblant kan bli mulig utpeking av enkeltindivider.

Det er liten grunn til tilsvarende engstelse med tanke på forvaltningen av norske registre. Men parallellen tjener likevel til å aktualisere noe som kan være en reell nok utfordring i forvaltningen av registrenes forskningsbruk, nemlig å vurdere hva som skal til for at man realistisk kan si at et datasett er anonymisert. Europarådets anbefaling er at informasjonen ikke er å anse som identifiserbar hvis slik re-identifisering vil kreve en urimelig mengde tid, kostnad og arbeidstimer.

Det sier seg selv at det krever både erfaring og godt skjønn å finne frem til rett ferdsel her i hvert enkelt tilfelle. Hvilken grad av viljestyrke, kompetanse og bemidling skal man tillegge den hypotetiske motparten som er ute etter å finne tilbake til ett eller flere enkeltindivider?

Her er det også på sin plass å huske at også identifisering av en mindre gruppe på aggregert nivå kan ha uheldige konsekvenser for de individene som antas å tilhøre gruppen, for eksempel ved stigmatisering.

Tillit og kunnskap

Tillit og kunnskap går hånd i hånd når tilliten er rettmessig. Men man kan også ha tillit uten kunnskap. Og det er nok i stor grad situasjonen i Norge i dag.

Registerforskingen er ansvarlig og produktiv nok, men de fleste av oss kjenner lite til den.

Vi er alle tjent med økt innsikt i den registerforskningen som foregår, og hvilke resultater den gir. Ikke bare for at tilliten dermed skal være berettiget i en mer fullstendig forstand, men også fordi viten om vår kunnskapsproduksjon er av betydning for beslutningsprosesser, og dermed i siste hånd for demokratisk legitimitet.