Hver dag legger vi igjen en masse digitale spor: gjennom bruk av internett og mobiltelefoner, kredittkorttransaksjoner og passering av bomstasjoner. Der våre elektroniske spor møter forskningens nye analyseverktøy og algoritmer, åpnes det for innsyn i våre liv som kan være mer detaljert og nøyaktig om vår fortid, våre vaner og vår fremtid enn den oversikten vi selv har.

Forskning på Big Data åpner også for en rekke forskningsetiske spørsmål knyttet til informert samtykke og konfidensialitet og hvem som får tilgang til de enorme datasettene. Og fører det at mye data eies og kontrolleres av store kommersielle aktører til at deler av forskningen foregår utenfor offentlighetens radar?

Er teorien død?

I 2008 skrev Chris Anderson i teknologimagasinet Wired at dataflommen gjør teori overflødig. Selv om han har møtt mye motbør for utsagnet, satte han likevel ord på en ny tilnærming til data og forskning.

- Mens klassisk forskning er hypotesedrevet, virker mye av Big Data-forskningen datadrevet, sier Hallvard Fossheim, sekretariatsleder i Den nasjonale forskningsetiske komité for samfunnsvitenskap og humaniora.

Teknologioptimist

Bjørn Olstad

Ser muligheter. Bjørn Olstad. Foto: Lise Ekern

- For meg handler Big data om en mulighet for å skape verdier, forteller Bjørn Olstad, adm. dir. i Microsoft Norge. Han mener alt for mange er opphengt i farer og problemer, og vil heller fremheve mulighetene som ligger i Big Data, blant annet i forbindelse med personalisert helse. Bærbare enheter, skylagring kombinert med nye krav til sammenkoblede og kostnadseffektive helsetjenester driver også frem endringer, mener han.

Microsoft jobber sammen med Universitetene i Oslo og Tromsø på et helseprosjekt der ideen er å samle inn en masse helseopplysninger om enkeltpersoner gjennom mobile måleenheter, bearbeide dem, for så å sende resultatet tilbake til brukeren.

- Vi utvikler prosjektet ved å starte med friske mennesker, som kan si ja til at de vil ha datateknologi som en del av seg selv. Fra denne brukergruppen gjør man erfaringer som man kan utvikle en helsetjeneste for alle – både syke og friske, forteller Olstad.

Etiske utfordringer

- Store data betyr ikke automatisk interessante data, sier Anders Olof Larsson. Han er postdoktor ved Institutt for medier og kommunikasjon ved Universitetet i Oslo, og har blant annet forsket på twitterbruk.

Han forklarer at man som forsker må gjøre mange avveiiinger mellom hva som er teknisk mulig og hva som er etisk mulig. Hva slags data er det for eksempel OK å samle inn fra Internett uten å spørre avsenderen om lov?

- Et viktig prinsipp er hvilket formål avsenderen hadde med informasjonen, var den ment for forskning i utgangspunktet? Ofte må vi heller spørre: Hva slags bruk er det rimelig å tenke seg at personen har tenkt seg for innholdet, spør Larsson.

Når tvitrere bruker hashtags (#), eller emneord, er det for å sikre at ytringene blir synlig for flest mulig. Dette kan være et argument for at det ikke er nødvendig å hente inn samtykke til å bruke slike ytringer i forskning.

Hageslange vs. brannslange

Anders O. Larsson og Robindra Prabhu

Det er hvordan vi bruker dataene som er avgjørende, mener Robindra Prabhu og Anders Olof Larsson. Foto: Lise Ekern

Larsson ser klart faren for at Big Data kan medføre klasseskiller.

- Forskjellen mellom akademikeres og kommersielle aktørers muligheter og tilgang til data kan sammenliknes med forskjellen mellom en hageslange og en brannslange, sier han. Likevel mener han Big data kan skape muligheter for å bygge broer mellom akademia og kommersielle selskaper.

Big data stiller nye og høyere krav til teknisk kompetanse blant samfunnsvitere, men mangelen på felles verktøy har gjort at mange forskere bruker ulike ”hjemmesnekrede” løsninger for å analysere de store datasettene, forteller han. Dette gjør det vanskelig for andre forskere å kvalitetskontrollere og bedømme premissene som forskningen ble gjennomført etter.

Ryktet om teoriens død har han lite tro på. - Fortsatt kommer teoretiske og konseptuelle ferdigheter fortsatt til å være nødvendige for å gjøre god forskning. Vi trenger noe som gjør kan skille signaler fra støy. Her tror jeg samfunnsvitenskapelig teori har en viktig rolle. Mer enn noensinne trenger vi tverrvitenskapelige tilnærminger.

Analyse er aldri nøytralt

- Det er ikke noe iboende godt eller vondt i Big data, det handler om hvordan vi bruker dem, sier Robindra Prabhu, rådgiver i Teknologirådet. Han mener det har vært et litt for ensidig fokus har vært på innsamlingen av data, men mener vi også bør se på hvordan de analyseres.

- Algoritmene er jo ikke nødvendigvis verdinøytrale, sier han. Hvilke slutninger er det ok å trekke?

Digital eksos

Illustrasjon, prediktivt politi

Big data gir nye muligheter for å forutsi når og hvor kriminalitet vil oppstå. Ill: Teknologirådet.

- Big Data innebærer en ny tankegang rundt hvordan vi skal bruke de digitale sporene vi legger igjen hver dag inn i beslutningsprosesser i hverdagen, fremhever Prabhu, og viser flere eksempler, blant annet forteller han om et prosjekt i Genéve som har studert bevegelsesmønstre ved hjelp av mobilsignaler.

– Dette er en ny måte å vise hvordan vi bruker byrommene, og kan ha betydning for tilrettelegging av kollektivtransport, handel og mye annet.

Mulighetene for såkalt prediktivt politi, som allerede er en realitet flere steder i USA, åpner helt nye muligheter også for politiet i Norge, forteller Prabhu. Ved å beskrive kriminologiske teorier ved hjelp av matematiske modeller og mate disse med historiske og aktuelle kriminalitetsdata, kan man avdekke mønstre som kan brukes til å si noe om hvor og når fremtidig kriminalitet vil oppstå.

- Dette kan gi politipatruljene spesifikke områder de bør patruljere på gitte tidspunkter, forteller han. Men hva betyr det at politiet får pekt ut slike områder? Skal politiet kunne stoppe folk på gaten pga sannsynlighet fra datamodell – og hvordan skal slik informasjon kunne brukes i en eventuell rettsprosess?

Innebygd personvern

Hvordan vi ferdes gjennom dagen og legger igjen spor av oss selv utfordrer en del veldig sentrale personvernprinsipper, sier Catharina Nes i Datatilsynet, som var invitert til å kommentere innleggene.

- Vi i Datatilsynet mener disse prinsippene er viktigere enn noen gang. Med Snowden-saken ser vi også at dette skaper engasjement i befolkningen. Folk vil ha kontroll.

Det er mulig å drive forskning på store data, men det stiller store krav til at forskeren, sier hun. Hva gjør man med data? Hvor sensitive er data? Så lenge man anonymiserer, omfattes man i utgangspunktet ikke av personvernloven. Men hva med faren for reidentifisering? Med Big Data får vi større gråsoner for hva som er en anonym personopplysning, sier Nes.

- Dette stiller krav til at man bygger personvern inn i digitale tjenester og gjør gode risikovurderinger.

Seminaret var et samarbeid mellom De nasjonale forskningsetiske komiteene, Teknologirådet og Det Norske Videnskaps-akademi.