Kvantitativ metode: berekning av manglande verdiar

Når mange respondentar har hoppa over eit spørsmål i ei surveyundersøking, når kan ein bruke statistiske teknikkar for å berekne den mest sannsynlege verdien i det feltet som manglar (”imputation”)?

[Den følgende teksten er et eksempel eller "case", som kan tjene som utgangspunkt for refleksjon og diskusjon. Noen eksempler kan være basert på reelle hendelser, mens andre er fiksjonelle fremstillinger.]

Ei forskargruppe som studerer psykisk helse blant ungdom prøvar ut eit mål for å kunne fastslå om respondentar i ei surveyundersøking lid av depresjon. Målet er ein additiv indeks beståande av tjue spørsmål med ein skala på ein til fem. Dersom svara summerer seg til over 60, havnar respondenten i kategorien “lid av depresjon”. Dei som fell i denne kategorien vert kontakta av forskarane med tilbod om oppfølging gjennom helsesøster og Pedagogisk-psykologisk tjeneste (PPT).

Når forskarane går gjennom talmaterialet frå ein skule med omfattande problem med mobbing, viser det seg at mange gutar har hoppa over det eine spørsmålet, eit spørsmål om ein har tenkt på å ta sjølvmord siste månaden. Utan svar på dette spørsmålet, kan ikkje forskarane bruke den additive indeksen.

Nokre av forskarane meiner at ein bør bruke statistiske teknikkar for å berekne den mest sannsynlege verdien i det feltet som manglar (”imputation”). Alternativet er å forkaste svara på dei andre nitten spørsmåla som utgjer indeksen, og ikkje få informasjon om desse ungdommane i det heile. Andre meiner dette er å føre respondentane bak lyset, og at ein måtte ha opplyst ungdommane på førehand dersom ein ønskja å fylle ut svar på vegne av respondentane.

Kva meiner du? Gjer storleiken på populasjonen nokon forskjell? Stiller det seg anleis dersom undersøkinga hadde handla om haldningar til innvandring eller klimapolitikk?

Les også: Kvantitativ metode