Når man gjennomfører en forskning, er det avgjørende å forstå forskjellen mellom enheter for observasjon og enheter for analyse. Disse begrepene er nært beslektet, men de har distinkte betydninger som er nødvendige for å definere populasjonen korrekt.

Enhet for observasjon refererer til det som blir direkte observert eller målt i studien. For eksempel, hvis spørsmålet er: "Hva er gjennomsnittlig tykkelse på hårene til menn i 20-årene?", så er enheten for observasjon hårstråene, ettersom målingene tas fra hvert enkelt hårstrå. Hvis man for eksempel måler tykkelsen på 100 hårstrå, kan disse 100 hårstråene hentes på forskjellige måter. Man kan for eksempel ta 100 hårstrå fra samme mann, eller ta ett hårstrå fra hver av 100 forskjellige menn. Den første metoden gir 100 målinger, men alle disse stammer fra én mann, og det er stor sannsynlighet for at disse hårstråene vil være ganske like. Den andre metoden representerer derimot et mer variert utvalg, ettersom den tar hårstrå fra forskjellige menn, som alle kan ha ulike genetiske egenskaper, vaner og livsstil.

Det som skiller enheter for observasjon fra enheter for analyse, er at enheten for analyse refererer til den grunnleggende enheten som forskeren ønsker å trekke konklusjoner om i studien. I eksempelet med hårstråene, er enheten for analyse mannen, ettersom studien ønsker å generalisere om menn som gruppe, og ikke bare om de individuelle hårstråene. Dersom vi tar hårstrå fra flere menn, representerer hver mann en egen enhet for analyse.

Enheten for analyse kan være én enhet for observasjon, eller en samling av enheter for observasjon, slik som i eksempelet med hårstråene. Enheten for analyse er vanligvis bestemt av forskningsspørsmålet: Hva er det som sammenlignes eller studeres? Enhetene for analyse må være adskilt eller tilnærmet adskilt fra hverandre for at konklusjonene skal ha statistisk gyldighet.

Noen ganger kan enhetene for observasjon og enhetene for analyse være de samme. For eksempel, i en studie som undersøker fiberinnholdet i fullkornsbrød og hvitt brød, er enhetene for observasjon brødskivene. Fiberinnholdet i hver skive måles, men enheten for analyse er faktisk hele brødet, ettersom man sammenligner typer brød (ikke enkeltstående skiver). Hvis man i stedet hadde brukt forskjellige brød fra ulike bakere, ville enhetene for analyse vært brød, og enhetene for observasjon ville vært de individuelle skivene.

Det er viktig å merke seg at noen ganger blir enhetene for observasjon og enhetene for analyse behandlet som de samme, men at det kan være viktige forskjeller i studiens struktur som må tas i betraktning. Hvis vi for eksempel undersøker blodtrykket til pasienter under og over 40 år, kan vi først måle blodtrykket på høyre arm for alle pasientene, og deretter på venstre arm. Her blir enheten for analyse pasienten, ettersom det er pasientene vi sammenligner. Men for hver pasient måler vi flere observasjoner (blodtrykk på høyre og venstre arm). Dette viser hvordan samme enhet for analyse kan ha flere enheter for observasjon.

Når man definerer enhetene for analyse, er det viktig å huske på at det er disse enhetene som sammenlignes i studien, ikke de individuelle observasjonene. For eksempel, i en studie om fysisk aktivitet hos barn, kan hver elev være både en enhet for observasjon og en enhet for analyse. Hver elev får én måling på sin fysiske form etter studiens slutt, og vi sammenligner de ulike programmene som barna har deltatt i. Derfor er både enhetene for observasjon og analysenheter de samme – nemlig barna.

I tilfeller der gruppemedlemmer ikke er uavhengige, for eksempel i studier av mennesker som er i samme familie eller som deler et sosialt miljø, må forskerne ta høyde for at observasjonene ikke er uavhengige. I slike tilfeller kan forskerne velge å bruke enheter som representerer individuelle personer, eller de kan velge å bruke grupper som enheter for analyse, alt etter hva som passer best for forskningsspørsmålet.

En viktig lærdom er at forskningsspørsmålene, og dermed enhetene for observasjon og analyse, må være klart definert før datainnsamlingen. Hvis dette ikke gjøres på forhånd, kan analysen bli misledende eller feilaktig, ettersom vi kan komme til å trekke feil konklusjoner ved å sammenligne feil enheter.

Det er også nødvendig å definere begrepene og terminologien som brukes i forskningen. Uten klare definisjoner kan det være uklart for andre hva som faktisk er blitt målt eller hva forskningen faktisk undersøker. Dette kan føre til misforståelser og manglende reproduserbarhet i forskningen. Klarhet rundt enhetene for observasjon og analyse er essensielt for å sikre at forskningen gir pålitelige og meningsfulle resultater.

Hvordan kan vi vurdere påstander om sannsynligheter og proporsjoner ved hjelp av hypotesetesting?

Når vi står overfor påstander som hevder at en bestemt populasjon følger en spesifikk sannsynlighet eller proporsjon, som for eksempel at en pizza er «en ekte 12-tommers pizza», eller at en terning er «rettferdig», er det avgjørende å bruke statistiske metoder for å vurdere om påstanden er troverdig. Hypotesetesting er en metode som lar oss gjøre slike vurderinger ved å bruke et utvalg av data for å trekke konklusjoner om en større populasjon.

La oss ta et eksempel med en påstand fra et australsk pizzafirma som hevder at deres 12-tommers pizza er nettopp det: en 12-tommers pizza. En rimelig antakelse for å teste denne påstanden er at pizzaene faktisk har en gjennomsnittlig diameter på 12 tommer. For å undersøke dette blir det tatt et utvalg av 125 pizzaer, og den gjennomsnittlige diameteren i utvalget er beregnet til 11,48 tommer. Dette gir oss et konkret mål som vi kan bruke til å vurdere om påstanden holder vann.

Det er flere faktorer som kan påvirke hva vi finner i et utvalg. For det første, kan vi alltid forvente at et utvalg ikke vil gi nøyaktig det samme resultatet som hele populasjonen på grunn av tilfeldige variasjoner – det er rett og slett slik statistikk fungerer. Hvis gjennomsnittsdiameteren i utvalget er 11,48 tommer, er det én mulig forklaring at variasjonen skyldes tilfeldige svingninger i utvalget. Hvis, derimot, den gjennomsnittlige diameteren er betydelig lavere enn 12 tommer, for eksempel 11,25 tommer, kan dette være et tegn på at påstanden fra pizzafirmaet er feil. På samme måte, hvis vi ser et resultat som er nærmere 12 tommer, kan vi mistenke at påstanden er korrekt, men vi må også ta i betraktning at større utvalg kan gi mer presise resultater.

Hypotesetesting fungerer på lignende måte i andre tilfeller, som for eksempel når vi tester om en terning er rettferdig. Tenk deg at du kjøper en terning som hevder å være «rettferdig», men i pakken finner du ingen indikasjon på hvilken terning som er rettferdig, og hvilken som er lastet. Hvordan kan vi avgjøre hvilken terning som er rettferdig? Anta at den rettferdige terningen skal vise en 1/6 sannsynlighet for å lande på et hvilket som helst nummer, og vi kan bruke en rekke kast for å samle inn data. Hvis vi kaster terningen 50 ganger og får en gjennomsnittlig andel på for eksempel 0,38 som viser et bestemt nummer, er dette mer enn bare tilfeldige variasjoner, og vi begynner å mistenke at denne terningen er lastet.

I dette eksemplet er hypotesetesten delt inn i flere trinn:

  1. Antakelse om parameteren: Vi antar at terningen er rettferdig, og derfor skal andelen for hvert nummer være 1/6 (p = 1/6).

  2. Forventninger for statistikken: Hvis vi kaster terningen 50 ganger, vil vi forvente at andelen som viser et bestemt nummer er nær 1/6, selv om det kan variere litt på grunn av tilfeldigheter.

  3. Evaluering av observasjonene: Ved å faktisk kaste terningen et visst antall ganger (for eksempel 50), finner vi den observerte andelen, og sammenligner den med hva vi forventer fra en rettferdig terning.

  4. Avgjørelse: Hvis den observerte andelen er veldig forskjellig fra det vi forventet (som en stor avvik fra 1/6), kan vi konkludere med at terningen sannsynligvis ikke er rettferdig.

Etter å ha samlet inn et utvalg og beregnet den observerte proporsjonen, kan vi bruke en samplingfordeling for å forstå variasjonen i disse verdiene. Dette gir oss en indikasjon på hvilke verdier vi kan forvente, gitt at vi har en rettferdig terning, og hvordan vi kan bruke denne informasjonen til å ta beslutninger.

I eksemplet med terningen, hvis vi kaster 50 ganger og får en proporsjon på 0,38 som viser et bestemt nummer, kan vi vurdere om dette er et unormalt resultat. Dette gir oss et viktig verktøy for å vurdere om vi har å gjøre med en rettferdig terning eller en lastet terning, basert på hvordan dataene våre stemmer overens med de statistiske forventningene for en rettferdig terning.

For å oppsummere, hypotesetesting gir oss en systematisk tilnærming for å vurdere påstander om populasjoner. I slike tester sammenligner vi den observerte statistikken i vårt utvalg med hva vi ville forvente basert på en forhåndsdefinert hypotese om populasjonen. Dette gir oss verktøyene til å konkludere om påstandene er troverdige, eller om vi bør avvise dem som feilaktige. Det er viktig å merke seg at hypotesetesting alltid innebærer en viss grad av usikkerhet, da vi kun jobber med prøver og ikke hele populasjonen.