Når man sammenligner gjennomsnittlige endringer i målinger, for eksempel endringer i triglyseridnivåer (TG) etter et behandlingseksperiment, er det essensielt å bruke statistiske verktøy som konfidensintervall (CI) og hypotesetesting for å vurdere om resultatene er pålitelige og om behandlingen har en signifikant effekt.

Et konfidensintervall gir oss et interval hvor vi kan forvente at den sanne gjennomsnittlige endringen i populasjonen ligger, basert på et utvalg. Hvis et 95% CI for en gjennomsnittlig endring i TG er fra 27,88 til 49,36 mg.dL−1, betyr det at vi har 95% tillit til at den sanne gjennomsnittlige endringen i TG i populasjonen ligger innenfor dette intervallet. En negativ endring på -7,12 mg.dL−1 for kontrollgruppen som drakk varmt vann kan derimot indikere at det ikke er noen signifikant effekt av placebo, ettersom konfidensintervallet for denne gruppen er mye bredere, og inkluderer verdier både under og over null.

Hypotesetesting innebærer å formulere en nullhypotese (H₀) som postulerer at det ikke er noen endring i TG etter behandlingen, og en alternativ hypotese (H₁) som hevder at det er en endring. I dette tilfellet er nullhypotesen at den gjennomsnittlige endringen i TG for gruppen som drakk kamille-te er null, mens alternativhypotesen er at det er en betydelig endring. Gjennom beregning av t-verdier og p-verdier kan man teste hypotesen om at behandlingene gir en statistisk signifikant effekt. I eksemplet som er gitt, er t-verdien for kamille-gruppen t = 7,19 med en p-verdi mindre enn 0,001, noe som gir svært sterk bevis for at behandlingen hadde en signifikant effekt. På den andre siden er t-verdien for kontrollgruppen t = −1,10 med en p-verdi over 0,10, som indikerer at placebo-behandlingen ikke hadde en signifikant effekt.

For å utføre en hypotesetest for en gjennomsnittlig forskjell mellom to grupper, følger man noen enkle trinn. Først beregnes den gjennomsnittlige forskjellen for hver gruppe, samt standardfeilen for forskjellen. Deretter beregnes t-verdien ved å bruke formelen:

t=dμds.e.(d)t = \frac{\overline{d} - \mu_d}{\text{s.e.}(\overline{d})}

hvor d\overline{d} er gjennomsnittlig forskjell i observasjonene, μd\mu_d er den forventede forskjellen (null i vårt tilfelle), og standardfeilen s.e.(d)\text{s.e.}(\overline{d}) er et mål for hvordan gjennomsnittet varierer mellom ulike prøver. Resultatet fra denne testen kan sammenlignes med en t-fordeling for å bestemme p-verdien, som gir oss informasjon om hvor sannsynlig det er at observasjonen skyldes tilfeldigheter.

I tillegg til t-testene, er det viktig å merke seg at for slike sammenligninger, hvor målingene er tatt fra de samme individene eller enhetene før og etter behandlingen, benytter man såkalt "paired data", der forskjellene mellom de to tidspunktene for hvert individ beregnes. Dette gjør det mulig å kontrollere for individuelle forskjeller og gir en mer presis sammenligning enn hvis man sammenligner to uavhengige grupper.

Det er også viktig å sikre at de statistiske forutsetningene for analysen er oppfylt. For eksempel må dataene være tilnærmet normalt fordelte, og utvalgsstørrelsen bør være tilstrekkelig stor for at resultatene skal være pålitelige. Når man har et tilstrekkelig stort utvalg, kan man bruke den såkalte 68–95–99.7 regelen (som beskriver hvordan dataene fordeler seg i en normalfordeling) for å estimere konfidensintervallene og vurdere signifikansen av resultatene.

En annen viktig ting å huske på er at konfidensintervallene gir mer enn bare et estimat av den gjennomsnittlige endringen. De gir oss også et mål på usikkerheten rundt estimatet, noe som er avgjørende når man tolker effekten av en behandling. Et smalt intervall indikerer høy presisjon i estimeringen, mens et bredt intervall kan tyde på større usikkerhet. For eksempel, dersom et behandlingsresultat gir et smalt konfidensintervall for gjennomsnittlig reduksjon i TG, kan man være mer sikker på at effekten er reell.

Det er også viktig å merke seg at konfidensintervallene og p-verdiene bør vurderes sammen. Selv om p-verdien kan indikere om en effekt er statistisk signifikant, gir konfidensintervallet mer informasjon om størrelsen på effekten og graden av usikkerhet. For eksempel, dersom en p-verdi er svært liten (som i eksemplet med kamille-te), men konfidensintervallet er svært bredt, kan dette indikere at resultatet er signifikant, men at den reelle effekten kan være stor eller liten.

Når man jobber med "paired data", som i studiene av endringer før og etter behandling på samme individer, gir det også en ekstra fordel at man kan bruke samme deltaker for begge målingene, noe som reduserer effekten av individuelle forskjeller og gir mer pålitelige resultater.

For forskere og lesere som benytter statistikk for å evaluere effekten av behandlinger eller tiltak, er det avgjørende å ikke bare fokusere på p-verdier, men også vurdere konfidensintervallene, effekten størrelse, og hvordan dataene er samlet inn. Dette gir et mer nyansert bilde av resultatene, og hjelper til med å unngå feiltolkninger som kan oppstå ved å kun stole på p-verdier.

Hvordan sammenligne to andeler: Konfidensintervall og hypotesetester for proporsjoner

Samplingfordelingen beskriver hvordan verdiene for p^Lp^N\hat{p}_L - \hat{p}_N varierer fra utvalg til utvalg. Å finne et 95% konfidensintervall for forskjellen mellom proporsjonene er dermed en prosess som ligner på den vi har brukt tidligere, ettersom samplingfordelingen har en tilnærmet normalfordeling:

statistikk±multipliserer×s.e. (statistikk).\text{statistikk} \pm \text{multipliserer} \times \text{s.e. (statistikk)}.

Når statistikken er p^Lp^N\hat{p}_L - \hat{p}_N, blir det tilnærmede 95% konfidensintervallet:

(p^Lp^N)±2×s.e.(p^Lp^N).(\hat{p}_L - \hat{p}_N) \pm 2 \times \text{s.e.}(\hat{p}_L - \hat{p}_N).

For vårt eksempel blir det tilnærmede konfidensintervallet 0.1490±(2×0.042830)0.1490 \pm (2 \times 0.042830), som gir 0.149±0.08570.149 \pm 0.0857, altså fra 0.0633 til 0.235 når vi runder av. Dette tilnærmede intervallet er svært likt det eksakte intervallet fra programvaren. Vi skriver:

Forskjellen mellom proporsjonene av studenter som spiser flest måltider hjemme, er 0.1490, høyere blant de som bor med foreldrene sine (0.963; n = 52) enn de som ikke bor med foreldrene (0.814; n = 129), med et tilnærmet 95% konfidensintervall fra 0.0633 til 0.235.

Det er viktig å merke seg at konfidensintervallet alene ikke er nok. Retningen på hvordan forskjellen er beregnet må også gis, slik at leseren vet hvilken gruppe som hadde den høyere proporsjonen.

Hypotesetester for sammenligning av proporsjoner: z-test

Når vi skal sammenligne de to proporsjonene ved hjelp av en hypotesetest, er det tosidige forskningsspørsmålet: Er befolkningsproporsjonen for studenter som spiser flest måltider utenfor campus den samme for studenter som bor med foreldrene og studenter som ikke bor med foreldrene? Som vanlig antar vi at nullhypotesen er sann. I denne sammenhengen innebærer det at vi antar at befolkningsproporsjonen for å spise flest måltider utenfor campus er den samme i begge gruppene:

  • H0:pLpN=0H_0: p_L - p_N = 0 (tilsvarer pL=pNp_L = p_N).

Alternativhypotesen, som er tosidig, blir:

  • H1:pLpN0H_1: p_L - p_N \neq 0 (tilsvarer pLpNp_L \neq p_N).

Siden nullhypotesen antas å være sann, antas det at proporsjonene har samme verdi i begge gruppene. Dataene fra de to gruppene kan derfor slås sammen for å beregne en felles (eller samlet) proporsjon av studenter som spiser flest måltider utenfor campus:

p^=52+10552+105+2+24=157183=0.85792.\hat{p} = \frac{52 + 105}{52 + 105 + 2 + 24} = \frac{157}{183} = 0.85792.

Dette er den samlede proporsjonen av studenter som spiser flest måltider utenfor campus, ettersom vi har antatt at det ikke er noen forskjell mellom de to gruppene (de som bor med og de som ikke bor med foreldrene). Denne proporsjonen beregnes ved å summere kolonnene i tabell 31.1 og bruke disse dataene til å beregne proporsjonen.

Som i enhver hypotesetest, starter vi med å anta at nullhypotesen er sann. Dette innebærer at proporsjonen i hver gruppe er den samme, og derfor beregnes standardfeilene ved å bruke den samlede proporsjonen. De ulike proporsjonene for de to gruppene (L og N) vil variere fra utvalg til utvalg, og dermed vil forskjellen mellom proporsjonene også variere. Under visse betingelser (se kapittel 31.7) vil denne samplingfordelingen ha en normalfordeling.

Beregning av standardfeil

Standardfeilen for sampleproporsjonene i de to gruppene kan beregnes ved hjelp av den samlede proporsjonen p^\hat{p}. For LL-gruppen blir standardfeilen:

s.e.(p^L)=p^(1p^)nL=0.85792(10.85792)54=0.047511.s.e.(\hat{p}_L) = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n_L}} = \sqrt{\frac{0.85792(1 - 0.85792)}{54}} = 0.047511.

For NN-gruppen blir standardfeilen:

s.e.(p^N)=p^(1p^)nN=0.85792(10.85792)129=0.030739.s.e.(\hat{p}_N) = \sqrt{\frac{\hat{p}(1 - \hat{p})}{n_N}} = \sqrt{\frac{0.85792(1 - 0.85792)}{129}} = 0.030739.

Når vi beregner standardfeil

Hvordan sammenligne kvalitative data mellom individer

Sammenligning av kvalitative data mellom ulike individer eller grupper er en viktig metode innen statistikk og analyse. Denne prosessen gir innsikt i mønstre, trender og forskjeller som kan være avgjørende for å forstå dynamikken i et gitt datamateriale. Det finnes flere metoder for å gjøre slike sammenligninger, og valget av metode avhenger av datatypen, målene for analysen og den statistiske metoden som benyttes.

En vanlig måte å sammenligne kvalitative data på er ved hjelp av toveis tabeller. Disse tabellene gjør det mulig å organisere og visualisere hvordan ulike kategorier forholder seg til hverandre på tvers av grupper eller individer. For eksempel kan man analysere sammenhengen mellom kjønn og yrkesvalg, eller mellom geografisk plassering og tilgang på helsevesen. Hver rad og kolonne i tabellen representerer forskjellige kategorier, og antall observasjoner i de ulike cellene kan gi en indikasjon på hyppigheten av visse kombinasjoner av kategorier.

En videre detaljering av toveis tabeller kan inkludere oppsummeringstabeller, hvor dataene ordnes på tvers av både rader og kolonner. Dette kan hjelpe til med å identifisere spesifikke mønstre som kanskje ikke er lett synlige i en enkel toveis tabell. Oppsummeringstabeller kan for eksempel benyttes til å beregne relativfrekvenser eller sammenligne forholdet mellom ulike kategorier på tvers av grupper.

Når man sammenligner kvalitative data, kan grafer være svært nyttige. Diagrammer som stolpediagrammer eller sektordiagrammer kan visualisere fordelingen av data på en intuitiv måte. Ved å bruke disse grafene kan man lettere oppdage skjevheter, trender og forskjeller i kategoriske data. For eksempel kan en sektor- eller stolpediagram vise hvordan ulike yrkesgrupper er fordelt mellom kjønnene, noe som kan bidra til å avdekke kjønnsforskjeller i yrkesvalg.

Numeriske oppsummeringer er også nyttige når man sammenligner kvalitative data, spesielt når man ønsker å beregne forskjeller i proporsjoner mellom grupper. Et vanlig mål i slike sammenligninger er å beregne forskjellen mellom andeler, for eksempel forskjellen mellom andelen kvinner og menn som velger et bestemt yrke. Dette kan gi et mål for kjønnsforskjellen i valgene som gjøres i ulike grupper.

Odds ratio er et annet nyttig mål som benyttes i sammenligninger av kvalitative data. Dette målet sammenligner forholdet mellom oddsene for at en hendelse skjer i en gruppe sammenlignet med oddsene for at samme hendelse skjer i en annen gruppe. For eksempel kan en odds ratio brukes til å sammenligne sannsynligheten for at personer fra ulike regioner har tilgang til rent vann. Dersom odds ratioen er høyere enn 1, indikerer det at gruppen i den første regionen har større sannsynlighet for å ha tilgang til rent vann enn gruppen i den andre regionen.

Eksempler kan gjøre teorien lettere å forstå. For eksempel, når vi ser på store nyrestein, kan vi bruke toveis tabeller til å sammenligne antall personer med store nyrestein i ulike aldersgrupper, eller i ulike geografiske områder. Slike data kan hjelpe helsemyndigheter til å forstå hvilke grupper som er mest utsatt og til å planlegge for målrettede tiltak.

Det er også mulig å bruke slike sammenligninger til å se på andre faktorer som har betydning for individers helse, som tilgang på rent vann. En sammenligning mellom to grupper som har ulik tilgang på rent vann kan avsløre store helseforskjeller. Ved å bruke både numeriske oppsummeringer og grafiske fremstillinger, kan forskere og beslutningstakere få en bedre forståelse av hvordan disse faktorene påvirker ulike befolkningsgrupper.

Det er viktig å forstå at mens kvalitative data kan gi verdifull innsikt, er det essensielt å bruke passende statistiske metoder for å sikre at resultatene er pålitelige og gyldige. Både toveis tabeller, grafiske fremstillinger og numeriske mål gir en bredere forståelse, men de bør alltid vurderes i sammenheng med dataenes kvalitet, utvalget og eventuelle skjevheter i informasjonen som samles inn.

I tillegg er det viktig å merke seg at kvalitative data kan være underlagt mange tolkninger, og det er avgjørende å være kritisk til hvordan man kategoriserer og analyserer informasjon. Selv små forskjeller i måten man samler inn og organiserer data på kan føre til store endringer i de statistiske resultatene.