Stem-and-leaf diagrammer, også kjent som stamme-og-blad-diagrammer, er en rask og enkel metode for å visualisere fordelingen av kvantitative data. Dette verktøyet, introdusert av John Tukey på 1970-tallet, gir en klar og lettfattelig fremstilling av hvordan observasjoner fordeler seg innen et datamateriale, spesielt når antallet observasjoner ikke er for stort. Selv om det kan ligne et histogram, har stem-and-leaf diagrammet en stor fordel: det viser de faktiske verdiene av observasjonene, noe som kan være avgjørende i enkelte analyser.

Et stem-and-leaf diagram består av en "stamme", som representerer en gruppe av tall, og "bladene", som er de individuelle observasjonene innenfor denne gruppen. For eksempel, i et sett med blodtrykksmålinger, kan stammen representere hele titallene (som 110, 120, 130), og bladene representerer de spesifikke målingene innenfor hvert intervall (som 112, 115, 118). Denne metoden gjør det mulig for forskere å raskt få oversikt over dataene og identifisere mønstre, uten å måtte stole på komplekse statistiske programmer eller prosedyrer.

I et eksempel kan vi se på blodtrykkene til 50 individer, hvor observasjonene er sortert etter verdier. Stammen kan representere blodtrykk i 10 mmHg intervaller (for eksempel 110, 120, 130), og bladene kan representere spesifikke blodtrykksmålinger (som 112, 115, 118). En slik visualisering gir en intuitiv følelse av hvordan dataene er fordelt – om de er jevnt spredt eller om det er konsentrasjon rundt visse verdier.

En fordel med stem-and-leaf diagrammer er at de umiddelbart avslører den eksakte fordelingen av observasjonene. Samtidig er det en begrensning at de ikke viser prosentandeler, slik histogrammer gjør. Dette kan være viktig når man ønsker å forstå fordelingen i prosent, særlig når datamengden varierer sterkt. Likevel, den eksakte verdien av hver observasjon kan være avgjørende i visse kontekster, som i medisinske eller økonomiske studier, der man ønsker å analysere nøyaktige målinger og identifisere eventuelle ekstreme verdier eller uteliggere.

For å lage et stem-and-leaf diagram, kan man følge noen enkle trinn. Først vurderes dataene for å bestemme passende intervaller for stammen. Deretter plasseres observasjonene på de respektive bladene i henhold til deres verdi. Bladene sorteres i stigende rekkefølge for å gjøre diagrammet lettere å lese. I mer komplekse situasjoner kan man bruke farger eller symboler for å representere undergrupper av observasjoner, for eksempel for å skille mellom ulike aldersgrupper eller behandlingsmetoder, som vist i eksemplene med blodtrykk og tobakkbruk.

Et annet viktig aspekt ved stem-and-leaf diagrammer er muligheten til å visualisere data for ulike subgrupper. For eksempel kan man bruke forskjellige farger for å indikere røykerstatusen til pasienter, som vist i eksemplet med blodtrykkene. Her ble røde blader brukt for nåværende røykere, blå for aldri-røykere og svarte for tidligere røykere. Dette gir innsikt i hvordan variabler som røyking påvirker helsemålinger, og hjelper forskere med å oppdage mønstre som kanskje ikke er like åpenbare i et vanlig histogram.

For å lage stem-and-leaf diagrammer med større nøyaktighet, er det viktig å velge passende intervaller for stammen og bladene. For eksempel kan man bruke intervaller på 10 mmHg for blodtrykk eller på 1,00 dollar per innbygger for å vise statens utgifter til tobakkspolitikk. Dette gir en mer presis visualisering, samtidig som diagrammet forblir lett å tolke. Ved å bruke slike teknikker kan man oppnå en detaljert forståelse av datamaterialets fordeling og samtidig oppdage eventuelle interessante trender eller unntak.

Når det gjelder bruken av stem-and-leaf diagrammer i helseundersøkelser eller økonomiske analyser, kan de avsløre viktige detaljer om fordelingen av helsemålinger eller økonomiske estimater. For eksempel kan et diagram som viser helsedata for prematur fødte barn, gi innsikt i variasjoner i blodkonsentrasjoner, og hjelpe helsepersonell med å vurdere hvilke behandlinger som er mest effektive. På samme måte kan stem-and-leaf diagrammer i økonomiske analyser bidra til å identifisere trender i statlige utgifter på områder som tobakkspolitikk, og avdekke forskjeller mellom stater eller regioner.

Viktige betraktninger ved bruk av stem-and-leaf diagrammer inkluderer behovet for å sikre at dataene er organisert på en meningsfull måte. Stammer og blader må være lett å lese, og eventuelle fargekoder bør være konsekvente og tydelige. Det er også viktig å være oppmerksom på antallet observasjoner, da et for stort datamateriale kan gjøre stem-and-leaf diagrammet vanskelig å tolke. I slike tilfeller kan det være bedre å bruke et histogram eller en annen grafisk representasjon.

Stem-and-leaf diagrammer gir også en god mulighet for sammenligning av forskjellige datasett. Ved å sammenligne flere stem-and-leaf diagrammer kan man identifisere forskjeller i fordelingen av dataene, for eksempel når man sammenligner blodtrykkene til forskjellige grupper av pasienter eller økonomiske estimater for ulike stater. Dette kan være nyttig i forskning, der man ønsker å finne mønstre eller trender på tvers av ulike variabler.

Endtext

Hvordan vurdere gjennomsnittsfeil og reproduserbarhet i dataanalyse?

Når man arbeider med statistisk analyse, er det viktig å vurdere påliteligheten av funnene man presenterer. Et sentralt begrep i denne sammenhengen er “konfidensintervall” og hvordan det kan brukes til å bedømme reproduserbarheten av data. Konfidensintervallene er en statistisk metode for å vurdere om et resultat kan replikeres i framtidige eksperimenter eller observasjoner. I mange tilfeller er det slik at smale konfidensintervall tyder på at dataene er reproduserbare, mens brede intervaller kan indikere at resultatene ikke er tilstrekkelig stabile for å kunne gjentas med høy presisjon.

Et viktig aspekt ved statistikk er å vurdere om forskjellen eller forholdet mellom ulike datagrupper er signifikant. En verdi på 0 indikerer en ingen forskjell, mens en verdi på 1.0 ofte viser et forhold mellom dataene. Men det er ikke nok å kun analysere denne verdien isolert; man må også vurdere hvorvidt resultatene kan reproduseres. Uten tilstrekkelig reproduserbarhet blir de statistiske funnene mindre verdifulle, da de ikke kan bekreftes under ulike forhold.

Reproduserbarhet, eller muligheten til å få de samme resultatene ved gjentakelse av eksperimentet, er spesielt utfordrende når man jobber med statistisk signifikante datafunn. Selv om et resultat kan være signifikant ved første øyekast, betyr det ikke nødvendigvis at det er reproduserbart under andre forhold eller i andre populasjoner. Dette kan skyldes en rekke faktorer som prøvestørrelse, dataens natur, eller de statistiske metodene som er brukt.

En av de vanligste feilkildene i statistisk analyse er at mange funn er basert på data som ikke er tilstrekkelig representativ for den generelle populasjonen. Dette kan skje når man har små utvalg eller når det er bias i utvalgsprosessen. Her er det viktig å bruke både deskriptiv statistikk og grafiske fremstillinger for å få en bedre forståelse av datafordelingen. Det er også viktig å benytte seg av forskjellige typer diagrammer, som histogrammer og boxplots, som kan gi innsikt i datasettets form og potensielle avvik.

Det er avgjørende at forskere og analytikere er oppmerksomme på at konfidensintervallene ikke bare handler om å måle feilmarginene i deres resultater. De gir også et mål for hvor pålitelig resultatene kan være når de generaliseres til større populasjoner eller ulike scenarier. Dette aspektet av statistikk er ofte oversett, men det kan være avgjørende for å forstå hvorvidt en vitenskapelig studie eller eksperiment gir resultater som er robuste og ikke tilfeldige.

Leseren bør også være klar over at statistisk signifikans alene ikke er et endelig bevis på at et forhold mellom variabler er ekte. Dette er et av de viktigste prinsippene i statistisk analyse – en signifikant p-verdi indikerer at en observasjon er usannsynlig å ha oppstått tilfeldig, men den sier ikke nødvendigvis at forholdet er årsakssammenhengende. For å etablere kausalitet kreves mer omfattende analyser, inkludert eksperimentelle design og kontroll av potensielle forvirrende faktorer.

I tillegg til å forstå betydningen av reproduserbarhet og konfidensintervall, er det viktig for leseren å være kritisk til de metodene som benyttes i dataanalysen. Spørsmål som hvilke målinger og indekser som er valgt, hvordan dataene er samlet inn, og om det er gjort noen justeringer eller seleksjoner av dataene, bør alltid vurderes før man trekker konklusjoner. Det er også viktig å merke seg at de statistiske resultatene kan variere avhengig av hvordan man segmenterer eller grupperer dataene, og dette kan påvirke hvilke trender og mønstre som blir synlige.

Derfor bør enhver form for datarapportering inneholde en grundig vurdering av både statistisk signifikans og reproduserbarhet, samt en refleksjon rundt metodene som er brukt for å analysere og presentere dataene. Dette vil ikke bare styrke kvaliteten på forskningen, men også bidra til å fremme en mer informert og kritisk tilnærming til statistikk generelt.

Hvordan måle og tolke skjevhet i medisinsk forskning

I medisinsk forskning er det viktig å forstå hvordan data er fordelt, ettersom dette kan ha stor innvirkning på hvordan vi tolker resultatene av studier. En nøye vurdering av distribusjonen av observasjoner kan avsløre underliggende mønstre som ikke umiddelbart er synlige. Når man analyserer medisinske data, kommer man ofte over begreper som geometriske gjennomsnitt, medianer og skjevhet. Disse statistiske målingene gir verdifulle innsikter i hvordan et sett med data er fordelt, og hvordan resultatene kan være påvirket av ekstreme verdier eller andre faktorer.

Et eksempel på dette kan ses i en studie som vurderte effekten og sikkerheten til en kombinasjon av oxantel pamoat og albendazol på barn infisert med T. trichiura (Speich et al., 2014). I denne studien ble barn i alderen 6–14 år tilfeldig tildelt en av fire behandlingsgrupper, og resultatene ble rapportert ved hjelp av geometriske gjennomsnitt for eggtallene per gram avføringsprøve. Geometriske gjennomsnitt er nyttige for å oppsummere data, men gir ikke alltid et klart bilde av hva dataene faktisk representerer. For eksempel, i denne studien kan de geometriske gjennomsnittene (796 før behandling og 31 etter behandling) være nær medianene av distribusjonene, men det er usikkert hvordan eggtallene fordeler seg på individnivå. Er det mange som har svært høye eller lave verdier? Eller er de fleste verdiene nær gjennomsnittet? Det er vanskelig å svare på uten ytterligere analyse av skjevheten i distribusjonen.

Tilsvarende finner vi i en annen studie (DiazGranados et al., 2014), som undersøkte effekten av to forskjellige influensavaksiner på eldre voksne. Geometriske gjennomsnitt ble også brukt her for å sammenligne HAI-titrene (hemagglutinasjonsinhibering) etter vaksinasjon. Igjen, selv om de geometriske gjennomsnittene kan gi en indikasjon på den sentrale tendensen i dataene, gir de lite informasjon om hvordan dataene faktisk er fordelt. Det er uklart om forskjellen i titrene mellom de to vaksinegruppene er representativ for en jevn fordeling, eller om det er store variasjoner som ikke kommer frem i de geometriske gjennomsnittene.

Når man ser på dataenes skjevhet, er det flere viktige begreper å forstå. Skjevhet refererer til hvordan dataene er fordelt i forhold til deres sentrale verdi, og kan være enten positiv (høyre-skjev), negativ (venstre-skjev), eller symmetrisk. Skjevhet kan ha stor betydning for tolkningen av dataene, spesielt i medisinsk forskning hvor utfall kan være ekstreme eller ha en tendens til å samle seg rundt bestemte verdier. Ofte er fordelinger i medisinsk forskning skjeve, med et klart flertall av observasjoner på den ene siden av den sentrale verdien.

Det finnes flere måter å måle skjevhet på, og en av de mest brukte er de enkle koeffisientene for skjevhet. Disse måler forskjellen mellom prosentandelen av observasjonene i den øvre og nedre halvdelen av datasettet, eller forskjellen mellom gjennomsnittet og medianen (SKMedian) og mellom gjennomsnittet og modus (SKMode). En positiv koeffisient indikerer at dataene er høyre-skjeve (flere store observasjoner), mens en negativ koeffisient indikerer venstre-skjevhet (flere små observasjoner). En koeffisient nær null tyder på at dataene er symmetriske. Dette kan være spesielt viktig i medisinsk forskning, da skjevhet kan indikere at det er et fåtall ekstremverdier som kan ha stor innvirkning på de generelle resultatene.

For eksempel viser et tilfelle med hvilepuls før og etter trening (Figur 1.2 og 1.3) at distribusjonen av pulsen er symmetrisk før trening, med et gjennomsnitt på 80 bpm og en standardavvik på 11 bpm. Etter trening er derimot distribusjonen skjev mot venstre, noe som kan tyde på at flertallet av deltakerne har en lavere puls etter trening, men at det finnes noen få med høyere verdier. Skjevheten i dataene her kan være et resultat av individuelle forskjeller i hvordan kroppen reagerer på trening, eller det kan skyldes feil i målingene.

Å forstå skjevheten i medisinske data er viktig for å kunne tolke resultatene korrekt. Geometriske gjennomsnitt og andre beskrivende statistikker kan være nyttige for å oppsummere dataene, men de kan også skjule viktige detaljer om hvordan dataene er fordelt. Det er derfor viktig å bruke flere metoder for å vurdere skjevhet og fordeling før man trekker konklusjoner fra studieresultatene. Skjevhet kan påvirke både de statistiske analysene og den kliniske tolkningen av resultatene, og kan gi viktig informasjon om hvordan behandlingen fungerer på ulike pasientgrupper.

I tillegg til å vurdere skjevhet er det også viktig å forstå at distribusjoner i medisinsk forskning ofte er asymmetriske på grunn av ekstreme verdier eller andre faktorer som kan påvirke resultatene. For eksempel kan sykdommer eller behandlinger påvirke visse pasienter mer enn andre, noe som kan føre til høyere eller lavere verdier i dataene. I slike tilfeller er det avgjørende å vurdere både skjevheten og variasjonen i dataene for å få en realistisk forståelse av hvordan behandlingen fungerer for ulike pasientgrupper.

Hvordan forstå og analysere endringer i helsestatus gjennom observasjonspunkter

Når man vurderer resultater i medisinske studier, spesielt de som involverer kroniske sykdommer som hjerte- eller lungesykdommer, er det viktig å forstå at dataene ofte ikke gir fullstendige beskrivelser av progresjon. For eksempel, i en studie som evaluerer effekten av medisiner på pasienter med alvorlig pulmonal hypertensjon, kan endringer i funksjonsnivået (målt ved NYHA-klasser) observeres, men de gir ikke nødvendigvis et komplett bilde av utviklingen av sykdommen.

I en randomisert kontrollert studie ble 203 pasienter med alvorlig pulmonal hypertensjon tildelt enten iloprost eller placebo i 12 uker. Resultatene viste at flere pasienter i iloprost-gruppen fikk en forbedring i funksjonsklassen NYHA sammenlignet med placebo-gruppen, og dødeligheten var lavere i iloprost-gruppen. Dette gir oss nyttig informasjon om effekten av behandlingen, men det gir ikke svaret på viktige spørsmål. For eksempel er det uklart hvor mange av pasientene som forbedret seg fra NYHA klasse IV til III eller fra III til II, eller hva som skjedde med pasientene som døde i løpet av studien. Slik informasjon er viktig for å forstå om forbedringer i NYHA-klassen representerer en betydelig bedring i helsetilstanden eller bare en endring i symptomer som ikke nødvendigvis er varig.

Et annet eksempel på hvordan resultatene kan være ufullstendige finnes i en studie om ikke-kirurgisk reduksjon av septum i pasienter med hypertrofisk kardiomyopati. Denne studien viste at pasientene hadde signifikante forbedringer i NYHA-klassen etter behandlingen, både på kort og lang sikt. På seks uker etter behandlingen var det en markant økning i antall pasienter som ble klassifisert som NYHA klasse I, og antallet i de mer alvorlige klassene II, III og IV gikk betydelig ned. To år etter behandlingen var ingen pasienter i de alvorligste klassene III eller IV. Dette kan tyde på at behandlingen var effektiv, men som med det første eksemplet, gir ikke studien detaljer om hvorvidt pasientene som forbedret seg, gikk fra klasse IV til I, III til I, eller fra IV til II. Dette er vesentlig informasjon for å vurdere om behandlingen faktisk førte til varige forbedringer i pasientens helse, eller om det bare var en midlertidig endring.

Slike eksempler understreker et viktig poeng i medisinsk forskning: At endringer i en kategorisk klassifikasjon som NYHA kan være nyttige for å sammenligne behandlingsresultater på en overfladisk måte, men gir ikke nødvendigvis et fullstendig bilde av pasientens helsetilstand. Ofte mangler studiene informasjon om hvordan endringer skjer mellom de spesifikke klassene, og det er heller ikke alltid klart hvor alvorlig pasientens tilstand var ved baseline.

Når vi arbeider med kvalitativ data, spesielt i studier som involverer observasjonspunkter, må vi også forstå hvordan fordelingen av observasjonspunkter i forskjellige kategorier kan påvirke tolkningen av resultatene. For eksempel, når man har to datasett som representerer to forskjellige tidspunkter, kan de relative prosentene av de ulike kategoriene gi en indikasjon på hvordan tilstanden til pasientene har utviklet seg, men de avslører ikke nødvendigvis forholdet mellom endringer på de to tidspunktene.

Distribusjonen av observasjonspunktene i et kvalitativt datasett kan deles opp i ulike typer observasjonspair. For eksempel, i et dikotomt datasett der hver observasjon kan kategoriseres som enten "ja" eller "nei", kan man skille mellom fire typer observasjonspair: [Ja, Ja], [Ja, Nei], [Nei, Ja], og [Nei, Nei]. Prosentandelen av hver type par gir oss en mer presis beskrivelse av hvordan dataene er fordelt over tid eller mellom grupper. Det er viktig å merke seg at prosentandelen av observasjoner i et datasett ikke nødvendigvis gir en presis beskrivelse av hvordan observasjonene endres i forhold til et annet datasett.

Når vi vurderer kliniske data, er det viktig å merke seg at det finnes flere scenarier hvor prosentene av observasjoner i de ulike kategoriene kan være like, men distribusjonen av observasjonspunktene kan være veldig forskjellig. For eksempel kan to grupper ha samme prosentandel av pasienter som forbedrer seg i NYHA-klassen, men fordelingen av endringer kan være svært forskjellig – for noen pasienter kan endringene være små, mens for andre kan de være dramatisk forbedrende. Det er derfor viktig å analysere ikke bare endringene i prosent, men også hvordan endringene fordeler seg på individnivå.

I medisinsk forskning, og spesielt når man vurderer behandlingsresultater, må vi derfor være forsiktige med hvordan vi tolker endringer i kliniske klassifikasjoner. Endringer i kategorier som NYHA kan gi nyttig informasjon, men de gir ikke nødvendigvis et fullstendig bilde av hvordan pasientenes helse har utviklet seg. Det er også viktig å være oppmerksom på hvordan dataene er samlet inn og hvordan endringer i tilstanden blir registrert. Manglende informasjon om hva som skjer mellom klassene kan gjøre det vanskelig å vurdere effekten av behandlingen på et mer detaljert nivå.

Hva er egentlig betydningen av statistisk signifikans i forholdet mellom to kvantitative variabler?

En p-verdi på 0,007 antyder at hvis de 50 statene var elementer i et tilfeldig utvalg, ville sannsynligheten for at Spearman’s rho avviker fra 0 så mye som -0,38 eller mer, være bare 0,007 dersom tilfeldigheter var forklaringen. Dette er lavere enn 0,05, og det antyder at Spearman’s rho på -0,38 kan erklæres som statistisk signifikant, og bekymringen om at dette tallet er tilfeldig kan avskrives. Til tross for at Spearman’s rho på -0,38 kan erklæres som statistisk signifikant, er det ikke en garanti for at statene med høyere røykeprosent nødvendigvis har lavere utgifter til tobakk-kontrollprogrammer. Det er mer konstruktivt å påpeke at Figur 2 viser at utgiftene til tobakk-kontrollprogrammer og røykeprosenten i statene ikke viser et tydelig forhold. De 50 statene er ikke elementer i et tilfeldig utvalg, og både røykeprosenten og utgiftene til tobakk-kontrollprogrammer er beskrivelser av statene. Om Spearman’s rho kan erklæres statistisk signifikant, er ikke spørsmålet som bør diskuteres.

Eksempel 8.3.2: Gustafson og andre (1987) presenterer resultatene fra en studie som analyserte serumprøver hentet fra elever ved to videregående skoler åtte dager etter at det første tilfellet av meslingutbrudd ble registrert i Corpus Christi, Texas, våren 1985. Studien evaluerte forholdet mellom nivåene av ELISA for meslingeantistoffer og intervallet siden immunisering blant 580 elever som hadde fått en vaksine før de fylte to år, og som ble evaluert 11–17 år etter immunisering. Forholdet mellom titer-nivå og tid siden immunisering ble beskrevet som følger: De 580 elevene ble alle vaksinert mellom 1968 og 1974, det vil si 11–17 år før de ble testet. Det ble observert et svakt (r = -0,09) men statistisk signifikant (P = 0,03, t-test for stigning) fall i titer over tid. Stigningen på den log-lineære regresjonslinjen var -0,022 ln (T + 0,914) per år. Figur 3 (Fig. 8.7) bruker et spredningsdiagram for å vise de 580 parene av normaliserte log-transformerede titer-nivåer (IgG titer [LN(ΔO.D.)]) og intervaller siden immunisering. Figuren antyder at de normaliserte log-transformerte titer-nivåene sprer seg tilfeldig i relativt brede områder når årene siden immunisering er 11 år eller litt lenger, eller nær 17 år. De 580 parene av normaliserte log-transformerte titer-nivåer og år siden immunisering viser ikke et tydelig forhold. Den synkende linjen som vises er en forenkling når den brukes til å skildre forholdet mellom de normaliserte log-transformerte titer-nivåene og intervallene siden immunisering blant de 580 elevene. Det ville vært mer åpenbart at det ikke er noe forhold hvis linjen ikke ble vist. Korrelasjonskoeffisienten på -0,09 er nær 0 og antyder at de normaliserte log-transformerte titer-nivåene og intervallene siden immunisering blant de 580 elevene ikke er relatert. Ett minus kvadratet av korrelasjonskoeffisienten (1,0 - (-0,09)^2 = 0,9919) antyder at dersom den synkende linjen skulle brukes til å vurdere de normaliserte log-transformerte titer-nivåene til de 580 elevene basert på deres intervaller siden immunisering, ville den totale feilen i vurderingene være omtrent det samme som den enkle vurderingen av at de normaliserte log-transformerte titer-nivåene for alle elevene var identiske og like deres gjennomsnitt.

P = 0,03 antyder at stigningen på den minste kvadratløsningen som avviker fra 0 med -0,022 er usannsynlig dersom tilfeldigheter skulle være forklaringen. Stigningen kan erklæres statistisk signifikant. Dette antyder også at korrelasjonskoeffisienten på -0,09 kan erklæres statistisk signifikant. Men selv om stigningen på minste kvadratløsning kan erklæres statistisk signifikant, antyder både korrelasjonskoeffisienten på -0,09 og spredningsdiagrammet at de normaliserte log-transformerte titer-nivåene og intervallene siden immunisering blant de 580 elevene ikke er relatert. Det er viktig å være oppmerksom på den svake, men statistisk signifikante nedgangen i titer over tid. Det er mer konstruktivt å understreke indikasjonen fra spredningsdiagrammet som viser at de normaliserte log-transformerte titer-nivåene og år siden immunisering blant de 580 elevene ikke viser noe tydelig forhold.

Eksempel 8.3.3: Pierard og Lancellotti (2004) presenterer resultatene fra en studie som brukte kvantitativ Doppler-ekkokardiografi på 28 pasienter med akutt lungeødem og venstre ventrikkelfunksjonssvikt, og 46 pasienter uten historie med akutt lungeødem under fysisk aktivitet. Endringer i den effektive regurgitante orifice-arealet og transtrikuspidaltrykkgradientene ble evaluert hos personer med og uten akutt lungeødem. Figur 1 (Fig. 8.8) i artikkelen viser effektive regurgitante orifice-arealer og transtrikuspidaltrykkgradienter for de 74 deltakerne. Figuren viser at punktene sprer seg tilfeldig i et vidt spenn av sammenlignbare høyder, uavhengig av om transtrikuspidaltrykkgradientene er små eller store. De viser ikke et tydelig forhold. En lett synkende linje vises, som er en grafisk fremstilling av minste kvadratløsning basert på de 74 parene av observasjoner og en beskrivelse av forholdet mellom gjennomsnittene for effektive regurgitante orifice-arealer og transtrikuspidaltrykkgradienter. Dette er en forenkling, og for mange av parene er verdiene for effektive regurgitante orifice-arealer og transtrikuspidaltrykkgradienter langt fra linjen. Dette er også en distraksjon. Det ville vært mer åpenbart at det ikke er noe forhold mellom disse variablene hvis linjen ikke ble vist.

Korrelasjonen mellom variablene ble ikke ansett som signifikant (r = -0,02). Selv om korrelasjonskoeffisienten r = -0,02 ikke ble erklært statistisk signifikant, er den nyttig. Den er nær 0, og bekrefter at spredningsdiagrammet viser at de effektive regurgitante orifice-arealene og transtrikuspidaltrykkgradientene hos deltakerne ikke har et tydelig forhold.

Når man leser slike studier, er det viktig å ha en kritisk forståelse av hva som virkelig viser seg å være signifikant. Det er lett å konkludere med statistisk signifikans basert på en lav p-verdi, men det er viktig å også vurdere den praktiske betydningen og tolkningen av resultatene. Statistisk signifikans alene gir ikke nødvendigvis en sterk indikasjon på et meningsfullt forhold, spesielt når korrelasjonen er nær null, og grafiske fremstillinger som spredningsdiagrammer gir et tydeligere bilde av eventuelle mønstre.