Ve světě lékařských výzkumů a publikovaných studií je běžné setkávat se s popisy statistických výsledků, které na první pohled vypadají sofistikovaně, avšak často jsou matoucí, vágní a hyperbolické. Pro mnoho čtenářů lékařských časopisů bývá frustrující, jak se data prezentují, protože místo skutečného porozumění mohou snadno vést k nesprávným závěrům. Když čteme výsledky výzkumu, je důležité si uvědomit, že statistická významnost, která je v popisech často zdůrazněná, je spíše módní fráze než objektivní důkaz o pravdivosti údajů. Tento přístup k čtení studií se může zdát neintuitivní, avšak je nezbytný pro správnou interpretaci dat.

Hlavním problémem je, že statistická významnost je založena na testování nulové hypotézy, která předpokládá, že pozorované rozdíly v datech jsou pouze výsledkem náhody. Pokud je hodnota p-testu (p-value) menší než stanovená hranice (nejčastěji 0,05), nulová hypotéza je zamítnuta a rozdíl je považován za „statisticky významný“. Takové prohlášení, že rozdíl je statisticky významný, není nic jiného než elegantní přeformulování tvrzení, že rozdíl není výsledkem náhody. Avšak odmítnutí nulové hypotézy je více odvozené (abdukce) než vědecký důkaz, což znamená, že takový závěr není založen na přímých důkazech, ale spíše na předpokladech o náhodě.

Pro inteligentní čtení a interpretaci vědeckých studií je nezbytné podívat se na statistiky, které prezentují data, a zaměřit se na to, jak jsou výsledky popsány. Důležité je nezapomínat, že když statistici říkají, že rozdíl je statisticky významný, ve skutečnosti pouze tvrdí, že není pravděpodobně výsledkem náhody. Tento přístup znamená, že bychom měli být kritičtí vůči údajům, které jsou prezentovány bez řádného kontextu a rozsáhlejšího vysvětlení.

V rámci vyhodnocování výsledků studií bychom se měli zaměřit na to, jak jsou výsledky prezentovány. P-hodnota je jen jedním z ukazatelů a její hodnota není sama o sobě dokladem pravdivosti nebo platnosti výzkumu. Dalšími důležitými ukazateli jsou intervaly spolehlivosti (confidence intervals), které mohou poskytnout širší pohled na to, jak přesná a reprodukovatelná jsou data. Pokud je například p-hodnota menší než 0,05, interval spolehlivosti by měl vyloučit hodnotu nulového efektu, což poskytuje další informace o přesnosti výsledků.

Při čtení studií je rovněž kladeno důraz na správné pochopení distribucí dat. Mnozí autoři studií se soustředí na průměry a statistické testy, ale skutečný obraz o datech nám dávají právě distribuce. Měření rizika v různých skupinách pacientů, zvláště pokud je použito jako míra hazardního poměru (hazard ratio), by mělo být prezentováno s patřičnou opatrností. Tyto míry mohou být v některých případech značně zjednodušené, což může vést k nesprávnému vyhodnocení účinnosti léčby.

Zásadní je také pozornost věnovaná různým typům dat. U kvantitativních dat je důležité nezaměňovat průměry a výsledky testů s reálným rozložením dat, které může ukázat důležité detaily, jako je variabilita a korelace mezi jednotlivými měřeními. U kvalitativních dat je pro pochopení vzorců chování nebo výskytu určité události klíčové porozumět distribuci pozorování mezi podskupinami.

V konečném důsledku je nezbytné si uvědomit, že statistická významnost není „zázračným řešením“, které by potvrdilo platnost výsledků. Mnohem důležitější je pochopit, jakým způsobem jsou výsledky získávány a jak je možné je interpretovat v kontextu konkrétního výzkumu a léčebného prostředí. I když je statistická analýza důležitým nástrojem v medicíně, nesmí být považována za samospasitelnou. Místo slepého věření ve statistickou významnost bychom měli klást důraz na komplexní analýzu dat, která zahrnuje i faktory jako velikost vzorku, metodologické přístupy a reálnou relevantnost zjištění pro klinickou praxi.

Jak správně interpretovat vztah mezi dvěma kvantitativními proměnnými?

Při analýze vztahu mezi dvěma kvantitativními proměnnými je důležité ne pouze analyzovat statisticky významné výsledky, ale také pečlivě zvážit, jakým způsobem jsou tyto výsledky prezentovány a jak mohou ovlivnit naše závěry. Právě způsob zobrazení dat může výrazně změnit naše porozumění a interpretaci těchto vztahů.

Příklad z praxe, jak je uvedeno v článku Leclair et al. (1987), ukazuje vztah mezi incidencí nosokomiálních infekcí a úrovní expozice pacientů, kteří vylučují virus. Před intervencí, kdy byla dodržována nízká úroveň ochrany, byla incidencí infekcí výrazně vyšší a vykazovala silnou pozitivní korelaci s úrovní expozice. Po intervenci, kdy byla zavedena přísnější opatření (například nošení rukavic a ochranných plášťů), se tento vztah oslaboval, což naznačovalo pozitivní efekt ochranných opatření.

Statistická analýza, jakou je například regresní analýza, je běžně používána k určení, zda existuje lineární vztah mezi dvěma proměnnými. Regresní přímka může ukázat, jak se mění jedna proměnná v závislosti na druhé. Nicméně, samotná hodnota P (např. P < 10-9 nebo P < 0,05) nám pouze říká, zda je vztah mezi proměnnými statisticky signifikantní. To však není dostatečné pro hlubší porozumění tomu, jak konkrétní proměnné spolu skutečně souvisejí. K tomu, abychom mohli činit smysluplné závěry, je nutné podívat se na konkrétní charakteristiku těchto vztahů – například na fáze, v nichž se mění incidence v závislosti na úrovni expozice.

Graf, který zobrazuje incidenci infekcí podle různých úrovní expozice, nám může ukázat, že vztah mezi těmito dvěma proměnnými není vždy hladký a lineární, ale že dochází k "skokům" v datech. Před intervencí, kdy byla expozice nižší, incidence vzrostla skokově – například z 0 na přibližně 6 infekcí na 1000 dní při 5 % a 15 % úrovni expozice, a následně na přibližně 25–26 infekcí při 25 % a 35 % expozice. Po intervenci, kdy byly ochranné prostředky důsledněji používány, byla incidence nižší, ale stále vykazovala jisté skoky mezi 0 a 5 infekcemi na 1000 dní.

Důležité je, že výsledky regresní analýzy, která prezentuje data pomocí přímek, mohou klamat, protože zjednodušují skutečnou povahu vztahu mezi proměnnými. Skvélé statistické výsledky (např. vysoké hodnoty R² nebo nízké P-hodnoty) nemusí vždy znamenat, že vztah je lineární nebo jednoduchý. Skutečný obraz vztahu mezi expozicí a incidencí může být mnohem složitější, a tedy pro správnou interpretaci těchto výsledků je klíčové soustředit se na konkrétní chování dat v jednotlivých fázích, místo abychom slepě následovali predikce regresní přímky.

Příklad také ukazuje, jak je třeba správně interpretovat a prezentovat výsledky z jiných oblastí výzkumu, například v oblasti hemoglobinu F a jeho vztahu k jiným biochemickým ukazatelům, jak je prezentováno ve studii Giulian et al. (1987). U tohoto výzkumu je důležité si uvědomit, že hodnoty jednotlivých bodů v grafu představují průměrné hodnoty z několika nezávislých měření, což zajišťuje větší přesnost a spolehlivost výsledků. Samotná vysoká korelace (r = 0.9917) mezi proměnnými neznamená, že mezi těmito hodnotami neexistují žádné složitější vzory nebo faktory, které by mohly ovlivnit výsledky.

Pokud se podíváme na oba příklady, je jasné, že pro „inteligentní čtení“ dat je klíčové nejen chápat statistické výstupy, ale i správně interpretovat, jak jsou tato data prezentována. Použití regresních přímek nebo jiných zjednodušujících statistických nástrojů může někdy vést k tomu, že přehlédneme důležité detaily nebo skryté vzory v datech. Je nutné se zaměřit na komplexnost a variabilitu dat, která nám může poskytnout přesnější a důkladnější pohled na skutečné vztahy mezi proměnnými.

Důležité je také mít na paměti, že i když jsou statistické výsledky vysoce signifikantní, například P-hodnoty < 10^-9, je vždy třeba prozkoum