Kesällä ja alkusyksyllä 2020 järjestettiin Yhdysvalloissa useita presidentti Donald Trumpin vaalikampanjan suurkokouksia. Nämä tapahtumat tarjoavat poikkeuksellisen mahdollisuuden tutkia, miten massakokoontumiset vaikuttavat tartuntataudin, kuten COVID-19:n, leviämiseen. Rallien merkittävä koko, niiden tarkasti rajattu ajallinen ja paikallinen esiintyminen sekä rajoitettu suojautuminen mahdollistavat yksittäisten tapahtumien vaikutusten analysoinnin poikkeuksellisen tarkasti.

Analyysi kattaa kahdeksantoista Trumpin kampanjatilaisuutta eri puolilla maata ja seuraa tapahtumia jopa kymmenen viikkoa niiden jälkeen. Menetelmällisesti lähestymistapa perustuu regressiomalleihin, joissa tapahtumakuntia verrataan huolellisesti valittuihin vertailukuntiin. Kullakin tapahtumalla on oma mallinsa, jossa otetaan huomioon ennen tapahtumaa vallinneet olosuhteet: väestörakenne, tartuntatilanne ja alueelliset rajoitustoimet. Tämän avulla mallinnetaan todennäköinen tartuntakehitys ilman tapahtumaa ja verrataan sitä todelliseen kehitykseen.

Useimmissa tapauksissa tapahtumien vaikutus osoittautui merkittäväksi: arviolta yli 250 lisävahvistettua COVID-19-tapausta 100 000 asukasta kohden. Kun tämä luku yleistetään kaikkiin analysoituihin tapahtumiin, saadaan kokonaisvaikutukseksi yli 30 000 ylimääräistä tapausta ja yli 700 kuolemaa. Huomionarvoista on, että nämä kuolemat eivät rajoitu tapahtumien osallistujiin, vaan ne heijastavat tartunnan leviämistä laajemmin yhteisöissä.

Tulokset vahvistetaan vertailulla niin sanottuihin "placebo"-tapahtumiin: kuvitteellisiin tapahtumiin, jotka olisi voitu järjestää kymmenen viikkoa aiemmin, mutta joita ei todellisuudessa tapahtunut. Näissä tapauksissa havaittu vaikutus oli vähäinen tai olematon. Tämä ero todellisten ja placebo-tapahtumien välillä tukee analyysin luotettavuutta ja osoittaa, ettei havaittu vaikutus johdu sattumasta tai mallin systemaattisista virheistä.

Epidemiologisiin malleihin verrattuna käytetty lähestymistapa on poikkeava. Tyypillisesti epidemiologiset mallit ennustavat tulevia tapahtumia aiempien tietojen perusteella. Tässä analyysissä taas hyödynnetään jo toteutuneita kehityskulkuja vertailukunnissa. Toisin sanoen ennustetaan ei sitä, mitä tulevaisuudessa mahdollisesti tapahtuu, vaan arvioidaan, mitä olisi tapahtunut, jos tiettyä tapahtumaa ei olisi järjestetty. Tämä tuo analyysiin erityistä robustiutta ja tarkkuutta – varsinkin tilanteessa, jossa satunnaisvaihtelu ja paikalliset tekijät vaikuttavat voimakkaasti pandemian kulkuun.

Merkillepantavaa on myös se, että analyysin perusteella yksittäisen tapahtuman vaikutusta on vaikea arvioida luotettavasti suurten vaihteluiden vuoksi. Siksi keskittyminen useamman tapahtuman keskimääräiseen vaikutukseen on olennaista. Tämä erottaa tutkimuksen aiemmista, jotka tarkastelivat vain yksittäisiä tapahtumia (kuten Tulsan rallia), ja joissa mahdollisesti jäi huomaamatta todellisia vaikutuksia tilastollisen kohinan vuoksi.

Tämänkaltaiset tulokset herättävät kysymyksiä siitä, kuinka yhteiskunnan tulisi suhtautua suuriin yleisötapahtumiin pandemian aikana. Vaikka poliittiset kampanjatilaisuudet ovat osa demokraattista prosessia, niiden terveysvaikutuksia ei voida vähätellä. Kyse ei ole ainoastaan yksittäisten osallistujien riskistä, vaan laajemmasta yhteisöllisestä vaikutuksesta, joka voi ilmetä sairaalahoitojen lisääntymisenä ja kuolemien kasvuna viikkoja tapahtuman jälkeen.

On tärkeää ymmärtää, että tapahtumien vaikutukset eivät ilmene heti, vaan ne heijastuvat ajan myötä. Tämä viiveellinen vaikutus korostaa ennakoivan päätöksenteon merkitystä. Lisäksi on syytä kiinnittää huomiota tapahtumien luonteeseen – ulkotiloissa järjestetyt, pienemmät ja hyvin suojautuneet kokoontumiset eivät välttämättä aiheuta samanlaista riskiä kuin tuhansien ihmisten sisätilatapahtumat ilman suojavarusteita tai turvavälejä.

Analyysi osoittaa, kuinka poliittiset päätökset, viestintä ja välinpitämättömyys voivat konkretisoitua tilastollisina ylikuolleisuuksina. Näennäisesti viattomat juhlat tai kokoontumiset voivat muuttua epidemiologisiksi kiihdyttimiksi, joiden vaikutus ulottuu laajalle. Yhteiskunnan vastuu ulottuu siis pidemmälle kuin yksittäisten tapahtumien järjestämiseen – se koskee myös niiden seurauksien hallintaa ja ymmärtämistä.

Lukijan on syytä ymmärtää, että vaikka tutkimus käsittelee erityisesti Trumpin kampanjatilaisuuksia, sen tulokset heijastavat yleisempää ilmiötä: suurten väkijoukkojen kokoontumisen vaikutus tartuntatautien leviämiseen. Mallin yleistettävyys ei perustu tapahtuman poliittiseen sisältöön, vaan sen fyysiseen ja sosiaaliseen dynamiikkaan. Keskeinen havainto on, että ilman asianmukaisia suojatoimia ja rajoituksia, massatapahtumat voivat synnyttää laajoja ja vakavia kansanterveydellisiä seurauksia – jopa tuhansien kilometrien päässä tapahtumapaikalta ja viikkoja myöhemmin.

Kuinka poliittiset massatapahtumat vaikuttivat COVID-19:n leviämiseen Yhdysvalloissa?

COVID-19-pandemian aikana järjestetyt poliittiset joukkokokoukset toimivat laboratorioina, joissa voitiin tarkastella viruksen leviämisdynamiikkaa suurten ihmismassojen kokoontuessa. Trumpin kampanjatilaisuudet, joita järjestettiin kesäkuun ja syyskuun 2020 välillä, tarjoavat poikkeuksellisen aineiston tarkastella tätä ilmiötä. Vaikka osa tilaisuuksista pidettiin ulkona, merkittävä osa järjestettiin sisätiloissa, ja turvatoimien, kuten maskien käytön tai sosiaalisen etäisyyden, noudattaminen vaihteli. Näiden tapahtumien vaikutuksia on mitattu vertaamalla tapahtumakuntien kehitystä muihin, rakenteeltaan vastaaviin kuntiin, joihin ei kohdistunut tapahtumaa.

Tutkimuksessa käytetty data yhdistää useita lähteitä. Tapahtumatiedot perustuvat sekä kansallisiin että paikallisiin uutisraportteihin, ja niiden paikkansapitävyys varmistettiin käsin tarkistamalla päivämäärät ja tapahtumien sisä- tai ulkotiloissa järjestäminen. COVID-19-tapausdata pohjautuu Johns Hopkins -yliopiston CSSE:n kokoamaan tietokantaan, joka sisältää päivittäiset tartunta- ja kuolinluvut läänitasolla. Analyysia varten tiedot muunnettiin viikkokohtaisiksi aikasarjoiksi, jotta satunnaisvaihtelun vaikutusta voitiin vähentää. Lisäksi hyödynnettiin testausdataa, paikallisia terveyspoliittisia määräyksiä sekä demografisia ja poliittisia muuttujia, jotka vaikuttavat siihen, miten virus leviää ja miten siihen reagoidaan.

Yksi keskeinen haaste oli arvioida vaikutuksia alueilla, joilla epidemian dynamiikka vaihtelee merkittävästi niin ajassa kuin paikoittain. Tavanomaiset tilastolliset menetelmät eivät pysty riittävästi huomioimaan tätä rakenteellista heterogeenisuutta. Siksi kehitettiin menetelmä, jossa kutakin tapahtumaa tarkastellaan erikseen, vertaamalla sitä rakenteeltaan mahdollisimman samanlaisiin kuntiin, jotka eivät kokeneet tapahtumaa. Näin voitiin estimoida niin sanottu hoitovaikutus – siis kuinka paljon enemmän tapauksia todellisuudessa ilmeni verrattuna siihen, mitä olisi odotettu ilman tapahtumaa.

Yksittäisten tapahtumien vaikutuksia ei kuitenkaan voida tarkasti arvioida johtuen suuresta satunnaisvaihtelusta ja puutteellisesta tiedosta osallistujamääristä tai heidän käyttäytymisestään tapahtuman aikana ja sen jälkeen. Siksi tutkimuksessa keskityttiin keskimääräiseen vaikutukseen, joka saadaan yhdistämällä kaikkien analysoitujen tapahtumien hoitovaikutukset.

Erityisen tärkeää on huomioida niin kutsutut placebo-tapahtumat: keinotekoiset tapahtumat, jotka sijoitetaan ajallisesti kymmenen viikkoa ennen todellisia tapahtumia samoihin kuntiin. Näiden avulla voidaan testata, synnyttääkö menetelmä virheellisiä vaikutuksia, jotka johtuisivat aikaisemmista trendeistä eikä itse tapahtumista. Mikäli placebo-analyysi osoittaisi vaikutuksia ajankohtina, jolloin tapahtumaa ei ole ollut, olisi koko analyysin luotettavuus kyseenalainen.

Analyysi osoitti, että tapahtumien vaikutukset olivat tilastollisesti merkittäviä erityisesti sisätiloissa pidetyissä tilaisuuksissa. Tartuntojen määrät nousivat tapahtumaa seuraavina viikkoina tapahtumakunnissa selvästi enemmän kuin muissa, vertailukelpoisissa kunnissa. Tämä viittaa siihen, että poliittisilla joukkotilaisuuksilla oli konkreettinen vaikutus taudin leviämiseen. Huomionarvoista on, että naapurikunnissa ei havaittu merkittävää tapausten kasvua, mikä viittaa siihen, että leviämisvaikutus rajoittui pääasiassa tapahtumakuntaan. Tätä tukee myös analyysin konservatiivinen ratkaisu jättää tarkastelusta pois kaikki kunnat, jotka sijaitsevat alle 50 kilometrin päässä tapahtumakunnasta.

On kuitenkin muistettava, että vaikutukset eivät jakaudu tasaisesti. Superspreading-ilmiö on luonteeltaan epälineaarinen: yksittäinen tapahtuma voi aiheuttaa hyvin pienen tai erittäin suuren määrän jatkotartuntoja riippuen monista samanaikaisista tekijöistä – esimerkiksi siitä, kuinka suuri osa osallistujista oli tartuttavia, kuinka tiiviisti he olivat vuorovaikutuksessa toistensa kanssa, ja kuinka hyvin turvallisuusohjeita noudatettiin. Näiden tekijöiden puutteellinen mittaaminen vaikeuttaa vaikutusten yksityiskohtaista tulkintaa.

Lisäksi tärkeää on ymmärtää, että massatapahtuman vaikutukset eivät näy välittömästi. Tartuntojen määrä kasvaa asteittain viikkojen kuluessa tapahtuman jälkeen, mikä korostaa pitkittäisanalyysin merkitystä. Tästä syystä tapahtumat, joita seurasi vain kolme viikkoa jälkiseurantaa, jätettiin pääanalyysin ulkopuolelle, sillä niiden vaikutuksia ei voitu arvioida luotettavasti.

Lopuksi on syytä huomioida, että vaikka vaikutusten laajuus vaihtelee, tulokset osoittavat, että suuret poliittiset tilaisuudet, erityisesti ne jotka järjestetään sisätiloissa ilman laajaa turvatoimien noudattamista, muodostavat merkittävän riskin yhteisön terveydelle epidemiatilanteessa. Tämä havainto on olennainen pandemiahallinnan ja tulevaisuuden tapahtumapolitiikan suunnittelun kannalta.

On tärkeää ymmärtää, että tämänkaltaiset analyysit eivät tarjoa yksiselitteistä kuvaa yksittäisten tapahtumien moraalisesta tai poliittisesta arvosta, vaan ne osoittavat, kuinka kollektiivinen toiminta fyysisessä tilassa voi johtaa ennakoitaviin ja mitattavissa oleviin kansanterveydellisiin seurauksiin. Epidemiologiset vaikutukset eivät ole sattumanvaraisia vaan seurausta yhteiskunnallisista valinnoista, joissa päätökset tilaisuuksien järjestämisestä, suojaustoimien toimeenpanosta ja väestön käyttäytymisestä ovat keskeisiä muuttujia. Näitä tekijöitä voidaan ja tulee mallintaa, ei pelkästään tutkijoiden analyysia varten, vaan myös vastuullisen päätöksenteon tueksi.

Miten mitataan hoitovaikutuksia vertailemalla tilastollisesti samankaltaisia alueita?

Analyysissä, jossa tutkitaan tapahtumien vaikutusta tartuntatautitapauksiin, erityisesti COVID-19-pandemian aikana, keskeiseksi nousee kysymys vertailtavuudesta: miten voidaan tunnistaa ne alueet, joiden kehityskulku ennen tapahtumaa on riittävän samankaltainen, jotta ne voivat toimia uskottavina vertailukohteina? Menetelmän keskiössä on tilastollinen samankaltaisuusindeksi, joka mittaa esimerkiksi sitä, miten lähelle toisiaan kaksi aluetta osuvat aikaisemmassa kehityksessään tartuntojen suhteen.

Jokaiselle tapahtumalle (i, t) määritetään joukko Sit, joka koostuu niistä M alueesta, joilla on pienimmät arvot sijt-indeksissä, pois lukien itse tapahtuma-alue. Näin muodostetaan joukko alueita, jotka ovat valitun mittarin mukaan kaikkein vertailukelpoisimpia kohdealueeseen kyseisenä ajankohtana. Esimerkiksi, kun M=100, vastaava osuus koko aineistosta on noin 3,2 %, ja M=200 tapauksessa 6,4 %. Tämän vertailukelpoisuuden mittaamiseen käytetään useita vaihtoehtoisia indeksejä.

Yksi tärkeimmistä vertailtavuuden ulottuvuuksista on COVID-19-tapausten kehityspolku ennen tapahtumaa. Tätä varten määritellään ajallisesti painotettu etäisyysmenetelmä, jossa uudemmat havainnot saavat enemmän painoarvoa. Erityistapauksessa, kun ρ=1, saadaan kyseessä olevien aikajaksojen välinen euklidinen etäisyys. Valitsemalla arvot ρ ∈ {0.25, 0.5, 0.75, 0.9, 1} ja L ∈ {5, 10}, voidaan säätää aikapainotusta ja tarkastelun pituutta.

Laajempaa vertailukelpoisuutta voidaan tavoitella ottamalla huomioon demografisia ja muita muuttujia, jotka voivat vaihdella ajan myötä tai olla kiinteitä. Tällaisia muuttujia voivat olla esimerkiksi väestön koulutustaso, väestötiheys, ikäjakauma tai poliittinen suuntautuneisuus. Näistä muodostetaan painotettu neliöllinen etäisyysindeksi, jossa kunkin muuttujan paino määräytyy sen hajonnan perusteella aineistossa. Näin jokainen yksi keskihajonnan poikkeama saa saman painoarvon vertailussa.

Koska täydellistä vastaavuutta ei voida saavuttaa, arvioidaan tilastolliset erot regressiomalleilla. Kullekin tapahtumalle ja sen vastaavien alueiden joukolle (Sit) suoritetaan pienimmän neliösumman regressio, jossa selitettävänä muuttujana on tapahtuman jälkeinen kokonaismäärä uusia tapauksia tietyn tarkastelujakson aikana. Tämän jakson pituus on enintään kymmenen viikkoa.

Selittävinä muuttujina käytetään mm. aikaisempien viikkojen tartuntamääriä, kuolemia, poliittisten toimenpiteiden ajankohtia ja lukuisia demografisia tunnuslukuja, kuten väestön ikäjakauma, etninen koostumus, työttömyys, koulutustaso ja poliittiset äänestystulokset. Koska suurella määrällä selittäjiä ja pienellä havaintomäärällä riski ylisovittamiseen kasvaa, käytetään LASSO-regressiota, jossa rangaistusparametria säädetään siten, että mukaan valikoituu 10 tai 20 tärkeintä muuttujaa havainnoista riippuen.

Kunkin tapahtuman kohdalla regressiomallilla ennustetaan, kuinka monta uutta tapausta tapahtuma-alueella pitäisi olla vastaavien alueiden perusteella. Erotus ennusteen ja toteutuneen välillä antaa tapahtumakohtaisen hoitovaikutusarvion. Näistä lasketaan lopuksi keskimääräinen hoitovaikutus kaikille todellisille tapahtumille ja erikseen lumetapahtumille. Suurempaa painoarvoa annetaan niille alueille, joiden ennusteet ovat tarkempia, eli joiden regressiomallien ennustevirheen varianssi on pienempi.

Tulokset osoittavat selkeän ja tilastollisesti merkitsevän vaikutuksen todellisten tapahtumien jälkeen. Esimerkiksi perusvariantissa, jossa käytetään vain tapauskohtaisia aikaviivelukuja, keskimääräinen lisäys oli 332 tapausta 100 000 asukasta kohden. Luottamusväli ei sisällä nollaa, mikä osoittaa vaikutuksen tilastollisen merkitsevyyden. Vastaava lumetapahtumien vaikutus oli negatiivinen ja tilastollisesti merkityksetön. Kun vertailtavuus ulotetaan myös demografisiin muuttujin, vaikutus säilyy selkeänä mutta hieman vaimentuneena.

On tärkeää ymmärtää, että vaikka lisämuuttujien käyttö voi parantaa mallin realismia, se voi samalla heikentää pre-event kehityskulun samankaltaisuutta, mikä voi vaikuttaa vaikutusarvion tarkkuuteen. Menetelmien valinta – sekä vertailtavuuden määrittelyssä että regressiomallien sovittamisessa – muokkaa suoraan lopullista arvioitua hoitovaikutusta. Myös käytetty ennusteiden painotusmalli vaikuttaa tulosten vakavuuteen ja tulkintaan.

Miten Trumpin vaalitapahtumat vaikuttivat COVID-19-tartuntoihin ja kuolemantapauksiin?

Analyysimme perusteella on selvää, että Trumpin vaalitapahtumilla oli merkittävä vaikutus COVID-19-tartuntojen määrään tietyissä osissa Yhdysvaltoja. Tulokset perustuvat käsittelyalueiden (rallien jälkeiset alueet) ja vertailualueiden (alueet, joissa ei ollut vastaavia tapahtumia) tilastollisiin vertailuihin. Vaikutusten arviointi on tehty vertaamalla tapahtumien jälkeisiä viikkoja paikkakuntien välisten korrelaatioiden kautta, ja käyttämällä menetelmiä, jotka ottavat huomioon alueiden demografiset tekijät ja edellisten viikkojen tapaukset.

Rallien jälkeisten alueiden analyysi paljastaa, että Trumpin vaalitapahtumat johtivat yli 30 000 lisätapaukseen, jotka olivat todennäköisesti vastuussa yli 700 kuolemantapauksesta. Tämä arvio on tehty laskemalla kunkin alueen väestöä ja kuolemantilastot sekä kertomalla tartuntamäärät kuoleman jälkeen tapahtuneella kuolleisuusasteella. Tämä havainto on selvästi tilastollisesti merkittävä, ja se ei jää pelkiksi tilastollisiksi poikkeamiksi: vaikutus on ilmeinen, eikä sitä voida selittää pelkästään väestön kasvuun tai muilla mahdollisilla tekijöillä.

Tärkeä huomio tässä on se, että mahdollinen virheellisten tulkintojen vaara on olemassa, erityisesti mikäli oletetaan, että tartuntamäärien kasvu johtui pelkästään testausmäärien lisääntymisestä tapahtuman jälkeen. Jos testaus oli merkittävästi laajentunut tapahtuman jälkeen, mahdollinen kuolleisuusaste ei olisi välttämättä noussut. Tämä olisi voinut johtaa siihen, että kuolleisuusprosentti alenisi, jos lisätartunnat olisivat olleet vain seurausta laajemmasta testauksesta, ei itse tapahtumasta.

Kun tarkastelimme muutamia erityisesti vaikutuksille altistuneita piirikuntia, kuten Winnebago ja Marathon Wisconsinin osavaltiossa, havaitsimme, että nämä alueet erottuivat erityisesti ennustettujen ja todellisten tapausten eroista. Näissä piirikunnissa testausmäärät nousivat merkittävästi tapahtuman jälkeen, mikä herättää kysymyksen siitä, oliko tartuntojen kasvu todellakin seurausta itse tapahtumasta vai pelkästään laajentuneista testauskäytännöistä. Wisconsinin osalta saatujen testaus- ja positiivisuustietojen perusteella voidaan todeta, että testausmäärät alkoivat kasvaa jyrkästi tapahtumaa edeltävällä viikolla. Tämä ilmiö ei rajoittunut vain tapahtumapaikkakuntiin, vaan laajeni myös muihin osavaltioihin, joissa tilanne kehittyi saman suuntaisesti.

Winnebagon ja Marathonin piirikunnissa havaittu testausmäärien nousu tapahtuman jälkeisinä viikkoina oli huomattava. Samalla näiden alueiden testipositiivisuus nousi nopeasti tapahtuman jälkeen, vaikka ennen tapahtumaa ei ollut merkittäviä muutoksia. Tällaiset nousut viittaavat siihen, että tapahtumilla saattoi olla suora vaikutus paitsi testausaktiivisuuteen, myös itse tartuntojen lisääntymiseen. Tämänkaltaiset piirikunnat tarjoavat erityistä tukea arvioituille vaikutuksille ja vahvistavat, että tilastolliset mallit voivat pitää paikkansa, erityisesti kun ne on verrattu muuhun, yksityiskohtaiseen dataan.

Tätä tilannetta syventäessä on tärkeää ottaa huomioon, että vaikka tietyt alueet voivat näyttää olevan erityisen alttiita tällaisille vaikutuksille, ne eivät välttämättä edusta koko väestön käyttäytymistä. Paikalliset erityispiirteet, kuten väestötiheys, terveydenhuollon infrastruktuuri ja asukkaitten yleinen käytös, voivat vaikuttaa siihen, miten suuria vaikutuksia tällaisilla tapahtumilla on tartuntoihin ja kuolemantapauksiin.

Testausmäärät ja niiden positiivisuusaste ovat keskeisiä tekijöitä, joiden perusteella voidaan arvioida, kuinka suuria osia lisääntynyt tartuntamäärä liittyy itse tapahtumaan verrattuna pelkästään testauskäytänteiden muutoksiin. Näiden piirikuntien tarkempi analyysi tarjoaa myös mahdollisuuden arvioida, kuinka suuren osan COVID-19-tartunnoista voisi mahdollisesti liittää ulkopuolisiin tekijöihin, kuten tapahtumien lisääntymiseen, ja kuinka suuria vaikutuksia niillä todella on kuolleisuuden kannalta.