Tietojen järjestys ja rakenne ovat keskeisiä elementtejä, jotka vaikuttavat suuresti siihen, kuinka tehokkaasti pystymme vertailemaan ja ymmärtämään erilaisten ilmiöiden yhteyksiä. Tämä käy selvästi ilmi, kun tarkastellaan liikenneonnettomuuksien ja niihin liittyvien tekijöiden analysointia, kuten Beechamin ja Lovelacen (2023) tutkimuksessa esitetään. Esimerkiksi, kuten kuvassa 4.6 esitetään lämpökarttana, on erittäin tärkeää, että tiedot ovat järjestetty oikealla tavalla. Jos jättäisimme alueet satunnaiseen aakkosjärjestykseen, verrattavien tietojen välillä olisi paljon enemmän häiriöitä, eikä havainnoista saisi niin selkeitä ja informatiivisia.
Analyysi pohjautuu STATS19-tietokannan tietoihin, jotka koskevat jalankulkijan ja ajoneuvon välisten onnettomuuksien raportointia vuosilta 2010–2019. Näissä tiedoissa on mukana paitsi onnettomuuden sijainti, aika ja luonne, myös uudet ulottuvuudet, kuten Index of Multiple Deprivation (IMD) -luokitukset, jotka kartoittavat onnettomuuden osapuolten ja tapahtumapaikan sosioekonomista taustaa. Tämä mahdollistaa syvällisemmän tarkastelun siitä, miten erilaiset sosioekonomiset tekijät voivat vaikuttaa onnettomuuksien esiintymiseen.
Tiedot ovat jaoteltu kolmeen päätaulukkoon: onnettomuudet, uhrit ja ajoneuvot. Onnettomuudet-taulukossa on yksittäiset onnettomuudet, joissa on mukana ajankohta, sijainti ja onnettomuuden vakavuus. Uhrit-taulukko käsittelee jokaista onnettomuudessa loukkaantunutta henkilöä, ja sen avulla voidaan tutkia onnettomuuden aiheuttamia vammoja ja niihin liittyviä demografisia tietoja. Ajoneuvot-taulukossa puolestaan on tietoa ajoneuvoista, jotka osallistuivat onnettomuuteen, mukaan lukien ajoneuvon tyyppi ja kuljettajan tiedot.
Tässä analyysissä on erityisesti tarkasteltu epätasa-arvoa jalankulkijoiden ja kuljettajien taustoissa ja heidän kohtaamiensa onnettomuuksien vakavuudessa. Tähän on liittynyt myös analyysi tiedon täydellisyydestä. Esimerkiksi on havaittu, että täydellisten tietojen määrä on alhaisempi lievissä onnettomuuksissa ja korkean köyhyysasteen alueilla. Tämä viittaa siihen, että tietojen puutteellisuus ei ole satunnaista, vaan siihen saattaa liittyä systemaattisia tekijöitä, kuten onnettomuustyyppien ja vakavuuden eroja alueellisesti ja sosioekonomisesti.
Tilastollisten analyysien avulla voidaan tarkastella, miten onnettomuustyyppien ja vakavuusluokkien välillä on eroja. Kuvassa 4.8 on esitetty täydellisyysasteita, jotka on laskettu erikseen onnettomuuden vakavuuden ja tapahtumapaikan sosioekonomisen tilan mukaan. Tulokset osoittavat, että vakavampien onnettomuuksien osalta tietojen täydellisyysaste on korkeampi, mutta se on silti alempi korkean köyhyysasteen alueilla. Tämä saattaa viitata siihen, että vakavammat onnettomuudet raportoidaan tarkemmin, mutta myös siihen, että tietyt alueet jäävät systemaattisesti vähemmälle huomiolle.
Kun analysoidaan tällaista dataa, on tärkeää muistaa, että täydellisyysasteiden ero voi heijastaa monia eri tekijöitä. Esimerkiksi voi olla, että lievempien onnettomuuksien raportointikäytännöt poikkeavat vakavampien tapausten raportoinnista. Lisäksi korkeaa köyhyysastetta edustavilla alueilla voi olla erilaisia haasteita tiedonkeruussa tai virheellisten tietojen syitä, kuten vähemmän resursseja tai tietojen puutteellista tarkastelua.
Tässä vaiheessa on tärkeää huomioida, että vaikka tiedot voivat olla puutteellisia tai epätarkkoja tietyillä alueilla, ne antavat kuitenkin arvokasta tietoa siitä, miten erilaiset tekijät, kuten sosioekonominen tausta ja asuinalueen kehitykselliset ongelmat, voivat vaikuttaa liikenneonnettomuuksien riskeihin ja vakavuuteen. Tämäntyyppinen analyysi auttaa tunnistamaan alueellisia eroja ja mahdollistaa tehokkaampien ennaltaehkäisevien toimenpiteiden kehittämisen.
Lisäksi on tärkeää ymmärtää, että vaikka analyysissä käytetään tilastollisia ja graafisia esityksiä, kuten lämpökarttoja ja mosaiikkikuvia, on aina otettava huomioon tiedon keruun ja raportoinnin rajoitukset. Täydellisten tietojen puuttuminen ei tarkoita, etteikö data voisi silti tarjota arvokasta tietoa – se vain vaatii tarkempaa pohdintaa ja lisäanalyysia, jotta voidaan ymmärtää, miksi tietyt alueet jäävät vähemmälle huomiolle tai miksi joissain tapauksissa tiedot ovat puutteellisia.
Miten luoda ja tulkita maantieteellisiä verkostoja ammattilaisten ja työpaikkojen liikenteen tarkastelussa Lontoossa
Työpaikkojen ja ammattilaisten sijaintien maantieteellinen analyysi voi tarjota syvällisiä oivalluksia kaupungin alueiden taloudellisista ja sosiaalisista rakenteista. Lontoossa, kuten monilla muillakin alueilla, eri kaupunginosat erottuvat toisistaan niin työpaikkojen kuin asukkaittensa ammatillisten profiilienkin osalta. Tässä yhteydessä tärkeä työkalu on geospatiaaliset kartat ja kaaviot, jotka tarjoavat visuaalisia esityksiä alueellisten työntekijä- ja työpaikkamäärien jakautumisesta.
Geospatiaalisia verkostoja voidaan tarkastella monin tavoin. Esimerkiksi, käyttämällä ggplot2-kirjastoa R-kielessä, voidaan luoda visuaalisia esityksiä, jotka näyttävät, kuinka työntekijöiden ja työpaikkojen määrät jakautuvat eri alueille. Tällaisessa kaaviossa muuttujien, kuten työntekijöiden ja työpaikkojen määrän, sijainti voidaan koodata visuaalisesti joko värillä tai koon vaihtelulla, ja vielä tarkemmin, jaot voivat heijastaa eri ammattiluokkien jakautumista tietyillä alueilla.
Esimerkiksi alueilla kuten Wandsworth ja Hillingdon voidaan tarkastella, kuinka monella alueella on korkea osuus ammattilaisista verrattuna muihin alueisiin, kuten Camdeniin tai Westminsteriin. Tämä geospatiaalisesti koodattu visuaalinen esitys auttaa vertailemaan työntekijöiden ja työpaikkojen suhteellista määrää ja paikkaa eri Lontoon alueilla, erityisesti ammattiluokittain.
Tällaisessa kaaviossa käytettävä data on valmisteltu huolellisesti niin, että se on "vaiheistettu" ja kohdistettu kullekin alueelle. Ensimmäinen askel on luoda esitetty datasetti, joka ottaa huomioon erilaisten ammattiluokkien osuudet ja työntekijöiden tai työpaikkojen määrän. Tämä tehdään ryhmittelemällä data kaupunginosittain ja skaalaten tiedot suhteellisesti verrattuna kyseisen kaupunginosan suurimpaan ammattiluokkaan.
Eri ammattiluokat voivat näkyä kaaviossa eri väreillä, ja työntekijöiden ja työpaikkojen suhteellinen määrä näkyy vaakasuoraan tai pystysuoraan asetetuissa pylväissä. Tällöin voidaan myös tarkastella alueen geospatiaalisia eroja, kuten kuinka "tasapainoiset" kaupunginosat, kuten Barking ja Dagenham, eroavat alueista, joissa työpaikkoja on huomattavasti enemmän, kuten Westminsterissä.
Erityisen tärkeää on myös pohtia, kuinka eri alueiden välinen liikenne jakautuu. Esimerkiksi työmatkaliikenne Lontoossa voi olla epätasaisesti jakautunut, sillä tietyt kaupunginosat houkuttelevat ammattilaisia enemmän kuin toiset. Näitä virtoja voidaan tarkastella luomalla erityisiä OD-karttoja (Origin-Destination), jotka esittävät, kuinka asukkaat liikkuvat työskentelemään eri kaupunginosiin. Tällöin voidaan tarkastella, kuinka paljon enemmän ammattilaisia matkustaa alueelle verrattuna odotettuun, ja näin saada käsitys siitä, mitkä kaupunginosat houkuttelevat enemmän ammattilaisia ja mistä he saapuvat.
Tässä yhteydessä keskeinen rooli on odotettujen ja havaittujen virtojen erojen analysoinnilla, johon liittyy ns. residuaalien laskeminen. Residuaalit kertovat, kuinka paljon enemmän tai vähemmän ammattilaisia liikkuu tietyn kaupunginosan välillä verrattuna siihen, mitä tasaisesti jakautunut malli ennustaisi. Tämä on tärkeä analyysiväline, sillä se auttaa tunnistamaan alueet, joissa ammattilaisia liikkuu epätavallisen paljon tai vähän. Erityisesti huomionarvoista on se, että residuaaleja laskettaessa käytetään ns. voimaistettua laskentaa, joka painottaa suuria eroja suhteessa pienempiin.
Kun tarkastellaan näitä virtoja ja liikkeitä, voidaan havaita mielenkiintoisia eroja eri alueiden välillä. Työpaikkarikkaat alueet, kuten Westminster ja Camden, houkuttelevat ammattilaisia erityisesti alueilta, jotka ovat asukkaita, mutta joissa ei ole yhtä paljon työpaikkoja. Näin syntyy mielenkiintoinen yhteys asuinalueiden ja työpaikkakeskittymien välille, joka voi paljastaa paljon kaupungin sosiaalisista ja taloudellisista eroista.
Tämä analyysi ei kuitenkaan ole vain tekninen harjoitus datan visualisoinnissa. Se voi myös tarjota syvällistä tietoa kaupungin rakenteesta ja työn ja asuinpaikkojen jakautumisesta. Asukkaita, jotka asuvat "työntekijöiden rikkailla" alueilla, on todennäköisesti enemmän ammattilaisia ja korkeamman koulutustason omaavia henkilöitä, kun taas alueet, joissa työpaikkojen määrä on suurempi kuin asukkaiden määrä, voivat olla työpaikkakeskittymiä, joihin työntekijät matkustavat muilta alueilta.
Tässä esitetyt kaaviot ja mallit tarjoavat siis vain osan kokonaiskuvasta. On tärkeää ymmärtää, että taloudelliset ja sosiaaliset eriarvoisuudet eivät ole vain satunnaisia, vaan ne heijastuvat selkeästi myös alueellisiin ja ammatillisiin rakenteisiin. Ymmärtäminen siitä, kuinka työpaikkojen ja asukkaiden liikkeet eroavat alueittain, voi auttaa luomaan tarkempia politiikkatoimia ja kehittämään entistä tasapainoisempia ratkaisuja kaupunkien alueellisten erojen vähentämiseksi.
Kuinka visualisoinnin suunnittelussa huomioidaan subjektiivisuus ja luottamus datassa
Visualisoinnin ja datan analysoinnin maailmassa luottamus on olennainen osa prosessia. Tiettyjen tiedonlähteiden uskottavuus rakentuu vuosien varrella, kun analyysit esitetään avoimesti ja nöyrästi. Esimerkiksi Financial Timesin datajournalisteilla luottamus muodostuu ajan myötä monenlaisten, tarkkaan harkittujen ja avointen analyysien kautta. Tämä on muistutus siitä, että datan analysointia ei voida pitää vain objektiivisena ja mekaanisena prosessina.
Usein ajatellaan, että visualisointien ja analyysien pitäisi olla täysin objektiivisia ja "optimaalisia", mutta tämä voi johtaa yksinkertaistettuihin ja joskus harhaanjohtaviin lopputuloksiin. Esimerkiksi lockdownin aikana, kun liikenne- ja työmatkat olivat rajoitettuja, voitiin matkustamiseen liittyvää dataa käyttää monella eri tavalla. Vaikka visuaaliset esitykset voivat antaa kuvan siitä, miten työntekijät noudattavat kotona pysymisen määräystä, itse asiassa työntekijöiden kyky noudattaa tätä määräystä ei aina ole selkeästi nähtävissä pelkästään graafisesta esityksestä.
Tässä kontekstissa tärkeäksi nousee se, kuinka subjektiiviset valinnat muokkaavat datan esittämistä. Kuvassa 8.6 esitellään matka- ja työmatkatiedot, jotka on päivitetty vuoden 2021 väestönlaskentatiedoilla. Tämä data otettiin aikajänteellä, jolloin koko maassa oli voimassa koronarajoituksia. Vaikka graafinen esitys on perinteinen, se on rakennettu vahvalla tavoitteella – se haluaa osoittaa eriarvoisuudet työntekijöiden kyvyssä noudattaa kotona pysymistä. Tällainen analyysi ei olisi ollut yhtä vaikuttava, jos se olisi esitetty vain yhdellä graafilla, jossa kerrotaan prosentuaaliset muutokset kahden väestönlaskentavuoden välillä. Sen sijaan, että tiedot esitetään yhtenä yksinkertaisena tilastona, graafinen esitys toistetaan useaan otteeseen eri Lontoon alueilla, jotta voidaan korostaa, kuinka eri yhteiskuntaluokat kokevat nämä rajoitukset eri tavalla.
Tässä piilee visuaalisen esityksen haasteet: graafinen esitys itsessään on melko tehoton, jos tarkastellaan sen antamaa yksityiskohtaa. Toistaminen kuitenkin auttaa vahvistamaan viestiä ja osoittaa, että kokemus kotona pysymisestä on erilainen riippuen siitä, minkälaista ammattia henkilö harjoittaa. On myös syytä huomioida, että itse data ei suoraan kerro, kuinka monta henkilöä pysyi kotona, vaan se kertoo vain matkustustiedot ja asumispaikat. Graafin luonne siis on valikoiva, ja sen tarkoitus on tuoda esiin tietyt seikat yhteiskunnan eri osista.
Datan ja visuaalisten esitysten suunnittelu ei ole koskaan täysin neutraalia. Taustalla olevat arvot, ennakkoluulot ja intressit muokkaavat sitä, miten dataa käsitellään ja esitetään. On tärkeää tiedostaa, että kaikki datan analysointi ja sen visuaalinen esittäminen on väistämättä subjektiivista. Rothin (2021) data storytelling -periaatteet korostavat juuri tätä yksilöllisten tekijöiden merkitystä – miten visuaaliset kertomukset voivat onnistua vain, jos niitä tukevat myös henkilökohtaiset motivaatiot ja intressit.
Esimerkki 8.7, jossa kuvataan Yhdysvaltain maakuntakohtaisia COVID-19-tapausten kasvulukuja, tuo esiin, kuinka tarkkaan suunniteltu visuaalinen esitys voi auttaa tekemään monimutkaisista tiedoista ymmärrettäviä. Tässä tapauksessa infektioiden kasvuvauhti esitetään paksuudella ja värillä, mikä auttaa katsojaa hahmottamaan, missä maakunnissa tartuntataudit kasvoivat nopeasti. Vaikka tämä visuaalinen esitys on monimutkainen, se on tehokas, koska sen avulla voi ymmärtää suurempia suuntauksia ja poikkeuksia. Ilman huolellista suunnittelua ja selittäviä legendoja graafi olisi ollut lähes mahdoton tulkita.
Datan esittämisessä on siis keskeistä ymmärtää visuaalisten valintojen vaikutus ja se, mitä ne todella viestittävät. Aina ei ole selvää, mitä halutaan korostaa ja mitä jätetään vähemmälle huomiolle. Datan esittäminen on myös aina välineellistä – se on suunniteltu tietynlaisten viestien välittämiseksi ja voi näin ollen olla jossain määrin valikoivaa.
On tärkeää, että data-analyysit eivät jää vain pintapuolisiksi tilastoiksi, vaan että niitä käsitellään kontekstissa ja niihin liittyy selkeä ja harkittu visuaalinen esitys. Visuaaliset esitykset voivat tehdä tiedoista huomattavasti vaikuttavampia, mutta ne myös tekevät valintoja siitä, mitä jää esittämättä ja mitä tuodaan esiin. Tämän vuoksi on ensiarvoisen tärkeää ymmärtää, että datan ja sen esittämisen takana on aina subjektiivisuus ja että se, mitä datasta saamme irti, riippuu pitkälti siitä, miten sen esitystapa on valittu.
Miten Lovastatiini, Niasiini ja Muut Kolesterolilääkkeet Vaikuttavat Sydänterveyteen ja Muita Mahdollisuuksia
Mahdollisuusmitta ja sen merkitys epävarmuuden mallintamisessa tartuntataudeissa
Miksi auringonpimennys on tärkeä osan asennuksen päivää ja sen merkitys vakoojille?

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский