Keskiarvon käyttö tilastollisessa analyysissä on yleistä, mutta se on herkkä poikkeaville arvoille. Tällaiset arvot voivat vääristää tuloksia merkittävästi, vaikka niiden esiintyminen olisi hyvin harvinaista. Keskiluku, eli aritmeettinen keskiarvo, lasketaan yksinkertaisesti summasta, joka on jaettu havaintojen lukumäärällä. Se on kuitenkin helposti altis virheille, mikäli havaintoarvot eivät edusta samanlaista jakaumaa, kuten on usein tilanteissa, joissa on mitattu tai kerätty tietoja, jotka poikkeavat muista arvoista radikaalisti. Tällöin voidaan puhua niin sanotusta poikkeavasta havainnosta (outlier), joka ei kuulu tavanomaiseen jakaumaan ja voi vääristää keskiarvon laskentaa.
Erityisesti, keskiarvon keskeytyspiste, eli se kohta, jossa poikkeava havainto voi muuttaa laskentatulosta, on yksi. Tämä tarkoittaa, että pelkkä yksi virheellinen tieto voi horjuttaa koko analyysin luotettavuutta. Tämä on erittäin tärkeää muistaa, erityisesti tilastollisessa analyysissä, jossa keskiarvoa käytetään laajasti. Käytännössä tämä näkyy esimerkiksi niin, että kaksi arvoa, kuten 2 ja 52 (ppm), voivat antaa keskiarvoksi 27, mikä ei ole oikea kuvaus datan luonteesta, jos toinen luku on virheellinen tai poikkeava. On myös tärkeää huomata, että keskiarvo esitetään usein enemmän merkitsevillä numeroilla kuin yksittäiset arvot, sillä keskiarvon laskeminen antaa meille paremman varmuuden kuin yksittäisten havaintojen luotettavuus.
Keskimääräisen arvon käytön tavanomainen virhe on, että sitä käytetään keskiarvojen keskiarvon laskemiseen. Tämä tarkoittaa, että jos haluamme laskea "suuren keskiarvon" useista eri keskiarvoista, tämä on oikeaa vain, jos jokaisessa keskiarvossa käytetty havaintojen määrä on sama. Mikäli näin ei ole, käytettävä laskentakaava on erilainen ja huomattavasti tarkempi, kuten kaavassa (1b) esitetään.
Tätä taustaa vasten mediana, eli keskimmäinen arvo tilastollisessa järjestyksessä, on huomattavasti robustimpi tilastollinen mittari. Se on vähemmän altis poikkeaville havainnoille, koska se ei muutu, ellei yli 50 prosenttia havainnoista ole virheellisiä. Kun havaintojen määrä on parillinen, mediaani määritellään kahden keskimmäisen arvon keskiarvona. Mediaanin yksikkö on sama kuin alkuperäisten havaintojen, ja se voidaan esittää lisämerkitsevillä numeroilla, kuten keskiarvokin.
Hajonnan mittaamiseen käytettävät tilastot, kuten vaihteluväli ja keskihajonta, auttavat arvioimaan, kuinka paljon mittaukset poikkeavat toisistaan. Vaikkakin vaihteluväli antaa karkean kuvan korkeimman ja matalimman arvon erosta, se ei ole kovin tarkka tilastollinen mittari, koska se ei huomioi vähemmän ääri-arvoista tietoa. Keskihajonta (SD) puolestaan kertoo, kuinka paljon havaintojen keskiarvosta poiketaan keskimäärin. Keskihajonnan laskeminen perustuu havainnon poikkeaman neliöiden keskiarvoon, ja sen yksiköt ovat alkuperäisten havaintojen yksiköiden mukaisia. Keskihajonnan laskeminen on oleellista arvioitaessa analyysin tarkkuutta, sillä pienempi hajonta kertoo paremmasta suorituskyvystä ja luotettavuudesta.
Keskihajonnan merkitys korostuu erityisesti, kun arvioidaan analyysin tarkkuutta. Ainoa varoitus on, että hyvin pieniä otoskokoja (2-5 havaintoa) käsiteltäessä keskihajonta voi aliarvioida oikean hajonnan, ja luotettavan keskihajonnan laskemiseksi on suositeltavaa käyttää vähintään kuutta havaintoa. Kun työskentelet laskimella, on tärkeää muistaa, ettei pyöristystä tulisi tehdä liian aikaisin, sillä se voi johtaa merkittäviin virheisiin lopullisessa tuloksessa. On myös tärkeää huomioida, että keskihajontaa ei voida suoraan käyttää laskutoimituksissa kuten summassa tai jakamisessa ilman, että käytetään vastaavia variansseja.
Yksinkertainen mutta usein käytetty mittari hajonnan arvioimisessa on suhteellinen keskihajonta, joka on keskihajonnan ja keskiarvon suhde. Tämä mittari antaa käsityksen siitä, kuinka paljon hajonta vaihtelee suhteessa keskiarvoon, ja sitä voidaan käyttää eri keskiarvojen vertailuun.
Jakauman muotoa arvioitaessa käytetään vinouden (skewness) ja huipukkuuden (kurtosis) tilastollisia mittareita. Vinous mittaa, onko jakauma epäsymmetrinen ja suuntautuvatko arvot enemmän keskiarvon vasemmalle vai oikealle puolelle. Jos vinous on nolla, jakauma on symmetrinen. Huipukkuus puolestaan mittaa, onko jakaumassa pitkät hännät, lähes ei hännät vai normaalit hännät, kuten Gaussin jakaumassa.
Lopuksi, poikkeavien havaintojen tunnistaminen on välttämätöntä ennen tilastollisen analyysin jatkamista. Vaikka visuaalisesti voidaan havaita, että tietyt arvot poikkeavat muista, on aina suositeltavaa suorittaa virallinen testi, kuten Dixonin tai Grubbsin testi, poikkeavien havaintojen tunnistamiseksi. Nämä testit auttavat varmistamaan, että poikkeavat arvot eivät vaikuta merkittävästi tilastollisiin tuloksiin.
Mitä tarkoittavat analyysimenetelmien kriittinen taso, detektointiraja ja kvantifiointiraja?
Kriittinen taso (CCα) määritellään analyysimenetelmän kyvyksi erottaa taustasignaalista vähintään tietyn pitoisuuden omaava näyte ilman väärien positiivisten tulosten antamista. Käytännössä CCα on se signaalin raja, jonka ylittäessä voimme 95 %:n todennäköisyydellä hylätä nollahypoteesin, että mitattu signaali ei poikkea taustasta. Tämä testi on yksisuuntainen, koska negatiivisia pitoisuuksia tai nettopitoisuuksia ei yleensä käsitellä. On tärkeää ymmärtää, että vaikka signaali ylittää kriittisen tason, on olemassa jopa noin 50 % riski, että signaali silti kuuluu taustaan, jolloin todellista analyytin pitoisuutta ei voida varmasti todeta. Tästä syystä CCα ei riitä varmaksi päätöksentekoperusteeksi, vaan se toimii lähinnä alkuarviona siitä, että mitattava signaali ei ole nolla.
Kun halutaan suurempi varmuus analyytin havaitsemisesta, käytetään niin kutsuttua detektointirajaa (CCβ tai xd). Tämä raja vastaa analyytin vähimmäispitoisuutta, joka 1−β todennäköisyydellä tuottaa oikean päätöksen siitä, että näyte eroaa taustasta. Käytännössä se tarkoittaa, että kontrolloidaan sekä väärien positiivisten (α) että väärien negatiivisten (β) virheiden riskejä, tyypillisesti kummankin asetuksena on 5 %. Detektointiraja lasketaan hyödyntämällä ns. epäkeskeistä t-jakaumaa, joka huomioi molemmat virhetyypit ja näytteenoton vapaat asteet. Jos tarkkoja taulukoita ei ole käytettävissä, δ-parametri voidaan likimääräisesti arvioida kaksinkertaiseksi opiskelijan t-arvosta, mikä antaa riittävän tarkan tuloksen käytännön tarpeisiin.
On myös huomattava, että sekä kriittisen tason että detektointirajan laskentaan liittyvät arvot viittaavat analyysin loppuvaiheen mittauksiin. Näin ollen alkuperäisen näytteen käsittely, kuten laimennukset tai muut esikäsittelyt, täytyy huomioida arvioitaessa varsinaisen analyysin herkkyyttä.
Määrällisen analyysin rajana pidetään kvantifiointirajaa (LOQ tai xq), joka kuvaa vähimmäispitoisuutta, jonka analysointimenetelmä pystyy luotettavasti kvantifioimaan tietyllä ennalta määritellyllä suhteellisella keskihajonnalla, tyypillisesti 10 %. Kvantifiointirajan laskenta on monimutkaista, koska siinä pitää ottaa huomioon kalibraatiokäyrän kaltevuuden virhe sekä mitattavan arvon ennustamiseen liittyvä varianssi. Yleisesti käytetty lähestymistapa perustuu iteratiiviseen laskentamenetelmään, jossa aloitusarvona käytetään noin kolmea kertaa detektointirajaa, ja laskelmaa toistetaan, kunnes arvo konvergoituu. Tämä prosessi on toteutettavissa helposti esimerkiksi taulukkolaskentaohjelmalla ilman lisäkokeita.
On syytä tiedostaa, että ISO- ja IUPAC-määritelmät ovat laajasti hyväksyttyjä ja kansainvälisesti sovittuja standardeja, mutta ne eivät poista kaikkia ongelmia analyysirajojen määrittelyssä. Erityisesti epäkeskeisen t-jakauman parametri voi aiheuttaa vinoumia ja johtaa liian moniin väärin negatiivisiin tuloksiin. Tästä huolimatta näitä määritelmiä pidetään käyttökelpoisina ja pedagogisesti tarkoituksenmukaisina alkeistason analytiikan opetuksessa.
Analyysimenetelmien herkkyys ja luotettavuus voidaan siis arvioida eri tasoilla: kriittinen taso toimii kynnysarvona signaalin havaitsemiselle, detektointiraja määrittelee varmasti havaittavan pitoisuuden ja kvantifiointiraja kertoo, millä pitoisuudella määritys on luotettavasti kvantifioitavissa. Näiden käsitteiden ymmärtäminen on keskeistä, jotta laboratorio voi raportoida tulokset oikein ja välttää tulkinta- ja raportointivirheitä. Erityisesti on tärkeää muistaa, että mitatut arvot eivät ole mustavalkoisia, vaan niihin liittyy aina tilastollista epävarmuutta, joka tulee ottaa huomioon päätöksenteossa.
Miten analyytin tunnistus ja kvantitatiivinen analyysi tapahtuvat kromatografisissa menetelmissä?
Analyytin ja sisäisen standardin (IS) retentioaikojen on oltava hyvin samankaltaisia verrattuna standardiliuoksessa saatuihin arvoihin. Euroopan komission päätöksen 2002/657/EY mukaan hyväksyttävä vaihteluväli on ±0,5 % kaasukromatografiassa (GC) ja ±2,5 % nestekromatografiassa (LC). Yksi yleisistä vahvistusmenetelmistä on standardin lisääminen näytteeseen, joka oletettavasti sisältää analyytin. Jos kromatogrammissa näkyy suurentunut huippu, lisätty analyytin määrä on läsnä näytteessä. Huipun laajennus vastaa lisättyä määrää. Toisaalta uuden huipun tai olkapään ilmaantuminen viittaa analyytin puuttumiseen näytteestä. Päätöksen mukaan huipun leveys puolikorkeudella saa poiketa alkuperäisestä vain 90–110 % ja retentioaikojen on oltava identtiset 5 % marginaalilla. Tätä menetelmää käytetään pääasiassa positiivisen tunnistuksen vahvistamiseen.
Kromatografisia olosuhteita voidaan muuttaa, esimerkiksi vaihtamalla mobiili- tai kiinteä faasi, jotta analyytin erottaminen olisi helpompaa. Jos eri olosuhteissa mitattu retentioaika vastaa standardin retentioaikaa, analyytin esiintyminen näytteessä vahvistuu. Kemiallinen derivatisointi on toinen varmistuskeino: alkuperäisen huipun katoaminen ja johdetun huipun ilmaantuminen näytteessä vahvistavat analyytin tunnistuksen. Positiivinen tunnistus ei kuitenkaan koskaan ole täysin varma, mutta negatiivinen vastaus on lopullinen.
Edistyneemmissä tunnistusmenetelmissä, kuten diodiarraydetektorilla (DAD) tai massaspektrometrillä, näytteen huippujen spektrit verrataan kirjastoihin. DAD:n avulla voidaan myös arvioida huipun puhtautta matemaattisin algoritmein, mikä auttaa havaitsemaan samanaikaisesti eluoituneiden yhdisteiden esiintymisen.
Kvantiittinen analyysi voidaan aloittaa vasta, kun analyytin tunnistus on varmistettu. Huippujen integraatio on ensisijainen vaihe, ja vaikka se on automaattinen, se voidaan tehdä myös manuaalisesti. Huipun ala mitataan piirtämällä perusviiva huipun alkupisteestä loppupisteeseen, ja huipun korkeus mitataan huipun huipulta perusviivalle. Integraatiotapa valitaan huippujen erotuskyvyn mukaan; esimerkiksi silloin, kun huiput eivät ulotu perusviivalle, voidaan käyttää tangentin tai pystysuoraa viivaa. On tärkeää käyttää samoja integraatiotapoja sekä standardeissa että näytteissä, vaikka monivaiheinen näytteen käsittely saattaa aiheuttaa meluisamman perusviivan tai epäsymmetriset huiput.
Sekä huipun ala että korkeus soveltuvat kvantitointiin. Useimmiten huipun alan käyttö antaa parempaa toistettavuutta, mutta kapeiden ja symmetristen huippujen tai pienten huippujen kohdalla huipun korkeus toimii hyvin. Pienet näyte-injektioiden vaihtelut korjataan käyttämällä sisäistä standardia.
Kvantiittisessa analyysissä käytetään yleensä kahta kalibrointimenetelmää: ulkoista kalibrointia ja sisäistä kalibrointia. Ulkoinen kalibrointi perustuu standardiliuosten kalibrointikäyrän rakentamiseen, kun taas sisäinen kalibrointi tarkoittaa sisäisen standardin lisäämistä sekä näytteisiin että standardeihin. Sisäistä kalibrointia käytetään yleisesti GC:ssä, jossa injektioissa voi esiintyä vaihtelua. Sisäisen standardin tulee täyttää useita ehtoja: sen retentioajan tulee olla lähellä analyytin retentioaikaa mutta erottua näytteen muista komponenteista, sen ei tule esiintyä näytteessä valmiiksi, ja sen tulee olla puhdas ja reagoimaton näytteen muiden komponenttien kanssa. Massaspektrometrin kanssa yhdistetyissä menetelmissä käytetään usein isotooppisesti leimattua analyyttia sisäisenä standardina, mikä helpottaa erottelua detektiossa.
Normalisointi on harvemmin käytetty menetelmä, jossa oletetaan detektorin vasteen olevan samanlainen ryhmän yhdisteille. Tällöin kvantitointi perustuu yksittäisen huipun pinta-alan osuuteen kaikkien huippujen summasta, eikä erillisiä standardeja tarvita. Tämä edellyttää kuitenkin kaikkien kyseiseen ryhmään kuuluvien komponenttien erottamista ja havaitsemista samoissa olosuhteissa.
Monivaiheinen näytteen esikäsittely on usein tarpeen, koska suoraan saadut pitoisuudet interpoloinnin perusteella eivät välttämättä vastaa todellista pitoisuutta, johtuen esimerkiksi häiriöistä tai näytteen monimutkaisesta koostumuksesta. Siksi näytteen käsittelyn ja analyysin optimointi ovat kriittisiä, jotta kvantitatiivinen analyysi on luotettavaa.
On tärkeää ymmärtää, että analyysissä tunnistus on ratkaiseva vaihe, joka vaikuttaa kvantitatiivisen analyysin luotettavuuteen. Lisäksi erottelukyky, detektorin valinta ja analyysin olosuhteet ovat keskeisiä tekijöitä, jotka määrittävät tulosten tarkkuuden. Ymmärtäminen siitä, miten huippujen puhtautta arvioidaan ja miten näytteen monikomponenttisuus voi vaikuttaa mittaustuloksiin, auttaa lukijaa ymmärtämään kromatografisten menetelmien rajoitukset ja mahdollisuudet. Lisäksi tietämys siitä, kuinka sisäisen standardin valinta ja kalibrointimenetelmät vaikuttavat tulosten korjaukseen ja tarkkuuteen, on olennaista luotettavien analyysien suorittamiseksi.
Mikä on pitoisuus ja miten se määritellään kemian analyysissä?
Pitoisuus on termi, joka kuvaa seoksen koostumusta siten, että siinä otetaan huomioon tietyn aineen määrä suhteessa koko seokseen tai sen tilavuuteen. IUPAC määrittelee pitoisuuden neljänä eri suureena, jotka kuvaavat seoksen koostumusta tilavuuden suhteen: massapitoisuus, ainemääräpitoisuus, tilavuuspitoisuus ja lukumääräpitoisuus. Useimmiten pitoisuudella tarkoitetaan ainemääräpitoisuutta, jonka yksikkönä käytetään moolia litrassa (mol/dm³), eli molaarisuutta.
Ainemäärä määritellään systeemissä olevien perusosasosasten lukumääränä, joka vastaa hiili-12-isotoopin atomien lukumäärää 0,012 kilogrammassa kyseistä isotooppia. Tämä määritelmä takaa, että atomimassan yksikkö ja moolimassa ovat numeerisesti samanarvoisia, mutta niiden yksiköt eroavat: moolimassa ilmoitetaan grammoina per mooli (g/mol). Termit atomipaino ja molekyylipaino ovat vanhentuneita ja niiden tilalla käytetään suhteellista atomimassaa ja suhteellista molekyylimassaa, jotka ovat dimensioettomia suureita.
Pitoisuus lasketaan jakamalla tietyn aineen ainemäärä liuoksen tilavuudella, mikä ilmaistaan kaavalla c = n/V. Tavanomaisin yksikkö on mol/dm³, jota kemiallisessa käytössä kutsutaan usein molaarisuudeksi (M). Vaikka IUPAC ja NIST suosittelevat termiä ainemääräpitoisuus ja ehdottavat molaarisuuden termin ja symbolin M käytön lopettamista sen epätarkkuuden vuoksi, molaarisuus on edelleen laajasti käytössä ja tunnettu.
Liuoksen pitoisuuden määrittäminen on oleellinen osa analyyttistä kemiaa. Liuos koostuu yleensä liuottimesta ja liuetuneesta aineesta, joita kutsutaan liuottimeksi ja liuokseksi. Liuos voi olla laimeaa, jolloin liuenneiden aineiden määrä on pieni suhteessa liuottimeen, tai väkevää, jolloin liuenneiden aineiden määrä on suuri. Standardiliuos on tarkasti tunnetun pitoisuuden liuos, joka valmistetaan käyttämällä puhtaita, vakioituja aineita. Primäärinen standardi on erittäin puhdas aine, jonka avulla voidaan valmistaa tarkasti tunnetun pitoisuuden liuos. Sekundäärinen standardi taas on määritelty vertaamalla primääriseen standardiin.
Pitoisuuksia ilmaistaan monin eri tavoin kemian käytännössä, mutta yleisimmät ovat molaarisuus (mol/L), massaprosentti (% m/m), tilavuusprosentti (% v/v), massan ja tilavuuden suhde (g/L), moolifraktiot ja molaliteetti (moolia per kilogramma liuotinta). On tärkeää osata muuntaa ja tulkita näitä yksiköitä oikein, sillä niiden sekoittaminen tai virheellinen käyttö aiheuttaa usein ongelmia opiskelijoille ja tutkijoille.
Termit kuten ppm, ppb ja ppt (part per million, billion, trillion) eivät ole suositeltavia pitoisuuden yksikköjä, ja ne tulisi korvata tarkemmilla muodoilla kuten 2,0 µL/L tai 4,3 nm/m, joissa käytetään asianmukaisia suureiden symboleja.
Vanhoja termejä, kuten normaliteetti (N), ei suositella enää käytettäväksi, sillä sen laskentatapa riippuu reaktiosta eikä siten ole yksiselitteinen. Normaliteetti on kuitenkin yhä hyödyllinen erityisesti titraus- ja elektroanalyysissä, joissa se perustuu ekvivalenttien käsitteeseen ja reaktioiden stoikiometriaan.
Pitoisuuden käsite on keskeinen analyysikemian ymmärtämisessä ja soveltamisessa. Sen oikea määrittely ja yksiköiden käyttö varmistavat tulosten tarkkuuden ja toistettavuuden sekä selkeän viestinnän kemiallisissa tutkimuksissa ja sovelluksissa.
Ymmärtäminen siitä, että pitoisuus ei ole yksinkertaisesti aineen määrä vaan suhteellinen suure, joka riippuu sekä aineen että seoksen tilavuudesta tai massasta, on olennainen lähtökohta kemian opinnoissa ja tutkimuksessa. Lisäksi yksiköiden ja termien oikea käyttö ehkäisee virheitä ja väärinkäsityksiä, jotka voivat johtaa vääriin johtopäätöksiin tai epäluotettaviin tuloksiin. Pitoisuuden käsitteen ohella on tärkeää hallita myös liuosten luokittelun perusteet, standardien merkitys sekä erilaisten pitoisuusilmausten keskinäiset suhteet ja niiden muuntaminen.
Miten varmistetaan turvallinen istunnonhallinta ja pääsynvalvonta?
Miten proteomiikka ja matemaattiset mallit vaikuttavat heraproteiinien sitoutumisprosesseihin?
Miten Wari, Sicán ja Chimú kulttuurit vaikuttivat Andien alueen kehitykseen?

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский