Når man arbejder med spektrale signaturprøver fra forskellige emner, opstår der ofte den udfordring, at de mest markante variationer ikke nødvendigvis forklarer de biologiske og fysiologiske forskelle mellem vævstyper, som induration, erytem og normalt hudvæv. Variationerne i spektrale data kan i høj grad være præget af andre faktorer som hudfarve og hudstruktur. For at håndtere dette problem kan man anvende principal component analysis (PCA), en metode der reducerer datadimensionerne ved at identificere de mest signifikante variationer i dataene.
Når man udfører PCA, søger man efter de linjer (principal components), der bedst kan beskrive variationen i datasættet. Den første principal component, Pc1, fanger den største variation i datasættet, mens den anden, Pc2, fanger den næststørste. Dette gøres ved at projicere de oprindelige spektrale data ind i en ny koordinatskala, som repræsenterer de vigtigste retninger af variation. I praksis betyder det, at de oprindelige data fra (Bv, Bw)-koordinatsystemet, der repræsenterer spektrale bands, transformeres til et 2D-rum, hvor variationen bliver mere forståelig og lettere at visualisere.
For at opnå et mere præcist billede af, hvordan vævstyperne interagerer, kan man tilføje en anden principal component, som fanger variationer, der ikke nødvendigvis er til stede i Pc1. Denne tilgang gør det muligt at visualisere forholdet mellem prøverne bedre og fjerne overflødige data, der ikke bidrager signifikant til forståelsen af forskellene mellem vævstyperne.
Det er vigtigt at forstå, at PCA arbejder ud fra et antagelse om, at de største variationer i datasættet har den største betydning. Dermed kan PCA hjælpe med at reducere mængden af data, der skal analyseres, ved at fokusere på de vigtigste komponenter og samtidig fjerne mindre væsentlige variationer. Dette kan være nyttigt i mange applikationer som for eksempel hyperspektral billeddannelse til diagnostik af latent tuberkuloseinfektion, hvor det at kunne skelne mellem subtile variationer i væv er afgørende for præcise diagnoser.
Den matematiske baggrund for PCA involverer beregning af egenvektorer og egenværdier fra kovariansmatricen af de standardiserede træningsdata. Kovariansmatricen beskriver, hvordan de forskellige bølgelængdebånd (B1, B2, ..., Bn) korrelerer med hinanden. De egenvektorer, der opnås fra denne proces, repræsenterer de retninger, hvor variationen i dataene er størst, og egenværdierne angiver styrken af denne variation.
Efter beregning af de første n principal components kan det være nødvendigt at reducere antallet af komponenter til et mindre sæt (r < n), som stadig forklarer størstedelen af variationen i datasættet. Dette gøres for at forenkle analysen og reducere computationalt intensive beregninger, mens man stadig bevarer de vigtigste informationer i dataene.
Ved at projicere prøverne fra et n-dimensionalt bølgelængdebandrum til et r-dimensionalt PCA-rammeværk kan man effektivt visualisere, hvordan de forskellige prøver fordeler sig, og hvordan de relaterer sig til de forskellige vævstyper. Denne projektion gør det lettere at forstå de biologiske og fysiologiske forskelle mellem vævene og giver mulighed for en mere præcis diagnose af sygdomme som latent tuberkulose.
Endvidere kan PCA hjælpe med at afsløre sammenhænge mellem spektrale data og de underliggende fysiologiske tilstande, som måske ikke er umiddelbart synlige. For eksempel, hvis visse komponenter forklarer variation i hudfarve eller tekstur, kan dette være vigtigt at forstå i konteksten af medicinske analyser.
Endtext
Hvordan hyperspektral billedbehandling kan forbedre diagnosen af latente tuberkulose-infektioner
PCA-transformationen af hyperspektrale data, som er baseret på bølgelængderne 500 nm og 600 nm, viser en markant adskillelse mellem erythema-prøver og normale hudprøver i testdatasættet, som illustreret i Figur 1.33b. Masken, der er genereret for erythema ved hjælp af disse specifikke bølgelængder, præsenteres i Figur 1.33c, og sammensætningen af masken på RGB-estimaterne er vist i Figur 1.33d. Denne transformation af hele bølgelængdeområdet for testdatasættet blev betegnet som S, hvilket er analogt med T for træningsdatasættet. Figur 1.33e viser visualiseringen af den første hovedkomponent af S.
Feature-rumplotningen for trænings- og testprøverne i T og S fremgår af Figur 1.34. Dette feature-rum repræsenterer hver prøve som en vektor med komponenter af gennemsnittet og standardafvigelsen af de 38 prøver. Modellen baseret på Support Vector Machine (SVM) blev testet på fem testpersoner i dette feature-rum og opnåede en prædiktiv nøjagtighed på 80%. Ved at anvende en tærskelværdi på ψ = 0.87, baseret på inspektion af den estimerede grænse mellem klasserne på aksen for gennemsnit af erythema-området i Figur 1.34, blev der genereret segmenteringer af induration, som adskiller indurationsprøver fra "erythema kun" prøver.
RGB-estimaterne for hele trænings- og testdatasættene er vist i Figur 1.36. Prøverne, der er projiceret på Pc1-aksen for trænings- og testdatasættene, kan visualiseres med et farvekort, som vist i Figur 1.37. Dette farvekort hjælper med at identificere prøver, der med stor sandsynlighed tilhører indurationsgruppen, de, der kun tilhører erythema, og dem, der befinder sig i grænseområdet mellem de to klasser. Denne visualisering kan hjælpe med at forbedre grænsefladen og tærskelværdierne mellem de to klasser af prøver. Dette giver en kvantitativ, digital og standardiseret repræsentation af LTBI-indurationer, som kan reducere subjektiviteten ved den manuelle Mantoux-læsning.
Ved at benchmarke den foreslåede PCA-baserede model mod ResNet50 og Inception-V3, to moderne dybdelæringsmodeller, viser Figurerne 1.38 og 1.39 samt Tabel 1.1 læringskurverne for disse modeller. I Figur 1.38 ses læringskurverne, mens Figur 1.39 viser nøjagtigheden per epoch og de punkter, der udløste tidlig stop. Adam-optimizeren, krydsentropi-tab-funktionen og batch-gradientnedstigningen blev brugt i træningen og valideringen af begge modeller. En læringsrate på 0.001 var optimal for ResNet50 og 0.01 for Inception-V3. Tabel 1.1 viser præstationssammenligningen mellem den foreslåede PCA-baserede model og de dybdelæringsmodeller, der blev anvendt. Begge modeller opnåede en valideringsnøjagtighed på 75% og en testnøjagtighed på 80%. Den PCA-baserede model opnåede højere valideringsnøjagtighed, mens den matchede testnøjagtigheden af dybdelæringsmodellerne. Dette bekræfter den foreslåede PCA-baserede segmentsignatur og dens effektivitet.
En vigtig pointe ved validerings- og prædiktive nøjagtigheder for SVM-modellen er, at gennemsnittet og standardafvigelsen af prøveområderne i T og S udgør en nyttig karakterisering af induration, som giver en god opdeling mellem erythema-prøver og induration-prøver, på tværs af 20 patienter med forskellige hudtoner fra kaukasiske til meget mørk hudtone. Valget af disse funktioner bygger på hypotesen om, at fraværet af normale hudprøver fra både T og S sikrer, at transformationerne af indurations- og erythema-prøverne i de første hovedkomponenter af T og S maksimerer enhver iboende interkluster-separation mellem de to prøvetyper. Resultaterne viser, at prøver, der antages at tilhøre indurationsgruppen, har lavere gennemsnitsværdier end erythema-gruppen, hvilket tyder på, at en stor del af prøverne i indurationsgruppen har en lavere gennemsnit end de klinisk klassificerede erythema-prøver.
De generelt lavere standardafvigelser i erythema-områderne tyder på, at prøverne i disse områder er mere homogene. Modsat indikerer de højere standardafvigelser i indurationsområder, at disse prøver består af en blanding af prøvetyper. I den gennemsnitsinformerede segmentering, der vises i Figur 1.35, har de patienter, der er klinisk klassificeret med induration, klynger af prøver, der i gennemsnit er konsistente langs den estimerede akse for lægens målinger. Derimod findes der for patienter med kun erythema ikke nogen konsistente klynger langs den estimerede akse, hvilket kan forklare, hvorfor lægen ikke havde taktil feedback for de patienter, der havde en Mantoux-læsning på 0 mm.
Denne segmentering gør det muligt at generere pixel-per-pixel induration-etiketter fra hyperspektrale data. De opnåede prædiktive nøjagtigheder på 80% ved hjælp af PCA-baserede funktioner demonstrerer den potentiale i hyperspektral billedbehandling for præcist at læse og visualisere TST-indurationer i en standardiseret og ikke-subjektiv form. Denne tilgang repræsenterer en ny tilføjelse til hyperspektral billedbehandling, der kan være nyttig i dermatologiske anvendelser som melanom og sårpleje.
Hvordan Hyperspektral Billedbehandling Kan Forbedre Diagnostik af Latent Tuberkulose Infektion
Hyperspektral billedbehandling (HSI) har i de seneste år vist sig at have et stort potentiale inden for medicinsk billedbehandling, især i diagnostik af sygdomme som tuberkulose. I dette studie blev hyperspektral billedbehandling anvendt til at analysere hudtissue omkring TST (tuberkulin hudtest)-steder for at forbedre vurderingen af indurationer (hærdninger), som er en indikator for latent tuberkulose. Ved hjælp af en Specim IQHS kamera blev der indsamlet hyperkubedata, som blev analyseret for at kunne bestemme tilstedeværelsen og karakteristika af indurationer på hudoverfladen.
For at opnå pålidelige billeder blev optagelserne belyst med en Effilux Effi-Flex-HSI LED-array, som har en bølgelængdeudstrækning fra 400 til 1000 nm. Denne specifikation er vigtig, da det sikrer, at de optagne spektrale data spænder over det synlige og nær-IR spektrum, hvilket er nødvendigt for at identificere de subtile forskelle i hudens refleksionsegenskaber. En særlig rig blev konstrueret, som placerer kameraet cirka 250 mm over teststedet, og kun LED-lys blev brugt for at undgå forstyrrelser fra omgivende lys.
En vigtig del af billedbehandlingen var at kalibrere de optagne hyperkuber. Dette blev gjort ved at fjerne både mørk støj (som stammer fra kameraets sensorer) og spektrale bidrag fra lyskilden ved hjælp af en referencepanel (Spectralon®), der reflekterer næsten 99% af indkommende lys. Denne proces gjorde det muligt at isolere de spektrale signaturer, der stammede fra huden omkring TST-stedet.
For at kunne analysere disse data yderligere blev hyperkuberne opdelt i specifikke områder omkring testområdet, som inkluderede både hud med induration og normal hud. En 200 × 200 pixel region blev afgrænset omkring det relevante område, og de spektrale data blev derefter analyseret. Dette gjorde det muligt at undersøge hudens spektrale refleksioner på tværs af forskellige bølgelængder og skabe RGB-estimater, som simulerede, hvad en kliniker ville have set under selve testen.
Datasættet, der blev brugt i denne undersøgelse, omfattede 20 patienter, som var opdelt i to grupper: 8 uden induration og 12 med indurationer på 5 mm eller mere. Dette datasæt blev opdelt i en træningsgruppe og en testgruppe for at sikre en balanceret repræsentation af både positive og negative resultater. Hyperspektral billedbehandling er særligt nyttig, fordi den giver mulighed for at opnå detaljerede spektrale signaturer for hver pixel i en hyperkub, hvilket gør det muligt at analysere specifikke områder af huden med høj præcision.
Ved at anvende Principal Component Analysis (PCA) kunne forskerne projicere de højdimentionelle data i et koordinatsystem, der maksimerer variationen mellem datapunkterne. PCA hjalp med at identificere naturlige grupper af spektrale signaturer i hyperkuben, som kunne forbindes med specifikke hudkarakteristika, såsom områder med induration. Denne proces gav forskerne mulighed for at skelne mellem induration, erytem (rødme) og normal hud på et pixelniveau.
Denne tilgang gør det muligt at få en langt mere præcis visualisering af tuberkulin-testens indurationer end ved traditionel inspektion eller ved brug af RGB-kameraer. Det åbner også op for muligheden for at anvende hyperspektral billedbehandling til at generere præcise etiketresultater for hver pixel i en hyperkub, hvilket fjerner subjektiviteten, der ofte er forbundet med den manuelle Mantoux-læsning.
For at kunne bruge hyperspektral billedbehandling effektivt i klinisk praksis er det nødvendigt at udvikle yderligere algoritmer og teknikker til automatisk etikettering af de spektrale signaturer. Dette kunne muligvis forbedre præcisionen i diagnosticeringen af latent tuberkulose og andre sygdomme, hvor induration er en vigtig indikator. Ved at udnytte de fremskridt, som PCA og andre avancerede analysemetoder tilbyder, kan det være muligt at få en langt mere nøjagtig vurdering af de subtile ændringer i hudens refleksionsegenskaber.
Endelig er det vigtigt at bemærke, at den avancerede billedbehandlingsteknologi ikke kun har potentiale til at forbedre diagnosticeringen af latent tuberkulose, men også kan anvendes i en række andre medicinske områder, hvor præcise og detaljerede billeddata er nødvendige for at forstå sygdommens progression og for at målrette behandlingen.
Hvordan kan en Bug Bash forbedre udviklingsteams og kvaliteten af produkter?
Hvordan en Teknologisk Tragedie Kan Trække Mennesket mod Sin Ende
Hvordan påvirker AI og autonome systemer fremtidens militære beslutninger og sikkerhed?
Hvordan samler man en avanceret 3D-printet robot: Fra digitale filer til fysisk mekanisme?

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский