Hyperspektral billedregistrering er en proces, der spiller en afgørende rolle i analyser af hyperspektrale billeder. I det eksisterende litteraturarbejde om registrering af hyperspektrale billeder (HS-billeder) er en af de mest diskuterede metoder dem, der er baseret på optimering. Disse metoder har vist sig at være effektive, når det gælder om at maksimere information eller statistiske målinger mellem et reference-HS-billede og et andet billede efter en estimeret transformation.
Optimeringsbaserede metoder bygger på ideen om, at statistiske mål som mutual information (MI), kryds-korrelationskoefficient (CC) og strukturel lighed (SSIM) når deres maksimale værdi, når de to billeder er korrekt justerede. Denne tilgang anvender en iterativ proces, hvor transformationen af billedet opdateres indtil den statistiske måling mellem det transformerede billede og referencebilledet når et maksimum og derefter stabiliseres. Ideen stammer fra medicinsk billedregistrering, hvor mutual information blev brugt som et mål for at registrere billeder i forskellige modaliteter.
En tidlig tilpasning af mutual information for multispektrale og hyperspektrale billeder blev udført af Kern et al. Deres forskning viste, at det er mere effektivt at anvende en vægtet gennemsnit af den parvise mutual information mellem spektralbåndene, frem for blot at vælge et enkelt referencebånd. Hasan et al. udvidede yderligere ideen og brugte en alternativ informationsmåling, kaldet krydskumulative residuale entropi (CCRE), for at registrere både hyperspektrale og RGB-billeder. Det blev fundet, at CCRE konvergerede hurtigere end MI i deres eksperimenter, hvilket indikerede, at forskellige statistiske mål kan have varierende effektivitet afhængig af scenariet.
En anden stor udfordring i registrering af hyperspektrale billeder opstår, når der er en væsentlig skalaforskel mellem de billeder, der skal registreres. Zhou et al. introducerede en løsning, der kunne registrere multispektrale og hyperspektrale billeder for at opnå en kombination af både høj spatial og spektrometrisk opløsning. Deres tilgang involverer en iterativ proces, hvor en ikke-stiv transformation anvendes på det hyperspektrale billede, mens der anvendes en stiv transformation på det multispektrale billede, før de to billeder fusioneres. Denne metode har vist sig at være effektiv, når man arbejder med billeder, der har betydelige forskelle i skala og opløsning.
Optimeringsbaserede algoritmer til registrering af HS-billeder kan generelt beskrives i flere trin. Først omdannes de givne HS-billeder til 2D-billeder ved at vælge et spektralbånd eller gennemføre en 3D/2D-konversion. De resulterende billeder filtreres for støj og normaliseres til samme amplitudeskala. Derefter, med udgangspunkt i et indledende estimat for den geometriske transformation, beregnes mutual information (eller et andet statistisk mål som CC eller SSIM) iterativt efter hver iteration. I hver iteration udføres en søgealgoritme som Newton-søgning eller Steepest Descent i nærheden af parametrene for den geometriske transformation for at øge mutual information. Processen fortsætter, indtil ændringen i mutual information er under en vis tærskel, hvorefter algoritmen stopper.
Selvom optimeringsbaserede metoder matematisk beskriver registreringsproblemet godt, har de også nogle ulemper. En af de største udfordringer er, at algoritmerne kan fastlåse sig i lokale minima under søgeprocessen. Dette sker, når parametrene for de affinerede eller projektive transformationer ikke er ensartet afbalancerede, hvilket kan forhindre algoritmen i at finde den globale optimale løsning. En anden ulempe er den høje beregningsmæssige omkostning ved disse metoder, hvilket gør dem mindre attraktive sammenlignet med andre tilgangsmetoder i visse situationer.
Optimeringsbaserede metoder anvender en række statistiske mål til at sikre en korrekt registrering af billeder, men det er også vigtigt at forstå, at metodernes kompleksitet og beregningsomkostninger kan variere. Selv om de er velegnede til visse typer af billeder, vil de ikke nødvendigvis give optimale resultater i tilfælde med stor variation i billedskala eller sensorforskelle.
Derudover har nyere fremskridt inden for dyb læring også ført til nye tilgange til billedregistrering. Dyb læring har allerede revolutioneret registrering af RGB-billeder, og metoder som Superpoint, LF-Net, D2-Net og Neural-Guided RANSAC har bidraget til at forbedre funktionsegenskabsdetektion og geometrisk transformation. Dog er en stor begrænsning af disse metoder, at de antager en stiv global transformation mellem de inputbilleder, de arbejder med. Dette betyder, at lokale fejljusteringer, der ikke passer til den globale transformation, kan være svære at håndtere med dyb læring. En løsning på dette problem blev foreslået af Zheng et al., som brugte en netværksbaseret tilgang til at kombinere registrering med fusionsnetværk for at håndtere lokale misjusteringer under registreringsprocessen.
Væsentligt at forstå for læseren er, at selv om dyb læring tilbyder lovende løsninger på mange udfordringer i hyperspektral billedregistrering, er der stadig betydelige udfordringer, især når der er betydelige forskelle i billedegenskaber som opløsning og sensorfunktioner. Yderligere forskning og udvikling er nødvendig for at forbedre disse metoder og gøre dem mere anvendelige i et bredt spektrum af applikationer.
Hvordan BBO-metoden Optimerer Hyperspektrisk Billedklassifikation
BBO (Biogeography-Based Optimization) er en relativt ny tilgang, der kombinerer de naturlige principper for migration og tilpasning med optimeringsalgoritmer. Hovedformålet med BBO er at finde optimale løsninger ved at udveksle information mellem løsninger, baseret på emigrations- og immigrationsrater. Emigrationsraten angiver sandsynligheden for, at en egenskab migrerer fra én løsning til en anden, mens immigrationsraten bestemmer sandsynligheden for, at en løsning ændrer sig ved at tilføje nye egenskaber fra en anden løsning.
I BBO-metoden starter man med at vælge tilfældige egenskaber fra et sæt af mulige funktioner. Hver løsning er evalueret ved hjælp af en objektiv funktion, der angiver, hvor god løsningen er. Når en løsning ændres, bestemmes ændringerne ud fra immigrationsraten for løsningen. Dette betyder, at et tilfældigt træk fra en anden løsning kan blive inkorporeret i den valgte løsning, hvis immigrationsraten tillader det. På samme tid, når en løsning modtager en ændring, er emigrationsraten for de øvrige løsninger med til at bestemme, hvilken løsning der sender en egenskab.
En vigtig del af BBO-metoden er mutationsoperationen. Denne operation sikrer, at nye funktioner også kan tilføjes til løsningen, hvilket betyder, at det ikke kun er de oprindeligt valgte funktioner, der er involveret i optimeringsprocessen. Mutation gør det muligt for BBO at udvide mulighederne for at finde en bedre løsning, som ellers kunne være blevet begrænset af de oprindelige valg.
Når man har anvendt BBO til at vælge de mest relevante bånd (eller funktioner) i et hyperspektrisk billede, kan man bruge klassifikationsmetoder som Support Vector Machines (SVM) til at gruppere dataene. SVM's grundlæggende princip er at finde en hyperplan, der bedst adskiller data i et højere dimensionelt rum, hvilket er især nyttigt, når dataene ikke er lineært separerbare i deres oprindelige rum.
I klassifikationen anvendes Radial Basis Function (RBF) som kernefunktion, der måler ligheden mellem to mønstre baseret på deres afstand i indgangsrummet. Denne funktion bruges til at omdanne data fra et lavdimensionelt rum til et højere dimensionelt rum, hvor det bliver lettere at skelne mellem klasserne.
Et yderligere skridt i denne proces involverer brugen af Convolutional Neural Networks (CNN) til både funktionel indlæring og klassifikation af hyperspektriske billeder. CNN’er er effektive til at lære mønstre i data, især når der er komplekse rumlige og spektrale sammenhænge. I 2D CNN’er bruges små filtre til at lære lokale funktioner i billeddataene, mens 3D CNN’er kan lære både de rumlige og spektrale træk samtidig, hvilket gør dem ideelle til hyperspektriske billeder, hvor både rumlige og spektrale korrelationer er vigtige.
Når en 2D CNN anvendes på hyperspektriske billeder, opdeles dataene i små firkantede patches, hvor et filter anvendes for at lære træk som kanter, teksturer og mønstre. Denne metode er god til at udtrække rumlige oplysninger, men det tager ikke højde for de spektrale dimensioner af billedet. For at håndtere både rumlige og spektrale træk anvendes 3D CNN’er, som arbejder på et 3D-grid og kan lære både de rumlige og spektrale egenskaber samtidigt.
CNN-arkitekturerne har flere lag, hvor hvert lag lærer forskellige niveauer af funktioner. I et typisk CNN-setup vil man starte med konvolutionslag, der anvender filtre på inputdataene, derefter følge med aktiveringsfunktioner som ReLU, som introducerer ikke-linearitet, og til sidst anvende fuldt forbundne lag for at lave de endelige klassifikationsbeslutninger. Softmax aktiveringsfunktionen bruges til at bestemme klassernes sandsynlighed i det sidste lag.
En vigtig faktor, der skal forstås af læseren, er den store betydning af BBO i forhold til effektiv funktionel udvælgelse, som giver en reduktion i de nødvendige data, samtidig med at nøjagtigheden i klassifikationen forbedres. Ved at optimere båndene, der bruges til klassifikationen, kan man opnå bedre præstationer i en lang række applikationer, fra landbrugsmonitorering til miljøovervågning.
En anden vigtig pointe er, at BBO’s evne til at udveksle information mellem løsninger gør det muligt at undgå lokale minima, som kan være et problem i mange optimeringsalgoritmer. Desuden, mens BBO primært fokuserer på funktionel udvælgelse, så spiller de efterfølgende klassifikationsmetoder som SVM og CNN en vigtig rolle i at forstå de dybere sammenhænge i dataene.
Endtext

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский