Hyperspektrala bilder är en kraftfull resurs för att analysera och klassificera markanvändning och landskap genom att fånga information från ett stort antal spektrala band. Denna teknik, som är särskilt användbar inom geospatiala och miljöstudier, ger en detaljerad bild av jordens yta, vilket gör det möjligt att särskilja olika marktyper, vegetationsklasser, och till och med identifiera specifika material eller föremål på marken. Tekniker för att bearbeta och analysera dessa bilder har utvecklats snabbt de senaste åren, vilket gör det möjligt att utföra mer precisa och komplexa klassificeringar. Här ska vi titta på några av de mest avancerade metoderna och deras tillämpningar inom området.

I dagens forskning är en av de mest användbara metoderna för att klassificera hyperspektrala bilder baserad på maskininlärning och djupinlärning. Chen et al. (2022) introducerade ett ramverk, Jagan, för komplex markanvändningsklassificering med hjälp av Gaofen-5 AHSI-bilder. Denna metod utnyttjar den höga spektrala och rumsliga upplösningen hos hyperspektrala bilder för att identifiera och skilja på små förändringar i markytan. Genom att använda avancerad datafusion och djuplärande tekniker har forskarna kunnat uppnå en betydande förbättring i klassificeringsnoggrannheten, vilket är avgörande för att hantera stora och komplexa dataset.

En annan framgångsrik metod är den adaptiva multifunktionella fusionsgraf-konvolutionsnätverksmetoden som beskrivs av Liu et al. (2023). Denna metod använder en adaptiv process för att kombinera olika funktioner och egenskaper från hyperspektrala bilder för att skapa en mer robust och exakt klassificering. Genom att analysera och använda information från både spektral och rumslig domän kan detta tillvägagångssätt identifiera dolda mönster och strukturer i datan som annars skulle kunna förbises med enklare tekniker.

När det gäller metoder för att klustra hyperspektrala bilder, har det också gjorts stora framsteg. Zhai et al. (2021) gav en omfattande översikt av aktuella framsteg inom området för hyperspektral bildklustring. Det är viktigt att förstå att klustring inte bara handlar om att gruppera liknande data, utan också om att identifiera underliggande strukturer och korrelationer i data som kan leda till nya insikter om markanvändning och miljöförhållanden.

För att säkerställa högre noggrannhet och effektivitet vid klassificering och klustring är det också viktigt att använda tekniker som SVM och MRF, vilka har visat sig vara mycket effektiva när det gäller att behandla hyperspektrala bilder (Tarabalka et al., 2010). SVM (Support Vector Machine) använder en kraftfull metod för att maximera marginalerna mellan olika klasser, vilket gör det möjligt att skilja på även små skillnader i spektrala signaturer. MRF (Markov Random Field) används för att bevara den rumsliga koherensen i datan, vilket gör det möjligt att ta hänsyn till de fysiska egenskaperna hos det som analyseras.

En annan viktig metod inom området är användningen av ankargraf-baserad klustring som beskrivs av Wang et al. (2017). Denna metod använder ett ankargraf för att identifiera viktiga dataområden och förbättra klustringens noggrannhet genom att beakta både spektrala och rumsliga aspekter av bilden. Ankargraf används för att förbättra effektiviteten och precisionen i klusteralgoritmer, vilket gör den till en mycket användbar teknik för att hantera de stora mängder data som hyperspektrala bilder genererar.

Vidare har metoder som djup självevolution klustring (Chang et al., 2018) och sparsamma undergruppsalgoritmer också blivit populära i hyperspektral bildanalys. Djup självevolution klustring gör det möjligt för algoritmen att justera sina parametrar under tiden och förbättra sin förmåga att hitta rätt mönster i komplexa dataset. Samtidigt har sparsamma undergruppsalgoritmer, såsom den som beskrivs av Zhang et al. (2016), visat sig vara mycket effektiva för att extrahera de mest representativa funktionerna från hyperspektrala bilder, vilket gör att analysen blir både mer träffsäker och snabbare.

Det är också viktigt att förstå de potentiella utmaningarna när man arbetar med hyperspektrala bilder. En sådan utmaning är spektral variabilitet, vilket kan påverka noggrannheten i analysen och göra det svårare att korrekt klassificera markytor (Borsoi et al., 2021). För att övervinna detta problem har forskare utvecklat tekniker som spektralavvikelseavläsning och spektralt-morfologiska profiler, som förbättrar förmågan att identifiera och klassificera komplexa landskap i urbana områden (Benediktsson et al., 2005).

Förutom dessa tekniker finns det också nya framsteg inom klustring och maskininlärning som gör det möjligt att arbeta med multiview subspace clustering. Detta innebär att man använder flera vyer eller perspektiv av samma data för att få en mer robust och exakt klassificering (Ou et al., 2020). Denna metod gör det möjligt att kombinera olika typer av information för att optimera resultaten och ger därmed en mer pålitlig analys av hyperspektrala bilder.

Slutligen, för att dra full nytta av hyperspektrala bilder och deras potential, krävs det en djup förståelse för de underliggande teknikerna och algoritmerna. Det är också avgörande att hålla sig uppdaterad om den senaste forskningen, eftersom metoder och tekniker ständigt förbättras och nya lösningar introduceras.

Hur utvecklas klusterbaserade metoder för hyperspektral bildanalys?

Att utveckla mekanismer för osuperviserat lärande är avgörande för att förbättra analysen och användningen av hyperspektral bildbehandling (HSI). Klustring är en kraftfull osuperviserad teknik för mönsterigenkänning och informationsutvinning, och det används i stor utsträckning för tolkningen av hyperspektral bilddata. Denna metod grupperar liknande pixlar och separerar de som är olikartade, där varje kluster representerar en distinkt klass. Genom att noggrant utnyttja de strukturella egenskaperna hos hyperspektral data, baserat på ett likhetskriterium, gör klustring det möjligt att identifiera och kategorisera olika material och objekt inom bilden. Trots detta är den interna strukturen i hyperspektrala bilder avsevärt mer komplex än för handskrivna figurer, text, naturliga bilder och multispektrala bilder. Vidare uppvisar hyperspektrala bilder en betydande spektral variabilitet, där pixlar som tillhör samma klass kan ha olika spektrala signaturer beroende på den komplexa avbildningsmiljön. Denna variation gör klustring av hyperspektrala bilder till en mer utmanande uppgift.

Vanligtvis omfattar klustring av hyperspektrala bilder två huvudsakliga uppgifter: att uppskatta antalet kluster och att bygga en lämplig klustringsmodell. Den första uppgiften är dock inte kärnan i hyperspektral bildklustring och behandlas i begränsad omfattning inom forskningsområdet. I praktiken sätts antalet kluster ofta baserat på det kända antalet klasser i markdata. När det gäller den andra uppgiften, påverkar rimligheten och effektiviteten hos klustringsmodellen direkt den slutliga klustringsnoggrannheten. Därför har utveckling och förbättring av klustringstekniker och modeller varit ett centralt fokus inom hyperspektral bildbehandling. De flesta befintliga arbeten på detta område har koncentrerats på att förbättra klustringstekniker, utforska olika algoritmer och integrera avancerade metoder för att förbättra prestanda. I denna bok läggs också stor vikt vid klustringsmodeller och -metoder.

Traditionella klustringsmetoder för hyperspektral bildbehandling har studerats och tillämpats i stor utsträckning tack vare deras effektivitet i osuperviserad mönsterigenkänning och informationsutvinning. Traditionella metoder, som K-means, baseras ofta på parvisa avståndsmått, som den euklidiska avståndet, för att mäta likhet. Men på grund av problem som blandade pixlar och redundanta spektralbands, ger dessa metoder ofta opålitliga mätningar och komplicerar klustring av hyperspektral bilddata avsevärt. Subspace-klustring är en annan klassisk metod som används, känd för sin förmåga att hantera högdimensionell data och pålitliga resultat. Denna metod försöker representera datapunkter som linjära kombinationer av en självuttryckande ordbok inom samma subspace. Trots detta är traditionella subspace-klustringsmodeller ofta baserade på euklidisk data, vilket kan leda till att grafstrukturerad information, som finns i hyperspektrala datapunkter, förbises. Det är viktigt att också beakta den rumsliga informationen som finns i hyperspektral data. Enbart spektral information är inte tillräcklig. För att fullt utnyttja spektral och rumslig information har olika spektral-och-rumslig klustringstekniker utvecklats, vilka har visat sig ge bättre resultat jämfört med de som enbart baseras på spektral information. Ett exempel på detta är spektral-rumslig sparse subspace-klustring (SSC) som främjar att mål-pixlar representeras av starkt relaterade atomer via en viktad strategi och inkorporerar rumslig granninformation för att skapa en integrerad självrepresentation.

Däremot är dessa metoder ofta grundläggande klassificerare som är baserade på handgjorda eller råa funktionsutrymmen och saknar förmåga att lära sig de högre nivåerna av funktioner i hyperspektral data. Dessa tekniker är inte tillräckliga för att effektivt hantera den stora spektrala variabiliteten och den komplexa interna strukturen som kännetecknar hyperspektrala dataset.

I takt med att maskininlärning har utvecklats, har även metoder som baseras på djupinlärning börjat användas för att klustra hyperspektral bilddata. Convolutional Neural Networks (CNN) har anpassats för att direkt genomföra dimensionell reduktion och klustring på hyperspektral data. Dessa metoder har visat imponerande resultat när det gäller att automatiskt lära sig relevanta funktioner från rå hyperspektral data och tenderar att överträffa traditionella metoder. Eftersom inga märkta prover finns tillgängliga, optimeras dessa modeller i allmänhet på ett osuperviserat sätt. Enligt olika osuperviserade lärandemekanismer kan djupinlärningsbaserade klustringsmetoder delas upp i tre huvudkategorier: autoencoder-baserad klustring, generativ nätverks-baserad klustring och kontraktiv lärande-baserad klustring. Autoencoder-baserad klustring involverar en encoder för datarepresentation och en decoder för rekonstruktion, där träning sker genom att minimera rekonstruktionsfel. Ett framstående exempel på detta är deep clustering network (DCN), som använder en djup autoencoder för dimensionell reduktion och extrahering av funktioner som är mer kompatibla med k-means klustring.

Generativ nätverksbaserade metoder fokuserar på att exakt fånga den verkliga datastrukturen för att producera högkvalitativa prover, vilket förbättrar funktionernas diskrimineringsförmåga. Ett typiskt exempel på detta är Categorical GAN (CatGAN), som använder ett min–max motstånd mellan en generator och en diskriminator för att lära sig en osuperviserad diskriminerande klassificerare. Med CatGAN har ett informationsmaximerande GAN (InfoGAN) utvecklats, som förbättrar klustringens prestanda genom att exploatera det ömsesidiga informationsflödet mellan ett litet urval av latenta variabler och observationerna.

Vidare har en uppsättning kontraktiv inlärning-baserade klustringsmetoder utvecklats, som fokuserar på att dra samman liknande instanser i funktionsrymden och samtidigt skjuta isär de som är olika, vilket förbättrar diskrimineringsförmågan hos de lärda representationerna.

För att maximera klustringens effektivitet i hyperspektral bildbehandling är det viktigt att förstå att den spektrala och rumsliga informationen inte kan ses som separata enheter. Ett effektivt system måste integrera dessa olika datatyper på ett sätt som bevarar och förstärker deras relationer, vilket gör att klustringsmodellerna kan återspegla verkligheten mer exakt. Dessutom, för att kunna tillämpa dessa teknologier på praktiska problem, behövs robusta metoder för att hantera olika typer av störningar och variationer som ofta förekommer i verkliga hyperspektrala dataset.

Hur kan spatial-spektral grafkontrastiv inlärning förbättra klustring av hyperspektrala bilder?

Hyperspektrala bilder (HSI) utgör en komplex tredimensionell datastruktur där varje pixel innehåller ett spektrum av information över många våglängder. Utmaningen vid klustring av dessa bilder ligger i att hantera både deras rika spektrala data och det spatiala sammanhanget. En framstående metod för att tackla detta är en spatial-spektral grafkontrastiv inlärningsram, som kombinerar flera avancerade tekniker för att extrahera robusta och diskriminerande representationer.

Den första fasen i denna process är att identifiera stabila referenspunkter genom superpixelsegmentering. Genom att gruppera intilliggande pixlar med liknande spektrala egenskaper skapas homogena områden, där varje superpixel representeras av sin centroid. Detta grepp bevarar maximal spatial-spektral information eftersom centroidens spektrala värde beräknas som medelvärdet av dess sammansatta pixlar, vilket effektivt reducerar brus och undviker att artificiell dataaugmentering förvränger semantiken. Den spatiala kontexten kompletteras genom att varje anchor även beskrivs med hjälp av dess lokala tredimensionella omgivning i ett w×w-fönster, vilket skapar en rik spatial beskrivning.

Den andra komponenten av ramverket består av att konstruera två separata grafer baserade på dessa spatiala och spektrala representationer. Varje anchor ses som en nod i en graf, och närheten mellan noder bestäms av deras likhet, vilket formaliseras via adjacencymatriser där kanter kopplar ihop närmaste grannar. Detta möjliggör användandet av Graph Convolutional Networks (GCN) som aggregat av information från närliggande noder, snarare än traditionella konvolutionella nätverk som enbart hanterar lokal information. GCN-modulerna lär sig att fånga både lokala geometriska strukturer och globala spektrala mönster, vilket är avgörande för att skapa representativa embeddingar som reflekterar de underliggande klasserna i bilden.

Nästa steg i processen är implementeringen av en klusterinriktad konsistensinlärning, som säkerställer att de spatiala och spektrala representationerna är semantiskt samstämmande. Detta uppnås genom att optimera en gemensam målfunktion som främjar överensstämmelse mellan de två vyerna, vilket kraftigt förbättrar klustrets diskriminativ förmåga. Denna metod skapar en inlärning där kluster centreras kring naturliga grupperingar i datat och säkerställer att de är både täta och väl separerade.

Slutligen introducerar ramverket en adaptiv kontrastiv inlärningsalgoritm med intelligent hantering av svåra exempel, där vikten av olika datapunkter justeras dynamiskt. Under träningsprocessen identifieras exempel som är svåra att klassificera korrekt och får ökad prioritet i inlärningen, medan enklare exempel får mindre vikt. Denna hårda exempelminerande mekanism säkerställer att modellen lär sig att särskilja även subtila skillnader mellan klasser, vilket annars lätt förbisås i en mer jämnt viktad inlärning.

Det är av vikt att förstå att hyperspektral klustring inte endast handlar om att reducera dimensioner eller aggregera data, utan om att skapa en djup representation som integrerar både spatial och spektral information på ett meningsfullt sätt. Genom att modellera data som grafer kan man bevara och utnyttja komplexa beroenden mellan punkter, vilket är svårt att åstadkomma med traditionella metoder. Vidare är valet av superpixelers centroid som referenspunkter centralt för att minimera informationsförlust och samtidigt undvika överflödiga eller brusiga data. Metodens styrka ligger också i dess förmåga att fokusera inlärningen på diagnostiskt viktiga svåra exempel, vilket leder till mer robusta och generaliserbara kluster.

För en djupare förståelse är det även viktigt att beakta matematiken bakom GCN-lagren, där information från närliggande noder aggregeras via en normaliserad adjacencymatris för att stabilisera inlärningen och säkerställa att varje nods representation påverkas proportionellt av dess grannar. Normaliseringen inkluderar självkopplingar för att bibehålla nodens ursprungliga information, medan vikterna i GCN tränas för att extrahera de mest relevanta funktionerna. Den kombinerade spatiala och spektrala grafstrukturen möjliggör en synergistisk integration som är överlägsen metoder som behandlar dessa vyer separat.

Sammanfattningsvis är denna spatial-spektral grafkontrastiva inlärning en avancerad metod som genom integration av superpixelsegmentering, GCN-baserad representation och adaptiv kontrastiv träning, skapar starkt differentierade och robusta kluster i hyperspektrala bilder. Det är av största vikt för läsaren att förstå att det inte bara är en teknisk uppsättning steg, utan en sammanhållen strategi som adresserar den komplexa samverkan mellan spektral information och spatial kontext i HSI-data.