Registreringen av bilder från olika satellitsystem och sensorer är ett väl etablerat forskningsområde som har utvecklats avsevärt över tid, och har blivit allt viktigare för avancerad fjärranalys och applikationer inom rymdteknologi. Speciellt när det gäller fjärrsensing på olika plattformar (t.ex. optiska och SAR-bilder) har metoder för att extrahera domänoberoende representationer blivit avgörande för att hantera de stora skillnaderna mellan sensorer, plattformar och bildtyper.

En av de mest grundläggande uppgifterna inom detta område är att övervinna de skillnader som uppstår när bilder från olika sensorer (t.ex. SAR och optisk bildbehandling) ska registreras och anpassas. För att åstadkomma detta används olika metoder för bildregistrering, som grovt sett delas upp i två huvudkategorier: intensitetsbaserade och funktionsbaserade metoder.

Intensitetsbaserade metoder fokuserar på att maximera likheterna mellan bilder genom geometriska transformationer som bygger på korrelation och ömsesidig information. Dessa metoder, som till exempel korskorrelation eller ömsesidig informationsoptimering, används ofta för att registrera multitemporala bilder, där tidsbaserade förändringar är viktiga att fånga. De söker efter likheter i bildens intensitet eller pixelvärden och försöker skapa en gemensam representation av dessa, vilket ofta innebär att bilderna ska justeras för att överensstämma med varandra i ett gemensamt koordinatsystem.

Funktionsbaserade metoder, å andra sidan, identifierar och matchar specifika särdrag eller objekt i bilderna, som kan vara punkter, linjer eller områden. Dessa särdrag är viktiga eftersom de inte är lika beroende av bildens övergripande intensitet, vilket gör dem mer robusta mot störningar och förändringar i sensorers egenskaper. Den välkända Scale-Invariant Feature Transform (SIFT)-metoden, liksom dess specialiserade varianter som SURF, SAR-SIFT eller position-scale-orientation SIFT, är exempel på effektiva tekniker för att extrahera sådana funktioner från bilder. Djupinlärning har också gjort det möjligt att utveckla ännu mer sofistikerade funktionsbaserade metoder genom användning av konvolutionella neurala nätverk (CNN), som till exempel AlexNet eller VGG16, för att extrahera och matcha bilder från olika sensorer.

Trots att dessa metoder har visat sig effektiva, finns det en betydande utmaning i de flesta tillämpningar: bristen på märkta data från måldomänerna. I många operativa scenarier, särskilt inom rymdteknologi, är det svårt och kostsamt att samla in annoterade dataset för att träna modeller som kan överföra kunskap från en domän (t.ex. optisk bildbehandling) till en annan (t.ex. SAR-bilder). Detta leder till att metoder för obevakad domänanpassning (Unsupervised Domain Adaptation, UDA) har blivit en aktiv forskningsinriktning.

Domänanpassning (DA) innebär att vi använder data från en domän för att förbättra prestanda på en annan domän, ofta där det finns brist på märkta data. Obevakad domänanpassning (UDA) är en speciell typ av domänanpassning där endast de obevakade måldata (utan annoteringar) används under träningen, vilket gör det till en ideal metod för fjärrsensing där märkningsarbete är dyrt. Dessa metoder strävar efter att minska de skillnader i fördelningar mellan käll- och måldomäner, vilket är avgörande för att uppnå effektiv bildregistrering och anpassning mellan olika sensorer och satellitsystem.

En vanlig metod inom UDA är att använda ett enstegs- eller flerstegs tillvägagångssätt. Enstegmetoder försöker direkt justera distributionsskillnaderna mellan käll- och måldomäner genom finjustering på obevakade mål-data. Dessa metoder kan vara instansbaserade, funktionsbaserade eller klassificerarbased. Funktionsbaserade metoder är de mest använda inom fjärrsensing eftersom de är bra på att extrahera överförbara representationer genom djupinlärning. Flerstegsmetoder, som involverar överföring av kunskap genom mellandomäner, har visat sig vara effektiva när det finns stora skillnader mellan käll- och måldomäner.

Trots dessa framsteg kämpar många domänanpassningsmetoder med att hantera de stora distributionsskiften som är vanliga i korsmodala rymddata, särskilt när käll- och måldomänerna är mycket olika, som i fallet med SAR och optisk bildbehandling. De stora skillnaderna i bildutseende och sensorernas plattformsspecifika variationer innebär att specialiserade anpassningstekniker behövs för att extrahera meningsfulla korrespondenser mellan domänerna, trots de stora utmaningarna.

För att möta dessa utmaningar föreslår vi ett omfattande ramverk som kombinerar avancerade djupinlärningsarkitekturer med specialiserade domänanpassningstekniker. Detta ramverk möjliggör effektiv registrering av SAR-optiska bilder mellan olika satellitplattformar utan att kräva märkta data från måldomänen, vilket gör det särskilt värdefullt för operativa rymdapplikationer. Ramverket består av tre huvudkomponenter: ett Siamese-nätverk med rotations- och skaltransformation för övervakad inlärning på källdata, en kausalinlärning-baserad självinlärningsmekanism för att överföra kunskap till måldomänen, och flerlösnings histogram-matchning för att minska skillnader i utseende mellan domänerna.

Samtliga komponenter arbetar i samverkan för att både övervinna gapet mellan korsmodala bilder (t.ex. SAR och optiska bilder) och plattformsspecifika variationer mellan olika satellitsystem, vilket gör det möjligt att genomföra effektiv bildregistrering utan mål- domänens annoteringar. Siamese-nätverket fokuserar på att extrahera distinkta funktioner från heterogena bildmodaliteter, medan de specialiserade transformationsmodulerna säkerställer att nätverket är robust mot geometriska variationer, som rotation eller skalning. Kausal inferens identifierar invarianta representationer som fångar den strukturella informationen som är oberoende av modality eller plattform, medan histogram-matchningen gör det möjligt att minska skillnader i utseende mellan käll- och måldomäner, vilket gör överföringen av kunskap mer effektiv.

Denna metodik, där flera tekniker samverkar, öppnar vägen för att övervinna några av de största utmaningarna inom rymdteknologi och fjärrsensing, och gör det möjligt att använda data på ett mycket mer effektivt sätt, utan att behöva omfattande märkning av data från varje plattform.

Hur påverkar projektionstekniker och uppmärksamhetsmekanismer detektering av läckage i stor-skala punktmoln?

I det här avsnittet undersöks en banbrytande metod för detektering av läckage i stora punktmoln, som används inom inspektion av infrastruktur för rymdindustrin. Den presenterade metoden bygger på en projektionsteknik som omvandlar oorganiserade 3D-punktmoln till strukturerade 2D-representationer, vilket gör det möjligt att effektivisera bearbetningen och förbättra noggrannheten i detektion av läckage. Denna metod kombinerar en specialutvecklad algoritm för cirkelprojektion och en U-Net-baserad segmenteringsarkitektur som förstärks av dubbla uppmärksamhetsmekanismer och pixel-viktad kors-entropiförlust.

Projektionstekniken är särskilt viktig eftersom den omvandlar den annars mycket komplexa och tidskrävande 3D-segmenteringen till ett 2D-problem som kan behandlas mycket effektivare med konvolutionsnätverk (CNN). Detta gör att metoden kan uppnå dramatiska förbättringar i bearbetningshastighet, från 0.823–4.272 sekunder per miljon punkter för vanliga 3D-metoder, till bara 0.0124 sekunder per miljon punkter i det föreslagna tillvägagångssättet. Denna effektiva bearbetning möjliggör realtidsinspektion av stora infrastrukturer trots den enorma mängden data som punktmoln ofta omfattar.

För att ytterligare öka noggrannheten vid detektering av läckage infördes dubbla uppmärksamhetsmekanismer, vilka selektivt fokuserar beräkningsresurser på de mest informativa delarna av punktmolnet. Detta gör det möjligt att identifiera subtila läckagemönster inom komplexa strukturer som annars skulle vara svåra att upptäcka. Genom att ge särskild vikt åt de mest relevanta regionerna kan modellen bättre hantera små klasser, som läckage, som annars riskerar att förlora i globalt representerade data.

Förutom de tekniska innovationerna visade experimenten att metoden inte bara förbättrade precisionen utan också hanterade problem med klassobalans. I infrastrukturen för rymdindustrin är läckage en mycket liten del av den totala datamängden, och traditionella metoder riskerar att förbise dessa sällsynta händelser. Genom att använda en pixel-viktad kors-entropiförlust kan modellen balansera prestandan mellan olika komponenter, vilket gör det möjligt att detektera läckage med högre precision även i fall där det förekommer väldigt sparsamt.

Modellens förmåga att övervinna geometriska komplexiteter är också en stor fördel. Komponenter som stödkonstruktioner och korsningar har ofta svårare att segmenteras korrekt, dels på grund av de mer komplicerade formerna och dels för att det finns potentiella skuggningseffekter som kan skapa problem vid projektion av punktmoln. Trots dessa svårigheter visade modellen god prestanda och gav konsekventa resultat för de flesta infrastrukturella komponenter.

En annan betydande fördel med den föreslagna metoden är den förbättrade beräkningshastigheten. Medan vanliga 3D-segmenteringsmetoder kan ta upp till flera sekunder per miljon punkter, kräver den projektionbaserade metoden endast en bråkdel av den tiden. Denna hastighetsökning är avgörande för att möjliggöra effektiv inspektion av stora infrastrukturer, särskilt i rymdindustrin där snabbt agerande kan vara kritiskt för att identifiera och åtgärda potentiella problem innan de blir allvarliga.

Det är också värt att notera att genom att omvandla 3D-punktmoln till 2D kan modellen dra nytta av mer optimerade konvolutionsnätverksoperationer, vilket ytterligare accelererar processer som skulle vara mycket mer resurskrävande om de behandlades direkt i 3D. Detta skapar en tydlig fördel när det gäller skalbarhet, där man inte bara behåller precisionen utan även når en massiv prestandaförbättring.

En viktig aspekt av den föreslagna metoden är också att den är byggd för att kunna utvidgas. För framtida tillämpningar kan denna teknik anpassas för att hantera ännu mer komplexa, icke-cylindriska geometriska former och integrera tidsmässig information från upprepade skanningar för att identifiera förändrade läckagemönster över tid. En annan möjlighet är att kombinera punktmolnsdata med termiska eller hyperspektrala bilder för att skapa ännu mer robusta lösningar för inspektion av infrastruktur.

Det som gör denna metod så betydelsefull för rymdindustrin är inte bara de tekniska framstegen i hur punktmoln hanteras, utan också de operationella fördelarna som den medför. Genom att minska behovet av manuell inspektion och samtidigt förbättra detektionsnoga är det möjligt att öka både säkerhet och operativ effektivitet för markbaserade rymdanläggningar. Detta är särskilt relevant för infrastruktur som stödjer rymdutforskning och satellitoperationer, där driftsavbrott eller säkerhetsincidenter kan få långtgående konsekvenser.

Med den här metoden skapas nya möjligheter för att inte bara förbättra inspektioner av rymdinfrastruktur utan även för att ta itu med andra tekniska utmaningar inom automatiserad detektering och övervakning av komplexa strukturer.