Inom objektidentifiering och detektion på planetariska ytor har metoder för att hantera skillnader mellan domäner, eller så kallad domänanpassning, blivit avgörande. Traditionellt har dessa metoder förlitat sig på övervakad inlärning, men en effektiv lösning för att hantera begränsad märkdata är genom obevakade modeller, som kan identifiera objekt utan att behöva omfattande träning på måldata. Ett framträdande tillvägagångssätt för att uppnå detta är genom att kombinera domänrandomisering med själv-lärande och orsaksinformationsbaserad funktionmatchning.

En strategi som har visat sig effektiv för att överbrygga gapet mellan olika datamängder är den så kallade domänrandomiseringen. Denna metod handlar om att skapa syntetiska variationer av källa-domaindata för att täcka ett brett spektrum av möjliga utseenden. Målet är att träna modeller på dessa syntetiska domäner, med förhoppningen att måldomänen ska framstå som ännu en variation inom den inlärda fördelningen. Huang et al. [22] använde denna metod för att randomisera bilder i frekvensrummet och bevara domäninvariant funktionalitet medan de randomiserade domänspecifika egenskaper. På samma sätt introducerade Li et al. [34] en metod för att störa bildens funktionella inbäddningar med Gaussisk brus för att förstärka det obevakade modellens prestanda. Deras experiment visade att denna till synes enkla metod ändå gav konkurrenskraftiga detektionsresultat.

Men för kraterdetektion, särskilt på olika planetariska kroppar, finns det en särskild utmaning. Bildstilarna på olika kraterdataset är ofta liknande, men formen och projektionen av kratrarna varierar markant. Detta kräver en specifik strategi som inte enbart baseras på stilöverföring. För detta ändamål har vi utvecklat en modifierad obevakad djupinlärningsram som kombinerar domänrandomisering med orsaksinformationsbaserad funktionmatchning och histogrammatchning, vilket ger konkurrensdugliga resultat även med begränsad data och minimal behov av märkning.

En innovativ lösning som vi föreslår är CraterNet, ett omfattande system för att detektera och lokalisera kratrar på olika planetariska kroppar med minimal användning av måldomänens märkdata. Systemet består av tre huvudsakliga komponenter: en VFNet-baserad detektor med anpassade förlustfunktioner för övervakad inlärning på källa-domaindata, en domänanpassningsmodul som kombinerar domänrandomisering med histogrammatchning och orsaksinformationsbaserad funktionmatchning, samt en kraterlokaliseringsmetod för att exakt identifiera kraterns positioner och dimensioner.

VFNet, som används som grundarkitektur för detektering, har visat sig vara överlägsen i täta objektidentifieringsuppgifter. En viktig egenskap hos VFNet är införandet av en IoU-baserad klassifikationspoäng (IACS) som fungerar som en gemensam representation för objektets närvaro och lokaliseringsnoggrannhet. För att förbättra prestandan specifikt för krateridentifiering har vi modifierat VFNet:s förlustfunktioner genom att inkludera en Generalized IoU (GIoU)-förlust som förbättrar utvärderingen av överlapp mellan de förutspådda och faktiska gränsbokserna. Dessutom, för att adressera den specifika kraterformen som ofta är cirkulär, inför vi en specialiserad "fyrkantig förlust" som uppmuntrar modellen att bibehålla rätt aspektförhållanden för kraterdetekteringar.

Den domänanpassningsstrategi som används i vårt system kombinerar domänrandomisering med histogrammatchning och orsaksinformationsbaserad funktionmatchning. Genom att tillämpa homograftyrometriska transformationer på källa-domaindata kan modellen lära sig domäninvarianta funktioner samtidigt som den anpassar sig till skillnader i synvinkel och belysning mellan olika planetariska kroppar. Histogrammatchning används för att minska skillnader i pixelintensiteter och justera belysningsvariationer mellan bilder från olika källor.

Slutligen används orsaksinformationsbaserad funktionmatchning (CIFM) för att ytterligare förbättra den interna representationsinlärningen och för att noggrant hantera de komplexa relationerna mellan olika funktioner i bilder från olika domäner.

Förutom själva den tekniska lösningen är det också viktigt att förstå att när man arbetar med obevakade inlärningsmodeller på planetariska data, handlar mycket av framgången om att hitta rätt balans mellan syntetiska och verkliga data. Med begränsade märkdata från målplaneter måste modellen vara flexibel nog att generalisera från de syntetiska domäner som skapas under träning och samtidigt bibehålla hög noggrannhet vid detektion på verkliga, obevakade bilder. Detta kan innebära att man måste lägga särskild vikt vid att noggrant välja transformationsmetoder för att säkerställa att den syntetiska data som används för träningssyften återspeglar de faktiska förhållandena på målplaneterna så nära som möjligt.

Hur kan obevakad visuell intelligens förändra satelliternas perceptionssystem?

Vad framträder är inte enbart en samling tekniska lösningar, utan en grundläggande omdefiniering av perceptionssystem inom rymdteknik. Genom att frikoppla visuell intelligens från mänsklig övervakning och noggrant sammanställda dataset möjliggör vi rymdfarkoster som ser genom kosmiska strålningsstormar lika tydligt som genom morgondimma, som känner igen övergivna satelliter lika lätt som fabriksnya komponenter och som upprätthåller perceptionskontinuitet från månens omloppsbana till motorprovställningar. Detta är löftet och kravet från obevakad vision – inte ett inkrementellt förbättring, utan en kvantumtransformation i hur rymdsystem uppfattar, tolkar och navigerar sina miljöer.

En kritisk aspekt av rymdsystemens visuella intelligens är hur de hanterar de mekaniska resonanser och strukturella böjningar som orsakar att satelliter får vad som kallas "attitydskakningar". Dessa små vibrationer påverkar bildkvaliteten och skapar periodiska geometriska förvrängningar, vilket är ett stort hinder för satelliters förmåga att ta exakta bilder vid jordobservation. Specifikt uppstår dessa vibrationer när satellitens flexibla delar, som solpaneler och antenner, interagerar med ombordstyrsystem och rymdens termiska gradienter. Vibrationerna stämmer inte överens med den noggranna samordning som krävs för att hålla sensorerna på en strikt linjär väg, vilket är avgörande för pushbroom-kamerateknikens funktion.

Den senaste utvecklingen inom beräkningsbildbehandling möjliggör en omvänd konstruktion av dessa förvrängningsmönster för att kvantifiera plattformens instabilitet. Genom att analysera rumsliga och frekvensmässiga egenskaper hos bildförvrängningarna kan ingenjörer inte bara uppskatta verkliga jitterparametrar utan också fastställa kausala samband mellan specifika strukturella lägen och observerade artefakter. Det är detta paradigmskifte som gör att bilddata kan omvandlas till ett diagnostiskt verktyg för att optimera satellitdesignen – genom att identifiera vibrerande komponenter, verifiera dämpningssystemens effektivitet och informera om strukturella beslut för framtida uppdrag.

I ett exempel på hur denna teknik fungerar, genom att analysera vibrationernas spektrala signaturer, kan dessa osynliga rörelser i själva verket ge information om hur satellitens struktur fungerar under olika belastningar och påverkan. Det är detta djupgående samband mellan mekanik och bildbehandling som gör att vi nu kan förbättra satellitens noggrannhet till subpixelnivå. Tekniker som baseras på djupinlärning – särskilt konvolutionsnätverk (CNN) – har visat sig vara extremt effektiva i att ta fram data utan att behöva specifika fysiska modeller av plattformens dynamik.

I hjärtat av denna teknik finns förmågan att bearbeta råa sensordata utan att explicit behöva förstå de fysiska lagarna för plattformens rörelse. Genom hierarkisk funktionell inlärning, där djupa nätverk kan identifiera förvrängningar som orsakats av plattformen från det faktiska bildinnehållet, uppnår vi en stor förbättring för äldre system som inte har de senaste jitter-sensorerna. Dessutom har forskare anpassat dessa djupinlärningsarkitekturer för att kunna uppskatta subpixel geometriska förvrängningar genom att lära sig de inneboende relationerna mellan sekventiella skanningslinjer. Detta gör att gamla bilder kan restaureras, vilket gör det möjligt att återställa historisk satellitdata med hjälp av beräkningsmetoder.

Vidare har nyare arkitekturer gått ett steg längre och integrerat tidsmodellering via återkommande kopplingar, vilket gör det möjligt att följa jittermönster genom längre bildsekvenser. Detta, i kombination med multimodala nätverk som samlar in både optiska data och hjälpmedel från andra sensorer, visar stor potential för realtidskompensation av jitterproblem.

En annan aspekt som är central för att säkerställa exakt rymdfarkostorientering är användningen av stjärnspårare, som är optiska instrument som beräknar satellitens attityd genom att jämföra observerade stjärnpositioner mot astronomiska databasvärden. Om strukturella vibrationer påverkar bildkvaliteten från dessa stjärnspårare, kan det förvränga både stjärnornas placering och intensitetsfördelningar, vilket skadar noggrannheten i attitydberäkningarna. Genom att tillämpa beräkningsastronomi och skapa syntetiska stjärnmönster som simulerar vibrationer, kan avancerade algoritmer känna igen och korrigera dessa förvrängningar, vilket återställer den precision som krävs för exakt navigering. Detta ger en extra dimension till stjärnspårarens funktionalitet, vilket gör den både användbar för att bestämma attityd och för att övervaka stabiliteten hos plattformen under uppdraget.

Denna metod, genom att använda dessa optiska artefakter som en extra informationskälla, öppnar nya vägar för att förstå och justera försvagade sensorer utan att behöva använda specialiserade hårdvarulösningar.

När denna teknologi fortsätter att utvecklas, kommer dess förmåga att behandla och förbättra bild- och navigeringsprecisionen att spela en avgörande roll i framtida satellit- och rymduppdrag. Genom att integrera avancerade bildbehandlingsmetoder och maskininlärning i själva konstruktionen och designen av rymdsystem, skapar vi grundvalarna för ett nytt paradigm inom rymdteknik, där datadrivna lösningar inte bara förbättrar men omdefinierar hur vi interagerar med vårt universum.

Hur kan vi förbättra detektion av ytfel i flygkomponenter genom obevakad domänanpassning?

För att effektivt kunna upptäcka ytfel på komponenter inom flygindustrin, särskilt i sammanhang där annoterade data är begränsade, krävs det att man går bortom traditionella metoder för överföring av lärande. Den framgångsrika användningen av obevakad domänanpassning (MSDA – Multistep Domain Adaptation) i detta sammanhang har visat sig vara en effektiv lösning. Genom att använda flera anpassningssteg, inklusive själv-lärande och progressiv histogram-matchning, har vi lyckats minska skillnaderna mellan olika domäner utan att behöva specifika manuella annoteringar för varje målbild.

Vår metod har visat på en imponerande förbättring av detektionens precision. Från en initial Average Precision (AP) på 0.103 utan anpassning, har vårt ramverk förbättrat detta till 0.861 – en ökning med över 700%. Detta resultat ligger nära de bästa resultaten som uppnås genom övervakat lärande, vilket innebär att vi har lyckats uppnå nästan samma resultat utan att använda etiketter för mål-datasetet. Denna prestation visar att vår ansats inte bara är effektiv i praktiska tillämpningar, utan också mycket mer kostnadseffektiv, särskilt i miljöer där annotering är en dyr och tidskrävande process.

En av de största utmaningarna i detta sammanhang är det stora avståndet mellan domäner, särskilt mellan olika typer av defekter och bildförhållanden. I flygindustrin är fel på komponenter ofta av olika slag och kan även förekomma under olika bildbehandlingsförhållanden. Direkt domänanpassning, som bygger på att överföra kunskap mellan domäner som är nära varandra, har visat sig vara otillräcklig när skillnaderna är stora, som vi har sett med de högsta MMD-värdena (Maximum Mean Discrepancy) mellan de olika dataset som användes. Genom att introducera ett mellandomän, där kunskap kan överföras gradvis, har vårt system på ett effektivt sätt minskat dessa avstånd och därmed förbättrat detektionens precision.

I vårt system kombineras flera tekniker för att maximera effektiviteten i detektionsprocessen. Förutom den progressiva histogram-matchningen använder vi själv-attention för att förbättra modellens kapacitet att fokusera på viktiga detaljer i bilderna, och flera steg av själv-lärande för att successivt förbättra resultatet. Dessa tekniker har visat sig vara avgörande för att uppnå högre noggrannhet i domänanpassningen. Själv-lärande har lett till en ökning av F1-poängen från 0.211 till 0.842, vilket är ett bevis på den totala förbättringen i systemets kapacitet att korrekt klassificera defekter.

När vi jämförde vår metod med andra nuvarande metoder för överföring av lärande, som ADDA och FPN transfer, visade det sig att våra resultat överträffade dessa metoder på alla viktiga metrikvärden. Detta är särskilt anmärkningsvärt med tanke på att många av dessa metoder bygger på teoretiskt eleganta tekniker men misslyckas när det gäller att hantera stora domänskillnader med begränsade data. Vår strategi, som fokuserar på att gradvis anpassa domäner, har visat sig vara betydligt mer effektiv.

Det är också viktigt att förstå att framstegen inom obevakad domänanpassning inte bara handlar om att förbättra resultatet på det aktuella problemet, utan också om att göra systemet mer robust och användbart i praktiken. I miljöer som de inom flygindustrin, där data är sällsynta och varje inspektion är kritisk, ger denna metod möjlighet till effektivare och snabbare inspektioner utan att behöva massor av märkta exempel från varje tänkbar situation. Det innebär att när nya typer av defekter eller nya bildförhållanden dyker upp, kan systemet fortfarande anpassa sig och ge noggranna resultat utan behovet av stora mängder manuellt arbete.

Förutom dessa tekniska aspekter är det också viktigt att belysa de bredare konsekvenserna för säkerheten och driftseffektiviteten inom flygsystemen. När automatiserad inspektion kan genomföras med hög precision och utan att vara beroende av annoterade data, kan säkerhetsnivåerna förbättras dramatiskt, och driftstopp kan minimeras. Detta öppnar dörrar för användning av denna typ av teknologi inom fler och mer varierande sammanhang, som till exempel rymdteknik, där data är än mer begränsad och där behovet av pålitlig felupptäckt är ännu större.

Framtida forskning kan fördjupa sig i ytterligare tillämpningar av denna teknik, såsom integrationen av tidsberoende information från videosignaler och utforskning av fler modaliteter för sensorer bortom visuell bildbehandling. Genom att applicera dessa principer på andra områden som termiska avvikelser, vibrationsanalyser eller akustiska emissionsövervakningar kan vi förvänta oss liknande framsteg inom andra kritiska system.