Vetenskaplig metod bygger på förmågan att skilja på kausalitet och association. En viktig aspekt av denna förmåga är att förstå hur olika typer av samband kan felaktigt tolkas genom missanpassade statistiska metoder. Ett vanligt problem uppstår när ekonometriska procedurer inte tar hänsyn till alla bakomliggande faktorer, vilket leder till spuriösa resultat. Detta kan ske särskilt

Hur Do-Calculus och Kausala Modeller Förbättrar Förståelsen av Orsakssamband i Ekonomiska och Statistiska Modeller

Inom den moderna statistiken och kausal analys används olika metoder för att koppla ihop observationer och orsaker. Traditionella statistiska metoder tenderar att behandla variabler och specifikationer tillsammans, vilket kan leda till förvrängda resultat när man försöker fastställa orsakssamband. En annan och mer sofistikerad metod är att separera variabelsökningen från specifikationssökningen. Exempel på sådana metoder inkluderar medelminskningsnoggrannhet, lokala surrogatmodeller och Shapley-värden (López de Prado 2020, s. 3–4, López de Prado 2022a). Dessa metoder skapar en tydligare förståelse av variabler som faktiskt har en relevant inverkan på ett fenomen och gör det möjligt för forskare att använda kausala upptäcktsmetoder för att föreslå en kausal struktur, där man identifierar både samband mellan variabler och riktning på de kausala pilarna.

En central aspekt för att förstå och tillämpa kausala modeller är Do-calculus, ett komplett axiomatiskt system utvecklat för att möjliggöra uppskattningar av "do"-operatorer genom hjälp av villkorliga sannolikheter. För att kunna använda Do-calculus effektivt krävs kännedom om de nödvändiga och tillräckliga konditioneringsvariablerna, som man kan identifiera med hjälp av en kausal graf (Shpitser och Pearl 2006). Denna metod har en viktig fördel: den gör det möjligt att isolera effekten av en variabel, exempelvis genom att räkna bort alla inblandade störande faktorer och variabler som inte påverkar resultatet.

I praktiken handlar Do-calculus om att förstå och tillämpa olika typer av blockerade vägar i kausala grafer. Ett exempel på en kausal graf är en graf med tre variabler, där Z är en förväxlare i samband med X och Y, när de kausala relationerna ser ut som X ← Z → Y. En sådan struktur innebär att Z fungerar som en förväxlare, där både X och Y påverkas av Z. I en annan situation kan Z vara en mediator, där en orsak X går genom Z för att påverka Y, exempelvis X → Z → Y. Det finns också kolidatorer (s.k. colliders), där både X och Y påverkar Z, vilket skapar en komplicerad dynamik som behöver hanteras korrekt för att förhindra snedvridna slutsatser.

För att upprätthålla kausala associationer krävs det att man förstår hur man blockerar irrelevanta vägar i dessa grafer. En väg mellan två variabler X och Y blockeras om någon av de följande två villkoren gäller: (1) vägen går genom en kollidator, och forskaren har inte konditionerat på den eller dess ättlingar; eller (2) forskaren har konditionerat på en variabel i vägen mellan X och Y, och denna variabel är inte en kollidator. Detta är en viktig aspekt att förstå för att kunna särskilja kausala effekter från andra typer av statistiska associationer.

Kausala associationer flödar längs alla vägar mellan X och Y som inte är blockerade, där den riktiga kausala vägen är den som går genom den kausala relationen, t.ex. X → Y. Det är en fundamental förståelse för varför statistisk association inte alltid innebär kausalitet, och varför kausal oberoende inte innebär statistisk oberoende. Ett exempel på detta är att två variabler X och Y är d-separerade (det vill säga oberoende givet en uppsättning av variabler S) om alla vägar mellan X och Y blockeras genom konditionering på S.

En viktig aspekt i kausal analys är att identifiera tillräckliga justeringsuppsättningar, som gör det möjligt att isolera den kausala effekten mellan X och Y. Tre vanliga metoder för att justera för förväxlare är: (a) backdoor-justering, (b) front-door-justering och (c) användning av instrumentvariabler (Pearl 2009). Var och en av dessa metoder erbjuder specifika fördelar beroende på den kausala grafens struktur.

Backdoor-justeringen är användbar när man kontrollerar för observerbara förväxlare. En backdoor-väg är en icke-kausal väg mellan X och Y, som kan blockeras genom att konditionera på en uppsättning variabler som uppfyller backdoor-kriteriet. Det innebär att för att kunna dra en korrekt slutsats om kausaliteten mellan X och Y, måste alla irrelevanta vägar mellan dem stängas av. Ett praktiskt exempel på detta är en graf där Y ← Z → X representerar en backdoor-väg, och X → Y en kausal väg. Genom att konditionera på Z kan man blockera backdoor-vägen, vilket gör att endast den kausala vägen återstår.

Front-door-justering är användbar när forskaren inte kan konditionera på en variabel som uppfyller backdoor-kriteriet, exempelvis när den är latent (ej observerbar). Front-door-kriteriet gör det möjligt att uppskatta den kausala effekten genom en mediator, förutsatt att vissa villkor är uppfyllda. För att front-door-justeringen ska vara giltig måste alla kausala vägar från X till Y gå genom en mediator S, och det måste inte finnas någon backdoor-väg mellan X och S eller mellan S och Y. Detta skapar en mekanism där den kausala effekten kan uppskattas på ett robust sätt, även i närvaro av latenta förväxlare.

Slutligen, när ingen mediator finns, kan användning av instrumentvariabler vara ett kraftfullt sätt att kontrollera för latenta förväxlare. För att kunna använda denna metod framgångsrikt måste man kunna identifiera en variabel som är relaterad till den oberoende variabeln X, men inte direkt påverkar Y, förutom genom X.

För att tillämpa dessa metoder effektivt i ekonomiska och statistiska modeller, måste forskaren ha en djup förståelse för både de tekniska aspekterna av kausal grafteori och de praktiska tillämpningarna av dessa metoder för att kunna analysera komplexa system. Det är också avgörande att kontinuerligt validera de använda modellerna genom att noggrant undersöka de antaganden som ligger till grund för dem.