ARIMA-modeller (AutoRegressive Integrated Moving Average) er et effektivt værktøj til analyse og forudsigelse af tidsseriedata, hvor både trends og sæsonvariationer spiller en rolle. ARIMA-modellen kombinerer tre vigtige elementer: autoregression (AR), integration (I) og glidende gennemsnit (MA). Den anvendes ofte, når data viser en kompleks struktur, der kan fanges af disse komponenter.
I SAS kan en ARIMA-model oprettes ved hjælp af PROC ARIMA. For eksempel kan vi starte med at analysere et datasæt, hvor priser over tid er observeret månedligt. Dette kan implementeres i SAS som følger:
Denne initiale analyse giver et første kig på datasættet, hvor vi kan observere autokorrelationen ved forskellige lag. Autokorrelationen hjælper os med at bestemme de optimale parametre for modellen. I vores eksempel er der stærk autokorrelation for P=1 og svag autokorrelation for P=2, hvilket betyder, at vi bør starte med ARIMA(2,2,12), som indeholder både en autoregressiv og en glidende gennemsnitskomponent, samt en sæsonfaktor på 12 for månedlige data.
Når modellen køres, får vi output, der viser både statistik og autokorrelationer. For eksempel er de første parameterestimater:
-
P = 2
-
D = 2
-
Q = 12
Disse parametre afspejler den dybde, som ARIMA-modellen bruger til at fange strukturen i dataene, herunder trenden, sæsonvariationen og de kortsigtede afhængigheder i serien. I dette tilfælde indikerer den oprindelige ARIMA-model en AIC (Akaike Information Criterion) på 3254.5, hvilket giver en indikator for modellens kvalitet. AIC bruges til at vælge den model, der bedst balancerer godhed ved tilpasning og kompleksitet, hvor en lavere AIC værdi indikerer en bedre model.
SAS giver også mulighed for at estimere parametrene yderligere, så vi kan undersøge residualerne for at validere, om modellen fanger alle relevante mønstre i dataene. Dette er vigtigt, da en god model ikke kun skal kunne forudsige data, men også fange de resterende uforudsigelige komponenter, som residualerne udtrykker.
Når vi sammenligner denne proces med R, finder vi, at R tilbyder flere funktioner, der også kan analysere ARIMA-modeller. Her anvender vi pakkerne forecast, xts og tseries, som giver mulighed for at installere, analysere og plotte data. Når vi bruger R til at implementere ARIMA-modellen, kan vi bruge følgende kode:
Denne kode indlæser et datasæt og skaber en tidsserie med månedlige data. For at analysere stationariteten af datasættet anvender vi Dickey-Fuller-testen, som viser, om serien er stationær eller ej. Hvis serien ikke er stationær, kan vi anvende differensiering til at gøre serien stationær, hvilket er nødvendigt for at anvende ARIMA korrekt. Her kan vi se, at en differensiering af 2 (D=2) giver bedre resultater.
En vigtig forskel mellem SAS og R er, at R giver en større fleksibilitet til at bruge maskinlæringsteknikker til at bestemme de optimale værdier for P, D og Q. For eksempel kan R anvende automatisk modellering til at finde den bedste kombination af parametre baseret på de observerede data. Ved at køre:
kan vi identificere, hvilke lag af autokorrelationen der er relevante at overveje. Denne analyse kan derefter hjælpe med at vælge de bedste parametre for ARIMA-modellen. I vores tilfælde viser analysen, at P=2 og Q=4 er de optimale værdier, hvilket afspejler en god balance mellem modelkompleksitet og præcision.
Efter at have anvendt differensiering og de passende autokorrelationslagsværdier, kan vi køre ARIMA-modellen med de bestemte parametre:
Outputtet giver os koefficienterne for AR- og MA-komponenterne samt AIC-værdien for den model, vi har oprettet.
Det er vigtigt at forstå, at valg af parametre til ARIMA-modellen ikke er en simpel proces, og det kræver en grundig undersøgelse af datasættet og de underliggende mønstre. Analyser som autokorrelation, sæsonvariation, og stationaritet skal tages i betragtning, når man bygger en model. For at opnå en præcis forudsigelse bør man også være opmærksom på residualerne, som giver indsigt i, om modellen er tilstrækkelig til at beskrive alle relevante mønstre i dataene.
Det er også nødvendigt at overveje, at ARIMA-modeller kun er egnede til tidsseriedata, der er stationære, eller som kan gøres stationære ved differensiering. Hvis dataene viser ekstreme ikke-stationære mønstre, som f.eks. pludselige ændringer eller trends, kan det være nødvendigt at anvende andre modeller eller metoder.
Hvordan måler og håndterer vi naturrelaterede risici og systemisk risiko?
Naturkatastrofer kan have vidtrækkende konsekvenser for både menneskeliv og økonomi, hvilket gør det nødvendigt at forberede sig og minimere deres indvirkning. Naturvidenskabelige perspektiver kan bidrage til at forudse katastrofer, og der er flere måder at vurdere risikoen for sådanne begivenheder på. Der findes flere internationale indekser, som arbejder på at kvantificere og kommunikere risikoen ved naturkatastrofer, især med hensyn til klimaændringer. INFORM Indekset, udviklet af EU’s Joint Research Center, vurderer risiciene baseret på dimensioner som fare, eksponering, sårbarhed og kapacitet til at håndtere katastrofer. Lignende indekser som WorldRiskIndex og Global Climate Risk Index ser på eksponering for fysiske farer og samfundsmæssig sårbarhed. Notre Dame Global Adaptation Index fokuserer på landes evne til at tilpasse sig klimaforandringer og opbygge modstandskraft.
Når risici først er identificeret, er det nødvendigt at udvikle strategier til at håndtere dem. Risikostyring på makroniveau handler om at forudsige sjældne begivenheder og investere i systemer, der kan håndtere ekstreme hændelser. Et centralt element i risikostyring er udviklingen af modstandsdygtige systemer, som gør det muligt at forberede sig på og reagere på katastrofer. Den amerikanske Resilient America Roundtable har arbejdet på at hjælpe beslutningstagere med at bygge sådanne modstandsdygtige systemer, og anbefalingen har været at kommunikere og dele viden om risici, samt at bygge partnerskaber mellem offentlige, private og akademiske aktører. Eksempler som de pilotstudier, der blev udført i Charleston, South Carolina, og Cedar Rapids, Iowa, har vist, hvordan man kan måle og forbedre modstandskraften mod oversvømmelser ved at identificere både de fysiske og sociale ressourcer i samfundene.
Derudover er det vigtigt at forstå, at det ikke kun er de naturlige katastrofer, der udgør risici. Menneskelige handlinger, der er målrettede og skadelige, såsom terrorisme, kriminelle handlinger og cyberangreb, udgør en betydelig trussel for samfundet. Terrorisme og krig har været en del af menneskets historie i århundreder, men med den moderne teknologi er nye former for trusler opstået, såsom cyberterrorisme og identitetstyveri. Virksomheder og regeringer arbejder på at udvikle modforholdsregler og reaktioner, der kan minimere virkningerne af sådanne begivenheder.
En tredje type risiko, der har fået stor opmærksomhed, er systemisk risiko. Denne form for risiko opstår, når de forskellige elementer i et system er tæt forbundet, og en ændring i én del kan forårsage en kædereaktion, der påvirker hele systemet. I finanssektoren er systemisk risiko blevet undersøgt i stor udstrækning, hvor et banksystem kan kollapsere som følge af én banks konkurs. På samme måde kan forsyningskæder og elnet være sårbare overfor systemisk risiko, hvis en del af systemet fejler, og forårsager store konsekvenser for resten af systemet.
Systemiske risici kræver ofte sofistikerede modeller og forståelse af både de statiske og dynamiske strukturer, der udgør disse systemer. Agentbaserede modeller og spilteori bruges til at analysere, hvordan disse risici opstår, og hvordan de kan håndteres. Det er en udfordring at forudsige, hvordan komplekse systemer vil reagere på ændringer, men ved at forstå, hvordan de forskellige elementer interagerer og tilpasser sig, kan man muligvis forudse og kontrollere risikoen bedre. I forbindelse med systemiske risici har forsikring været en traditionel metode til at håndtere risici, og den fungerer godt for almindelige begivenheder som bilulykker. Men når det gælder mere komplekse systemer, som f.eks. finansielle markeder eller forsyningskæder, er det nødvendigt at udvikle mere komplekse og dynamiske modeller.
Det er også væsentligt at erkende, at risikostyring ikke kun handler om at forudse og håndtere katastrofer, men også om at bygge modstandsdygtige systemer, der kan tilpasse sig ændringer og komme sig hurtigt efter en hændelse. I denne sammenhæng spiller både menneskelig opfindsomhed og teknologi en central rolle. Mens naturkatastrofer og systemisk risiko er forudsigelige i visse aspekter, er det menneskelige element stadig en uberegnelig faktor, som kan føre til uventede konsekvenser. Derfor er det vigtigt ikke blot at være forberedt på risici, men også at investere i forskning og udvikling af bedre måder at måle og styre disse risici på.
Hvordan balancerede datasæt forbedrer prædiktiv nøjagtighed i svindelregistrering
Inden for risikostyring og forudsigende analyser anvendes klassifikationsmodeller til at forudsige binære udfald, som i tilfældet med svindelregistrering, hvor vi forsøger at identificere om en transaktion er svindel eller ej. Denne opgave bliver kompleks på grund af den naturlige ubalance i dataene, da svindeltransaktioner ofte udgør en meget lille andel af den samlede mængde transaktioner. Derfor er det nødvendigt at balancere datasættet for at sikre, at modellerne ikke skævvrides mod flertallet (de ikke-svindeltransaktioner).
I denne sammenhæng er over-/under-sampling en vigtig metode til at skabe balancerede datasæt, hvor begge klasser – svindel og ikke-svindel – er mere lige repræsenteret. Dette kan gøres ved at tilføje flere eksempler på svindeltransaktioner (over-sampling) eller reducere antallet af ikke-svindeltransaktioner (under-sampling). Resultaterne af sådanne balancerede datasæt viser sig ofte i højere præcision og recall-værdier, som er essentielle i svindelregistrering.
Når vi anvender en klassifikationsmodel som en beslutningstræmodel på et balanceret datasæt, kan vi opnå præcise målinger af modelens ydeevne. For eksempel viser den relaterede figur 8.6, hvor arealet under kurven (AUC) er beregnet for logistisk regression med balancerede data, at modellen præsterer bedre med en AUC-værdi, der er tættere på 1. Dette indikerer en høj evne til at skelne mellem de to klasser, dvs. svindel og ikke-svindel.
Når vi ser på en beslutningstræmodel, der er trænet på et balanceret datasæt, er den mere præcis i sin evne til at forudsige svindeltransaktioner. Dette ses tydeligt i forvirringsmatricen, som viser, at modellen korrekt identificerer langt størstedelen af de faktiske svindeltransaktioner med en høj recall-værdi på 0.9973, som angiver, at modellen næsten ikke overser nogen svindeltransaktioner. Samtidig er præcisionen på 0.9411, hvilket betyder, at når modellen forudsiger svindel, er der en høj sandsynlighed for, at det faktisk er en svindeltransaktion.
En anden vigtig måling er den gennemsnitlige nøjagtighed (Balanced Accuracy), som for beslutningstræmodellen er 0.9677. Dette viser, at modellen har en balanceret præstation på tværs af både klasserne, og at den ikke er overvejende skæv mod den ikke-svindel klasse.
Det er også vigtigt at forstå de grundlæggende præstationsmål i klassifikationsmodeller:
-
Præcision: Hvor ofte modellen korrekt forudsiger en svindeltransaktion (true positives / (true positives + false positives)).
-
Recall: Hvor ofte modellen identificerer en svindeltransaktion, når den er til stede (true positives / (true positives + false negatives)).
-
Nøjagtighed (Accuracy): Hvor ofte modellen korrekt forudsiger både svindel og ikke-svindel transaktioner i alt (correct predictions / total predictions).
Balanceringen af datasættet og den tilhørende modeltræning bidrager dermed ikke kun til at opnå en højere præcision og recall, men også til at sikre, at modellen ikke er biased mod flertalsklassen, hvilket er afgørende i tilfælde som svindelregistrering, hvor den ulige fordeling af klasserne kunne føre til, at modeller overser de svindeltransaktioner, der er svære at fange.
En yderligere faktor at overveje er betydningen af variabelvigtighed i beslutningstræmodellen. Som det fremgår af figur 8.9, kan variabler som RatioMedian og DistanceHome vise sig at være de mest afgørende for modellens evne til at skelne mellem svindel og ikke-svindel. En forståelse af hvilke faktorer, der påvirker modellens beslutning, er vigtig, da dette kan hjælpe med at forbedre den prædiktive nøjagtighed og give indsigt i, hvilke parametre der skal overvåges tættere i fremtiden.
Modelkomparering mellem logistisk regression og beslutningstræmodeller viser, at selvom begge modeller leverer lignende resultater i forhold til recall og nøjagtighed, kan beslutningstræmodellen have en lille fordel i at skelne mellem de to klasser, hvilket gør den mere effektiv i praksis, når det kommer til at identificere svindeltransaktioner. Desuden er beslutningstræmodeller nemmere at forstå og fortolke, hvilket gør dem mere anvendelige i en praktisk kontekst, hvor det er nødvendigt at forstå, hvorfor en beslutning er blevet truffet.
For læseren er det essentielt at forstå, at svindelregistrering er et område, hvor databalancering, præcision og recall er de vigtigste faktorer for at opnå en effektiv model. Beslutningstræmodeller og logistisk regression er to af de mest anvendte teknikker, men valget af model og træningsmetode afhænger i høj grad af de specifikke krav og den tilgængelige data. Det er også vigtigt at erkende, at der ikke findes én "bedste" model – snarere skal der tages hensyn til både tekniske og forretningsmæssige faktorer for at vælge den rette løsning.
Hvordan Risikohåndtering kan Reducere Systemisk Risiko og Uforudsigelighed
Risiko er en konstant og uundgåelig del af både makro- og mikroniveauer af samfundet, men forståelsen og håndteringen af den kan variere markant. På det makroøkonomiske niveau står virksomheder og regeringer over for udfordringer ved at forvalte risici, der stammer fra naturkatastrofer, kriminelle handlinger og systemisk svigt, som kan forårsage vidtrækkende konsekvenser. Denne kompleksitet bliver endnu mere udfordrende, når menneskelig beslutningstagning er involveret, hvilket gør risikoen langt mere uforudsigelig og vanskelig at forudsige.
En måde at håndtere risici på er ved hjælp af diversificering. Denne strategi spreder risikoen over flere enheder, hvilket teoretisk set kan reducere det samlede tab, hvis én enhed skulle mislykkes. Men denne tilgang er ikke altid tilstrækkelig, især når vi taler om ekstreme begivenheder som naturkatastrofer, der kan udløse kaskadeeffekter og overvælde forsikringsselskabers ressourcer. I sådanne tilfælde kan en strukturel diversificering være en mere effektiv løsning. Ved at ændre en netværks topologi for at minimere systemisk risiko kan virksomheder dele risici og lette genopretningen efter en fejlslagen hændelse. Et eksempel på denne form for risikohåndtering findes i USA’s Federal Emergency Management Agency (FEMA), som bringer både statslige og private ressourcer i spil under katastrofer.
Risikoanalyse og risikostyring i et systemisk perspektiv kræver forståelse af, hvordan forskellige aktører interagerer i et komplekst system. I et finansielt system som i 2008, da store investeringsbanker var tæt forbundne og for store til at fejle, viste sig den risikable koncentration af magt og ressourcer. Her blev diversificeringsstrategier en dobbeltkantet sværd, hvor koncentrationen af økonomisk magt i visse "for store til at fejle"-institutioner øgede systemets sårbarhed overfor chok, snarere end at mindske det.
Et vigtigt aspekt ved systemisk risiko er menneskets rolle og beslutningstagen. Når mennesker er en del af systemet, bliver risikostyringen langt mere kompleks. Usikkerhed og indeterminisme – det vil sige beslutningstagenens vilkårlighed og manglende evne til at forudsige udfald – er kilder til risiko, som ikke let kan forudses af matematiske modeller. Menneskelig valgfrihed og kollektive beslutninger gør det vanskeligt at anvende de samme metoder på systemisk risiko, som man måske bruger på mere tekniske eller naturvidenskabelige risici. For eksempel kan begreber som smittefare eller kaskadeeffekter give en misvisende forståelse af systemisk risiko ved at nedtone menneskelige aktørers indflydelse og ansvar.
På mikroniveau udviklede Abramov og Al-Zaidi (2023) risikohåndteringskriterier specifikt for byggebranchen i Irak. Selvom disse kriterier blev udviklet til et konkret formål, har de universel anvendelse på tværs af alle typer byggeprojekter. I økonomiske sammenhænge involverer risikostyring blandt andet vurdering af mulige partneres konkurs, overvågning af regeringspolitikker og udvikling af finansieringsstrategier. De organisatoriske og tekniske aspekter af risikohåndtering er lige så vigtige, som eksempelvis opretholdelse af kommunikationskanaler, sikring af overholdelse af tekniske standarder, og håndtering af udstyr og materialer. Politisk og militær risikostyring er nødvendigt i områder, hvor uforudsete hændelser kan opstå, og arbejdsmiljøsikkerhed er afgørende for at undgå ulykker og sikre arbejdernes beskyttelse.
En central pointe er, at risikostyring er langt mere kompleks end blot at implementere tekniske løsninger. For at forstå og håndtere systemisk risiko effektivt er det nødvendigt at inkludere de menneskelige elementer i systemerne. Beslutningstagning, ansvar og usikkerhed, som mennesker bringer med sig, er aspekter, der ikke kan overses. Effektiv risikohåndtering kræver en systematisk tilgang til at identificere og forstå disse elementer på både makro- og mikroniveau, samt udvikling af metoder til at håndtere dem på tværs af forskellige domæner og risikokategorier.
Når man ser på de eksisterende metoder og værktøjer, som anvendes til risikohåndtering, skal der tages højde for både de tekniske aspekter – som datainnsamling og analyse – og de menneskelige faktorer, der kan skabe uklarhed og uforudsigelighed. Virksomheder og organisationer bør derfor udvikle en helhedsorienteret strategi, som både tager højde for de tekniske systemer og de menneskelige beslutningstagningselementer, der er en del af det større risikobillede.
Jak vytvořit svůj první dokument v Photoshopu a начать работу s obrázky
Jak funguje lexikální analýza a syntaktické parsování v hlubokém učení?
Jak využít tělo k uklidnění mysli: Nástroje pro každodenní odolnost

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский