A sikeres befektetési stratégiák általában általános elméletek konkrét megvalósításai. Egy olyan befektetési stratégia, amely nem rendelkezik elméleti indoklással, valószínűleg téves lesz. Ezért a vagyongazdálkodónak inkább arra kell koncentrálnia, hogy elméleteket dolgozzon ki, mintsem hogy különféle kereskedési szabályokat próbáljon visszatesztelni. A pénzügyi piacon végzett kutatások eredményeként gyakran az a megállapítás születik, hogy a gépi tanulás (ML) nem csupán egy „fekete doboz”, amely képes megoldani minden problémát, és nem feltétlenül hajlamos a túlilleszkedésre sem. Az ML eszközei inkább kiegészítik a klasszikus statisztikai módszereket, mintsem hogy felváltanák azokat.
A gépi tanulás egyik legnagyobb előnye a mintavétel utáni predikcióra való fókuszálás, amely elkerüli azokat a hibákat, amelyeket a hagyományos statisztikai elemzés, például a mintán belüli variancia értékelése, okozhat. Ezen kívül az ML módszerek képesek elkerülni azokat a (potenciálisan irreális) feltételezéseket, amelyekre a klasszikus statisztikai módszerek gyakran építenek. Az ML eszközei képesek komplex specifikációk, nemlineáris, hierarchikus és nem-kontinuális kölcsönhatások tanulására is, különösen olyan magas dimenziós terekben, ahol a hagyományos technikák gyakran már nem alkalmazhatók.
A gépi tanulás másik nagy előnye, hogy képes szétválasztani a változók keresését a specifikációk keresésétől. Ez azzal jár, hogy az ML módszerek robusztusak a multikolliniaritás és egyéb helyettesítő hatásokkal szemben, amelyek zűrzavart okozhatnak a hagyományos statisztikai elemzések során. Az eszköztár ezen tulajdonsága kifejezetten fontos a pénzügyi adatok elemzésekor, amelyek sokszor bonyolult, kölcsönösen összefonódó hatásokat mutatnak.
A gépi tanulás nem csupán egy elméleti újítás, hanem konkrét módon képes elősegíteni a pénzügyi elméletek felfedezését is. Azonban ahhoz, hogy a gépi tanulás segítségével valódi előnyt szerezzünk a pénzügyi piacon, elengedhetetlen, hogy a vagyongazdálkodók elméleti megközelítéseket dolgozzanak ki. Egy sikeres stratégiát nem elég csupán visszatesztelni a múlt adatai alapján; szükséges egy olyan tesztelhető elmélet, amely világosan meghatározza azt az ok–okozati mechanizmust, amely lehetővé teszi a nyereség kivonását a közönség kollektív bölcsességéből.
A gépi tanulás használata a pénzügyi stratégiák kialakításában nemcsak elméleti szempontból indokolt, hanem gyakorlati szempontból is. A hagyományos statisztikai módszerek – amelyek egyszerűsített feltételezéseken alapulnak, mint például a linearitás vagy az függetlenség – már nem elegendők a mai pénzügyi rendszerek komplexitásának kezelésére. A gépi tanulás alkalmazása ezen komplexitás kezelésére szolgál, mivel képes felismerni és modellezni a nemlineáris és bonyolult kölcsönhatásokat, amelyek meghatározzák a pénzügyi piacok működését.
A gépi tanulás egy új lehetőséget kínál a pénzügyi elméletek finomítására és fejlesztésére, és nem csupán eszközként, hanem egy új megközelítési módot kínál az asset management szakemberek számára. Az ML alkalmazása segíthet olyan rejtett minták és összefüggések felismerésében, amelyek a hagyományos statisztikai módszerekkel nem lennének azonosíthatók. Mivel a pénzügyi piacon a múlt adatai nem mindig nyújtanak megbízható előrejelzéseket a jövőre vonatkozóan, a gépi tanulás képes olyan modellek kialakítására, amelyek jobban alkalmazkodnak a folyamatosan változó piaci környezethez.
A hagyományos megközelítések, amelyek a múltbeli teljesítmény visszatesztelésére építenek, önállóan nem adnak elégséges választ arra a kérdésre, hogy miért érdemes egy adott stratégiát alkalmazni a jövőben. A gépi tanulás azonban lehetőséget ad arra, hogy valódi, tesztelhető elméleteket dolgozzunk ki, amelyek szilárd tudományos alapokon nyugszanak, és képesek megmagyarázni a piaci nyereséget vagy veszteséget egy adott stratégia alkalmazása révén.
A gépi tanulás tehát nem csupán egy új technológiai eszközként jelenik meg a pénzügyi szektorban, hanem egy új elméleti megközelítésként is, amely képes új módon értelmezni a piaci adatokat, elősegítve a pénzügyi elméletek fejlődését. A jövő pénzügyi szakembereinek elengedhetetlen, hogy ezeket az új eszközöket integrálják kutatásaikba, és a gépi tanulás segítségével alakítsanak ki olyan megalapozott elméleteket, amelyek képesek választ adni a pénzügyi piacok komplex kérdéseire.
Hogyan befolyásolják a szintetikus adatok a befektetési stratégiák tesztelését?
A családi hiba arány (FWER) korrigálása biztosítja a megfelelő elutasítási küszöböt, amely alapján megvizsgálhatjuk, hogy a max{kfScRkg} statisztikailag szignifikáns-e, a Lo (2002) és Mertens (2002) által javasolt eloszlások segítségével. A kutatók ezen elemzési becsléseket felhasználhatják a statisztikai tesztek tervezésekor, hogy figyelembe vegyék a családi téves pozitív és negatív eredmények valószínűségét.
A szintetikus adatok tesztelése lehetőséget biztosít arra, hogy a kutatók olyan szimulációkat végezzenek, amelyek számos történelmi évnyi adatot helyettesítenek, így elkerülhető az egyes megfigyelt adatállományokra való túlilleszkedés. Két alapvető módszer létezik ennek az adatszintetikus generálására: az újramintavételezés és a Monte Carlo szimuláció.
Az újramintavételezés egy olyan eljárás, amely során új (nem megfigyelt) adatállományokat generálunk a meglévő megfigyelt adatokból. Az újramintavételezés lehet determinisztikus vagy véletlenszerű. A determinisztikus újramintavételezés példái közé tartozik a jackknife (egy adatpont kihagyása), a keresztvalidáció (egy egyedül hagyott adathalmaz), és a kombinatorikus keresztvalidáció (permutációs tesztek). A keresztvalidáció során a történelmi megfigyeléseket felosztják N részre, és a különböző k-hajtású tesztelőhalmazokat vizsgálják. Ez a kombinatorikus keresztvalidáció segít megelőzni az egy adatú történelmi tesztelés túlilleszkedését, mivel több variációval dolgozik. A véletlenszerű újramintavételezéshez tartozik a szubmintavételezés (véletlenszerű mintavétel csere nélkül) és a bootstrap (véletlenszerű mintavétel helyettesítéssel). A bootstrap módszer lehetővé teszi olyan minták létrehozását, amelyek mérete megegyezik az eredeti megfigyelt adatsoréval. Ezzel a módszerrel megőrizhetők az adatok közötti szekvenciális kapcsolatok.
A Monte Carlo módszer másik megközelítést alkalmaz, mivel új adatállományokat nem a megfigyelt adatállományból, hanem egy becsült populációs modellből vagy adatgeneráló folyamatból generál. A Monte Carlo kísérletek lehetnek paraméteresek vagy nem paraméteresek. A paraméteres Monte Carlo egyik példája a rezsimváltó idősor-modell (Hamilton 1994), ahol az egyes időpontokhoz tartozó adatokat a különböző folyamatok közül választják ki a valószínűségi eloszlás alapján. A nem paraméteres Monte Carlo példái közé tartoznak a variációs autoencoder-ek, önszerveződő térképek, vagy generatív adverszárius hálózatok, amelyek nemlineáris, nem paraméteres becsléseket alkalmaznak az adatok jellemzőinek feltérképezésére.
A szintetikus adatok létrehozásához használt Monte Carlo és újramintavételezés technikák különböző előnyöket kínálnak. Az újramintavételezés egyszerűen és gyorsan alkalmazható, ám limitált adatmennyiség esetén kevésbé hatékony. A Monte Carlo szimulációk viszont lehetővé teszik az adatok összetett, paraméterekre épülő generálását, ami szélesebb körű modellezést tesz lehetővé. Azonban, ha az adatok nem teljesen reprezentálják a valódi adatsorokat, akkor a paraméteres Monte Carlo módszer előnyösebb.
A paraméteres megközelítések lehetővé teszik, hogy a kutatók az adatgeneráló folyamatokat az ismert statisztikai tulajdonságok alapján modellezzék. Azonban nem minden esetben tudják ezeket a modelleket tökéletesen alkalmazni, mivel a valós adatgeneráló folyamatok komplexitása meghaladhatja az algebrai modellek által nyújtott egyszerűsített struktúrákat. Ilyen esetekben érdemesebb a nem paraméteres megközelítéseket választani, mivel ezek képesek rugalmasabban kezelni az adatok belső bonyolultságát.
A szintetikus adatok generálása és elemzése révén a kutatók jobban megérthetik, hogyan működnek a különböző befektetési stratégiák a valódi piacokon, és hogyan alkalmazhatók ezek a szimulált környezetek a túlilleszkedés elkerülésére. Az ilyen módszerek különösen hasznosak lehetnek, amikor az alapadatok korlátozottak, vagy amikor a hagyományos adatok nem elégségesek a teljes kép megértéséhez.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский