Faktorové investování je široce uznávané pro svůj přístup k tvorbě portfolií, kde jsou investice zaměřeny na specifické faktory, jako jsou velikost, hodnota, momentum nebo volatilita. Tyto faktory jsou považovány za nositele určité rizikové prémii, která je z hlediska teorie portfolia podložena empirickými výzkumy. Na rozdíl od tradičních modelů, které se soustředí na predikce výnosů na základě historických dat, faktorové modely se snaží odhadnout kauzální vliv specifických faktorů na chování trhu a cenové vývoje akcií.

Základní myšlenkou při konstrukci faktorových portfolií je, že každý faktor je individuálně považován za samostatný investiční nástroj. Mnozí investoři v tomto přístupu sestavují více portfolií zaměřených na jednotlivé faktory, které následně kombinují do multifaktorového portfolia. Tento způsob konstrukce portfolií je odlišný od jiných investičních strategií, které se zaměřují na vytváření portfolií na základě predikce zbytkových (ε) hodnot, tedy těch, které nejsou specifikovány jako faktory v modelu.

Při takovémto přístupu jde především o diverzifikaci, nikoliv o snahu monetizovat předpověď konkrétního faktoru. Faktory nejsou vybírány na základě očekávaných predikcí trhu, ale spíše na základě jejich historického chování a předpokládaného vlivu na tržní výnosy. Pro investora, který se spoléhá na takový model, je klíčové pochopení toho, že výběr faktorů není spojen s odhadem konkrétních tržních pohybů, ale s výběrem faktorů, které mohou poskytnout výnosy v dlouhém horizontu.

Na rozdíl od tohoto přístupu stojí investoři, kteří využívají prediktivní modely, jež se zaměřují na residualy (nebo jiné aspekty modelu), a ne na faktory. V tomto případě jsou odhady beta hodnot, které vyjadřují citlivost aktiva na určitý faktor, považovány za irelevantní. Hlavním cílem těchto modelů je maximalizovat výnosy na základě aktuálních tržních signálů, což může vést k větší volatilitě a vyšším rizikům. V faktorech investování se spíše pracuje s predikcí specifických rizikových prémií, nikoliv se samotnými predikcemi tržních pohybů.

Při práci s faktorovými modely investoři nezapomínají na kauzální vztahy mezi proměnnými. Například model Y = Xβ + Zγ + ε, kde Y je výnos, X je faktor, Z je jakýkoli zmatený (confounding) faktor, a ε je náhodná chyba, se nezaměřuje na predikci samotného výnosu Y, ale na odhad kauzálního účinku faktoru X na výnos Y. Tento přístup vyžaduje jasné a přesné pochopení, jak konkrétní faktor ovlivňuje výnosy na základě pozorovaných dat a za kontrolovaných podmínek.

Zároveň je důležité chápat, že faktory nejsou vždy spojeny s konkrétním kauzálním mechanismem. V literatuře je mnoho případů, kdy výzkumníci neuvádějí jasnou kauzální strukturu, která by vysvětlovala, jak faktor X způsobuje výnos Y. Některé studie se zabývají různými ekonomikami a modely, kde faktory jako velikost nebo hodnota mohou být vysvětleny pomocí předpokladů o chování firem a jejich systémového rizika. Tato vysvětlení jsou však často spíše plausible ekonomické rationale, nežli vědecky prokázané teorie.

Kauzální mechanismy v oblasti faktorového investování jsou stále předmětem debaty. I když existuje množství studií, které zkoumají vztah mezi faktory a výnosy, málo z nich se podrobně věnuje specifikaci kauzálních vztahů mezi jednotlivými proměnnými. Například u hodnoty, která je často spojována s rizikem bankrotu, není vždy jasně specifikováno, jak přesně tento mechanismus funguje v konkrétní ekonomické realitě. Jak přesně faktory jako HML (High Minus Low, neboli hodnota akcií s vysokým poměrem ceny k účetní hodnotě) ovlivňují výnosy, a jak tento vztah interaguje s jinými faktory jako momentum, není v mnoha případech dostatečně objasněno.

Pokud bychom se pokusili ilustrovat hypotetický kauzální mechanismus pro účely této diskuse, mohli bychom uvažovat situaci, kdy se ceny divergují od svých fundamentálních hodnot. Tato divergence může vyvolat reakci investorů, kteří začnou spekulovat na návrat k fundamentálním hodnotám, což vede k nerovnováze v objednávkách (OI). Tento efekt může následně vést k trvalému pohybu cen směrem k fundamentálním hodnotám (PC). Tento mechanismus by mohl být základem pro investiční strategii, která se zaměřuje na tuto divergence a její následné vyrovnání. I když taková strategie může mít svůj teoretický základ, je důležité mít na paměti, že cena často reaguje na více faktorů a není vždy možné přesně predikovat chování trhu na základě jednoho ukazatele.

V oblasti faktorového investování je tedy klíčové mít na paměti, že faktory nejsou vždy jednoznačně spojeny s kauzálním mechanismem. Vědecké modely v této oblasti jsou stále ve fázi vývoje a je potřeba se soustředit na jejich testovatelnost a schopnost přesně specifikovat kauzální vztahy.

Jak správně vymezit kauzální vztahy v investičních modelech?

V oblasti ekonometrie a investičního modelování je klíčové správně rozlišovat mezi různými fázemi analýzy a přístupem k modelování kauzálních vztahů. Ve světě statistiky a ekonometrie se stále častěji setkáváme s dilematem, jak správně konstruovat a interpretovat kauzální grafy a modely, které zohledňují komplexní dynamiku vztahů mezi proměnnými. Je důležité si uvědomit, že proces, který zahrnuje jak objevování kauzálních vztahů, tak i jejich následnou specifikaci, by měl být rozdělen do několika kroků.

Prvním krokem je objevení kauzálního grafu, který nejlépe vysvětluje daný jev v celé jeho komplexnosti. To zahrnuje jak pozorovaná data, tak i extra-statistické informace. Tento krok je klíčový pro pochopení základní struktury vztahů mezi proměnnými a pro identifikaci potenciálních příčin a následků, které budou analyzovány v dalších fázích. Druhým krokem je samotná specifikace modelu, která by měla být zaměřena výhradně na odhadování kauzálních efektů vymezených v předchozím grafu. V této fázi je důležité se vyhnout tomu, aby byl model specifikován na základě nejlepší prediktivní schopnosti, protože to může vést k přehnanému zkreslení odhadů kauzálních vztahů.

Správná specifikace modelu není ta, která předpovídá výsledek Y nejlépe, ale ta, která nejlépe odstraňuje bias v odhadu β̂ pro konkrétní proměnnou, která má sloužit jako vstup pro kauzální analýzu. Zvolení specifikace na základě její schopnosti vysvětlit co nejvíce variace může vést k nesprávným závěrům. Například kombinování několika příčin Y může zvýšit vysvětlující sílu modelu, ale zároveň to může vést k multikolinearitě nebo nadměrnému kontrolování kolidujících proměnných, což zkreslí výsledky odhadu.

Takovéto přístupy mohou často vést k falešným pozitivním výsledkům, kde specifikace modelu neodpovídá skutečným kauzálním vztahům. Výběr více faktorů pro vysvětlení Y může sice posílit prediktivní sílu modelu, ale zároveň otevřít cestu k chybným závěrům, pokud jsou příčiny modelovány společně bez ohledu na jejich skutečné vztahy v rámci kauzálního grafu. Tento problém je zvlášť patrný, když analýza zahrnuje více testování a model hledá specifikace na základě maximálního vysvětlení dat, což může vést k tzv. "specifikačnímu biasu" spíše než k výběrovému biasu.

V případě časových řad je zvláštní pozornost věnována problémům, které vznikají při neadekvátním zohlednění časových vlastností dat. Mnohé časové řady mohou vykazovat silné autokorelace nebo dlouhé klouzavé průměry, což může vést k falešným závěrům o kauzálních vztazích, i když jsou data zjevně statisticky propojena. V tomto případě je potřeba brát v úvahu nejen správnou specifikaci modelu, ale i časovou dynamiku dat, například prostřednictvím analýzy kointegračních vztahů nebo testů na přítomnost jednotkového kořene.

Je nezbytné mít na paměti, že i když ekonometrické studie mohou být akademicky rigorózní, často se potýkají s problémy, které vyplývají z nesprávné specifikace modelu. Takové studie jsou náchylné k chybám typu A (falešně pozitivní výsledky) i typu B (chybné kauzální závěry), což může výrazně ovlivnit spolehlivost předpovědí. Pro analýzu kauzálních vztahů je lepší využívat sofistikovanější metody, jako jsou analýzy vzájemné informace nebo variace informací, které umožňují přesněji zachytit strukturu vztahů mezi proměnnými.

Kauzální analýza v investičním modelování je tedy komplexním a mnohovrstevnatým procesem, který vyžaduje nejen silné teoretické základy, ale také pozornost k detaily, které mohou ovlivnit interpretaci výsledků. V neposlední řadě je důležité mít na paměti hierarchii důkazů, která pomáhá hodnotit sílu empirických tvrzení v oblasti financí. Experimenty s randomizovaným kontrolovaným testováním (RCT) představují nejspolehlivější metodu, zatímco ekonometrické modely s pozorováním pouze korelací jsou méně silné a náchylné k zavádějícím závěrům.

Jak testování a falsifikace podporují vědecký pokrok v ekonomických teoriích

V oblasti vědeckého výzkumu, zejména v ekonomii a kvantitativních financích, je základem kvalitního testování teorií schopnost experimentálně ověřit jejich platnost a vyloučit možnosti, které by mohly mít falešný nebo neúplný základ. Falsifikace, podle filozofa Karla Poppera, představuje klíčový nástroj v procesu vědeckého pokroku, neboť každá teorie by měla být schopna být podrobena zkoušce, která by mohla její platnost vyvrátit. V tomto kontextu lze ukázat, jak experimenty a empirické výzkumy ovlivňují naše chápání finančních trhů a jejich dynamiky.

Například v případě teorie PIN (Proportional Imbalance of Order Flow) se výzkumníci mohou pokusit prozkoumat reakce trhů na náhodné výkyvy v nevyváženosti toku objednávek. Taková experimentální metoda, kdy je náhodně rozdělena skupina akcií do dvou částí a následně jsou prováděny nákupní objednávky s cílem sledovat, jak reagují trhy na tuto nevyváženost, umožňuje vědcům studovat nejen bezprostřední reakce, ale i důsledky těchto změn na likviditu, šířku bid-ask spreadu a volatilitu. Tento přístup umožňuje vytvoření modelů, které následně poskytují vědecké důkazy o dynamice trhů a testují platnost teorií.

Pokud se výsledky těchto experimentů shodují s předpoklady teorie, jako je PIN teorie, můžeme považovat danou teorii za dočasně platnou. V některých případech mohou výzkumníci přímo zkoumat procesy generující data, například přístupem k tržním tvůrcům, kteří obchodují na základě likvidity a reagují na náhodné výkyvy toku objednávek. Tato metoda, nazývaná „terénní studium“, dává výzkumníkům možnost potvrdit nebo vyvrátit platnost daných modelů, což v konečném důsledku umožňuje výběr těch nejúspěšnějších strategií.

Jedním z dalších důležitých nástrojů pro testování teorií je „risky forecast“, což je predikce výsledků na základě nepozorovaných intervencí. Pokud vědecká teorie například naznačuje možné selhání v poskytování likvidity, výzkumníci mohou předpovědět taková selhání i v budoucnosti, jak se to stalo například před velkými tržními otřesy, jako byl tzv. „flash crash“ v roce 2010. Profesionální obchodníci, kteří implementovali modely založené na PIN teorii, byli schopni se na tuto situaci připravit a profitovali na ní, zatímco obchodníci, kteří spoléhaly na slabší teorie, utrpěli ztráty. Tento přístup ukazuje, jak teorie mohou být užitečné nejen pro vysvětlení minulosti, ale i pro predikci neznámých událostí.

Pokud jde o falsifikaci teorií, v oblasti kvantitativních financí je tento proces klíčový, protože teorie, které nejsou dostatečně robustní vůči testování, mohou být postupně opuštěny. Zatímco některé teorie mohou být původně považovány za přínosné, pokud se ukáže, že jsou schopny odolat různým testům, jejich schopnost přežít v „evolučním“ smyslu je tím, co je činí silnými. Tato evoluce teorií je poháněna neustálými pokusy o jejich testování a zlepšování, které vede k vytváření přesnějších a efektivnějších modelů.

Představme si například situaci, kdy se výzkumník rozhodne testovat teorie v oblasti likvidity prostřednictvím konkrétních intervencí na trhy. Zatímco některé modely mohou ukázat přesně, jakým způsobem trhy reagují na určité změny v objednávkách, jiné teorie mohou být rozptýlené a nejsou schopné odolat testování, protože se nezaměřují na konkrétní kauzální mechanismus. Tento rozdíl ukazuje na důležitost tvorby teorií, které jsou nejen dobře definovány, ale i schopné být podrobeny experimentálnímu testování.

Nesmíme zapomínat na to, že vědecký pokrok vyžaduje kontrolu proměnných a pečlivý design experimentů, který vede k odhalení správných kauzálních vztahů. V oblasti financí to znamená, že teorie, které nemohou být ověřeny prostřednictvím konkrétních experimentů nebo terénních studií, nemohou být považovány za vědecké. Tento proces však neznamená, že bychom se měli vzdát metod jako je Socratic metoda, která pomáhá v kritickém přehodnocování základních definic a principů. I když se Socratic metoda ukazuje jako užitečná v některých fázích výzkumu, vědecká metoda vyžaduje schopnost generovat a testovat hypotézy v kontrolovaných podmínkách.

V závěru, testování a falsifikace v ekonomických teoriích je proces, který neustále posouvá hranice našeho chápání trhů. Teorie, které nejsou dostatečně testovatelné, neudrží krok s těmi, které procházejí přísným ověřováním. To činí vědecký pokrok dynamickým a kontinuálním procesem, který nás stále více přibližuje k pochopení složitých finančních a ekonomických jevů.

Jak simulační intervence přispívají k objevu kauzálních vztahů v observačních studiích?

Simulační intervence představují novou oblast výzkumu v rámci kauzálních inferencí, která se ukazuje jako zvlášť užitečná, když intervenční studie nebo přírodní experimenty nejsou realizovatelné. Tyto intervence umožňují simulovat účinky, které by normálně byly měřeny při náhodné přiřazení, i když jsou výzkumníci limitováni pouze observačními daty. To je možné díky hypotetickým kauzálním grafům, které slouží jako nástroj pro odstranění vlivu zaručujících faktorů a zajišťují, že závěry o kauzálních účincích jsou co nejvíce spolehlivé, i když za určité předpoklady.

Simulované intervence mají dva hlavní cíle. Prvním z nich je umožnit výzkumníkům odhadnout sílu kauzálního efektu v rámci observačních studií. Tento přístup je zvláště cenný v případech, kdy kontrolované experimenty nejsou praktické nebo eticky proveditelné. Druhým cílem je umožnit testování hypotetických kauzálních grafů. Pokud analýza ukáže, že efekt předpokládaný v grafu je statisticky nevýznamný, může to vést k zamítnutí celého grafu, což napomáhá k vyloučení chybných kauzálních struktur. Simulované intervence tedy neprovádějí experimenty přímo, ale vytvářejí předpoklady, na jejichž základě se lze přiblížit realistickým simulacím a zjistit, jak by vypadaly, kdyby byly skutečně aplikovány.

Důležité je rozlišovat mezi stanovením kauzálního tvrzení a jeho vyvrácením. V případě intervenčních studií a přírodních experimentů mohou výzkumníci bez znalosti konkrétního kauzálního grafu buď potvrdit, nebo vyvrátit kauzální vztah. Tyto metody jsou obvykle nejmocnějšími nástroji kauzální inference, protože umožňují přímo zasahovat do experimentálních podmínek a vyvodit platné závěry o příčinách a důsledcích. Simulované intervence jsou však závislé na předpokladech, které jsou součástí hypotetických kauzálních grafů, a není možné prokázat, že tyto předpoklady jsou skutečně správné. V tomto případě lze pouze vyvrátit daný graf, pokud dojde k nesouladu mezi předpokládaným a skutečně odhadnutým efektem.

V rámci kauzálního objevování, které je součástí širšího výzkumu kauzálních vztahů, se statistické metody vyvinuly tak, aby umožnily identifikovat, jaké proměnné jsou mezi sebou v příčinném vztahu. Tyto metody jsou neocenitelné, protože umožňují analyzovat observační data a vytvářet struktury, které jsou kompatibilní s dostupnými důkazy. I když nikdy není možné zcela určit kauzální graf pouze na základě observačních dat, mohou tyto metody výrazně snížit počet možných struktur závislosti mezi proměnnými a napomoci k formulaci přesnějších závěrů.

Mezi nejznámější metody patří algoritmy, které se zaměřují na podmíněné nezávislosti mezi daty, což je základní přístup pro odhalování kauzální struktury. Algoritmy, jako je PC algoritmus a jeho modifikace, umožňují vyhledávat základní kauzální informace z dat, přičemž některé verze jako FCI algoritmus jsou schopny dosáhnout správných závěrů i v případě, že existují skryté (nepozorovatelné) zmatené faktory. Další přístupy, jako jsou algoritmy založené na skóre, se zaměřují na optimalizaci funkcí, které hodnotí vhodnost zjištěné struktury na základě dat. I když tyto metody mohou poskytnout užitečné výsledky, stále závisí na některých předpokladech, které mohou mít vliv na přesnost výsledků.

Významným přístupem je také využívání funkcí kauzálních modelů (FCM), které modelují vztahy mezi příčinami a efekty ve formě funkcí, kde efekt je závislý na příčinách a náhodné chybě, která je od příčin nezávislá. Tento přístup umožňuje určit kauzální směry mezi proměnnými na základě předpokladů o nezávislosti chyb a příčin. Výhoda tohoto modelu spočívá v tom, že umožňuje identifikovat skutečný kauzální směr mezi proměnnými, což je klíčové pro kvalitní analýzu kauzálních vztahů.

Je také zajímavé, jak moderní technologie, jako je zpracování přirozeného jazyka a strojové učení, mohou přispět k odhalování kauzálních vztahů v nečíselných datech. Například analýza článků a textových dat může odhalit skryté kauzální vztahy, které by byly jinak obtížně dostupné pomocí tradičních metod. Tyto techniky představují nový a inovativní způsob, jak využít textová data pro kauzální analýzu a pomáhají rozšířit možnosti výzkumu mimo tradiční číselné analýzy.

Ve světle těchto metod je důležité si uvědomit, že kauzální objevy vyžadují opatrnost. I když simulované intervence mohou odhalit silné kauzální vztahy, nikdy nelze zcela vyloučit možnost, že některé výsledky jsou podmíněny specifickými předpoklady nebo omezeními daného modelu. Výsledky získané z těchto metod by měly být považovány za indikace, které vyžadují další ověření a testování. I když simulované intervence a kauzální objevování poskytují silné nástroje pro vědecký výzkum, stále zůstávají otevřenými otázkami, jak nejlépe zajistit jejich správnost a generalizovatelnost na širší kontexty.