A gazdasági recessziók és más iparági kihívások ismételten megmutatták, hogy a hagyományos ellátási láncok nem képesek kellően reagálni a váratlan változásokra és zűrzavarra. Az ellátási láncok menedzselése gyakran az évek során megvalósított, jól bevált, de már nem megfelelő folyamatokon alapul, mint például a kockázatok azonosítása és statisztikai elemzésük. A valóságban azonban a kockázatok többsége ismeretlen és előre nem látható, ezért a rugalmasság, mint stratégiai tényező, kulcsfontosságú szerepet kapott az utóbbi években.
A rugalmasság a hálózatokban egyre fontosabbá vált, különösen az autóiparban, ahol a termelési ciklusok rendkívül összetettek, és a kockázatok széles skálán mozognak. Melnyk és társai [37] szerint a hálózati rugalmasság a legfontosabb tényező a beszállítói lánc menedzsmentjében. A rugalmasság modellezésének fejlesztése alapvető ahhoz, hogy jobban megértsük a hálózat működését. Az elemző és matematikai programozási modellek, valamint a szimulációs módszerek, mint a rendszerdinamika (SD), segítségével lehetőség nyílik a hálózat dinamikájának hosszú távú vizsgálatára, ezáltal segítve a stratégiai döntések meghozatalát. A szimulációk nagy előnye, hogy képesek a váratlan hatásokat is előre jelezni, mint például a "bullwhip" effektust, amely a keresleti változékonyság hatását mutatja az ellátási lánc mentén, a kiskereskedőktől a gyártókig és azok beszállítóiig.
A hálózati rugalmasság szimulációja különösen fontos lehet a vezetők számára, mivel segít megérteni, hogyan lehet fenntartani vagy eltávolítani egy-egy mintázatot a hálózatban, például egy folyamatot az ügyféllel vagy beszállítóval való kapcsolatban. Az autóipari ellátási láncok komplexitása megköveteli, hogy minden szereplő szoros kommunikációt folytasson, hogy elkerülje a fontos lépések vagy határidők elvesztését. A hálózatok optimalizálása érdekében számos stratégiát és változót kell figyelembe venni, többek között az árképzési stratégiákat és a teljesítménymutatókat (KPI-k).
A beszállítói láncok egyik lényeges jellemzője a bizalom. Az iparági verseny élesedése, valamint az egyre bonyolultabb globális piacok azt mutatják, hogy a bizalom kulcsszerepet játszik a sikeres üzleti kapcsolatokban. A brazil logisztikai ágazat felmérése [43] szerint a bizalomépítés alapvető eleme a kapcsolatok sikerességének. A bizalom fontos összetevője az áruk pontossága, a minőség, az ár és a szállítási határidők betartása. Az üzleti kapcsolatokban kialakuló bizalom számos tényezőtől függ, amelyek minden egyes fél számára eltérő jelentőséggel bírnak. A vásárlók számára a beszállítók jóindulata, míg a beszállítók számára a vásárlók integritása a legfontosabb.
A társadalmi csereelmélet (SET) és a tranzakciós költségek gazdaságtana (TCE) két alapvető elméleti háttér, amely a bizalmat befolyásolja az ellátási láncokban. A SET azt állítja, hogy a vállalati kapcsolatok személyes kapcsolatokhoz hasonlóan alakulnak, ami különösen fontos az ellátási láncok menedzsmentjében, ahol a döntéseket gyakran egy-egy személy hozza meg a cégek képviseletében. A TCE azt hangsúlyozza, hogy a nem megfelelő bizalom költségeket eredményezhet, mivel az ilyen kapcsolatokban az opportunizmusra való hajlam nő, ami végső soron csökkenti a kapcsolatok hatékonyságát.
Az üzleti kapcsolatokban a bizalom építését számos tényező befolyásolja. Az egyik legfontosabb az előző tapasztalatok és az előző együttműködések eredményei. A megbízhatóságot és a szállítási határidők betartását az üzleti kapcsolatok hosszú távú sikeressége is meghatározza. Emellett a márkaismertség és a nemzetközi jelenlét is erősíti a beszállítók megbízhatóságát, hiszen a nemzetközileg ismert és elfogadott márkák esetében a vásárlók kisebb kockázatot érzékelnek. A hálózati dimenziók, mint a vállalatok közötti kapcsolatok számának növekedése, új lehetőségeket kínálhatnak az üzleti fejlődéshez.
A termékminőség és az időben történő szállítás, valamint a vásárló-specifikus igényekhez való alkalmazkodás is fontos tényezők a bizalom fenntartásában. Az olyan vállalatok, amelyek képesek alkalmazkodni a változó piaci igényekhez és folyamatosan fejleszteni termékeik minőségét, hosszú távon is képesek sikeres üzleti kapcsolatokat kialakítani.
Hogyan lehet a gépi tanulást alkalmazni az ügynöki alapú modellek (ABM) szimulációinak előrejelzésére?
A gépi tanulás alkalmazása az ügynöki alapú modellek (ABM) szimulációinak előrejelzésére egyre népszerűbbé válik a szociális gondozás, az egészségügy és más összetett rendszerek modellezése területén. A szimulációk kalibrálása és elemzése gyakran rendkívül időigényes folyamatot jelent, amely nagy számú iterációt igényel a viselkedés pontos reprodukálása érdekében. A gépi tanulás különböző módszereket kínál arra, hogy gyorsabban és hatékonyabban generáljunk statisztikai modelleket, amelyek magas fokú pontossággal képesek lemásolni az eredeti ABM viselkedését.
A "Linked Lives" modell, amely az Egyesült Királyságban az informális szociális gondozás kereslet-kínálati viszonyait modellezi, példát ad arra, hogy miként alkalmazhatók a gépi tanulási módszerek az ABM-ek szimulációjának helyettesítő modelljeinek létrehozására. A szimulációk futtatása után a kutatók a leggyakrabban alkalmazott gépi tanulási módszerek közül választottak, hogy megvizsgálják azok alkalmasságát ABM helyettesítő modellek létrehozására. Az alkalmazott módszerek a következők voltak:
-
Neurális hálózatok
-
Támogatott vektorgépek (SVM)
-
Véletlen erdők
-
Lineáris regresszió
-
Gradiens-erősített fák
-
K-nézők
-
Gaussi-folyamatok
-
Döntési fák
Ezeket a gépi tanulási módszereket mind alkalmazták annak érdekében, hogy lemásolják az ABM viselkedését, és a neurális hálózatok mutatták a legjobb teljesítményt összességében. Bár a gradiens-erősített fák és a nem-lineáris SVM-ek általában kissé magasabb hibát eredményeztek, lényegesen gyorsabb futási idővel rendelkeztek. Az ilyen megközelítés egybevág a gépi tanulás alkalmazásával kapcsolatos felfogással, miszerint a gépi tanulás segítségével nemcsak az ABM-ek kimeneteli eredményeit lehet elemezni, hanem megérthetjük a modell viselkedését is, és értékes betekintést nyerhetünk a szimulációs eredményekből.
A gépi tanulás alkalmazása az ABM-ekben különböző típusú feladatokat ölel fel, amelyeket szupervizált tanulással oldhatunk meg. A szupervizált tanulásban egy adott feladatot egy tanulási rendszer tanul meg, miután megkapta a megfelelő tanulási példákat, amelyeket a felhasználó biztosít. Az elsődleges cél az, hogy egy olyan tanulási modellt hozzunk létre, amely képes előre jelezni a célváltozó értékét. Az alapfeltevés korábban az volt, hogy a forráshoz és a célfeladathoz hasonló feladatok szükségesek a tanulási folyamat hatékony végrehajtásához. Később a kutatók ezt a feltételezést elvetették, és olyan módszerek kidolgozására összpontosítottak, amelyek lehetővé teszik a tanult modell alkalmazását új környezetekben, amelyek eltérnek a forrástól. Ezt a folyamatot gyakran transzfer tanulásnak nevezik.
A transzfer tanulás olyan helyzetekben válik különösen fontossá, amikor előre tanított modelleket alkalmazunk új környezetekben. A mély neurális hálózatok alkalmazása során a transzfer tanulás egyszerű módot kínál arra, hogy egy előzetesen betanított modellt új környezetekhez igazítsunk, egy úgynevezett finomhangolás segítségével. A finomhangolás előnye, hogy csupán néhány példát igényel, így gyakran "few-shot learning"-ként emlegetik. A gépi tanulás során gyakran alkalmazott alapértelmezett tanulási módszerek, mint például a döntési fák, neurális hálózatok vagy más gépi tanulási algoritmusok, kulcsszerepet játszanak abban, hogy milyen mértékben képesek a modellek általánosítani a tanult adatokat.
A gépi tanulás egyik fontos aspektusa a tanulási folyamat konfigurálása, amelyet a különböző paraméterek (például a tanulási algoritmusok választása, hyperparaméterek beállítása) meghatároznak. A konfigurációs tér, amely azokat az opciókat tartalmazza, amelyek a tanulási algoritmusok beállításait szabályozzák, jelentős hatással van a modell teljesítményére. A tanulási torzítás, amely befolyásolja a tanulási folyamat eredményét, szintén meghatározó tényező. A megfelelő beállítások kiválasztása során sok kutatás foglalkozott a legfontosabb jellemzők meghatározásával és azok szervezésével, hogy maximalizálják az eredmények hatékonyságát.
A transzfer tanulás során a tudás átvitele kulcsfontosságú szerepet játszik, és különösen akkor válik hasznossá, amikor az egyik ügynök (tanár) segíti a másikat (tanuló) abban, hogy elsajátítsa a feladatot, mint például egy klasszifikációs vagy regressziós probléma megoldását. A tudás átvitele három fő forrást tartalmazhat: tanulási adatokat, tanulási torzítást és a már betanított modellt vagy rendszert, például egy betanított döntési fát vagy mély neurális hálózatot. Az ilyen típusú tanulás különösen akkor válik fontossá, ha a célfeladat bonyolultabb, és egy sor művelet alkalmazásával kell elérni egy adott célállapotot.
A jövőben a gépi tanulás és a több ügynök által végzett tanulás kombinációja új lehetőségeket kínál a komplex problémák hatékonyabb megoldására. Az ügynökök közötti tudás átadása, valamint a helyettesítő modellek alkalmazása lehetővé teszi a szimulációk gyorsabb és pontosabb elemzését, miközben csökkenti a szükséges számú iterációkat és a kalibrálási időt.
Miként modellezhetjük az ügynökök viselkedését és társadalmi kölcsönhatásait?
Az ügynök-alapú modellezés (ABM) lehetővé teszi számunkra, hogy komplex viselkedési mintázatokat, kölcsönhatásokat és rendszereket modellezzünk a különböző entitások, vagyis ügynökök, közötti interakciók révén. Az ügynökök viselkedése alapvetően két tényezőn alapul: az egyéni viselkedésükön és a csoportos viselkedésükön, amelyek az interakciók során formálódnak. Ezek a viselkedések nem csupán fizikai vagy térbeli jelenségeket takarnak, hanem időbeli, kognitív és társadalmi interakciókat is. A következőkben az ügynökök viselkedésének különböző típusait és azok modellezésének jelentőségét vizsgáljuk meg.
Az ügynökök viselkedése az idő és tér aspektusai szerint különböző módokon értelmezhető. Egy egyszerű példával élve, egy automatizált közösségi média ügynök az új év első percében képes üdvözletet küldeni a felhasználó barátainak (abszolút időben), vagy éppen a követők azonnali megköszönésére is képes lehet, miután valaki követni kezdte a csatornáját (relatív időben, eseményalapú viselkedés). Ilyen példák jól mutatják, hogy az ügynökök nemcsak térben, hanem időben is képesek a környezetükhöz alkalmazkodni.
A kognitív viselkedés az ügynökök mentális állapotainak, például a hiedelmek, vágyak és szándékok kezelését jelenti. Az ilyen típusú viselkedés különböző szinten jelenhet meg, a legegyszerűbb, stimulus-válasz szabályoktól kezdve egészen a bonyolult gondolkodásig, amelyben az ügynökök nemcsak saját mentális állapotaikat, hanem a körülöttük lévő más ügynökök állapotait is figyelembe veszik. Egy példaként említhetjük a robotporszívót, amely képes érzékelni egy akadályt és megállni (stimulus-válasz viselkedés), valamint optimalizált útvonalakat tervezhet annak érdekében, hogy hatékonyan végezze el a takarítást, miközben elkerüli az álló tárgyakat (optimalizált útvonal-tervezés).
Az ügynök-alapú modellek különböző típusú entitásokat is képesek modellezni: az ügynök lehet egyszerű állat, mint például egy madár vagy hal, vagy egy komplex társadalmi struktúra, mint egy vállalat vagy kormány. Az ügynökök egyéni viselkedése tükrözi azokat a jellemzőket, amelyekkel az adott entitás rendelkezik, függetlenül attól, hogy egy élőlényről, vagy egy mesterséges, komplex rendszerről van szó.
Társadalmi viselkedés és az ügynökök kölcsönhatása
A csoportos viselkedés olyan helyzetekben figyelhető meg, amikor az ügynökök kölcsönösen hatnak egymásra. Ezen viselkedés két fő típusra osztható: a tervezett viselkedésre és a spontán, emergens viselkedésre. A tervezett viselkedés akkor lép fel, amikor az ügynökök közötti interakciók explicit módon vannak megtervezve, és koordináltak az egyes ügynökök közötti kommunikációval. Az autonóm járművek szimulációja például olyan tervezett viselkedést mutat, ahol az ügynökök egy térbeli területen optimalizálják mozgásukat a különböző helyek közötti utasfelvétel céljából.
Ezzel szemben az emergens viselkedés akkor jelenik meg, amikor a csoportos interakciók következményeként spontán módon alakul ki egy kollektív viselkedés, amely nem áll explicit tervezés mögött. A halrajok mozgásának példáját említhetjük, ahol minden egyes hal igyekszik fenntartani egy bizonyos távolságot a többiektől, ami együtt vezet a halak csoportos, koordinált mozgásához. Az ilyen típusú viselkedés nemcsak az állatok, hanem az emberek esetében is megfigyelhető, például a befektetők tömeges viselkedésében, vagy a közösségi média vírusos terjedésében.
A társadalmi viselkedések olyan helyzetekben alakulnak ki, amikor az ügynökök a társadalmi struktúrák részét képezik, és kölcsönhatásba lépnek egymással ezen struktúrák keretein belül. A társadalmi viselkedést befolyásolják a társadalmi normák, amelyek meghatározzák, mikor és hogyan kell az ügynököknek együttműködniük vagy elhagyniuk a kollektívát. Az ilyen típusú viselkedés négy alapvető kategóriára osztható: együttműködő viselkedés, versengő viselkedés, tömeges viselkedés és defektálás.
Az együttműködő viselkedés akkor valósul meg, amikor két ügynök olyan tevékenységet végez, amely előnyös a másik számára. Az ügynök-alapú modellek egyik legismertebb példája a Börtön dilemma, ahol az ügynökök dönthetnek arról, hogy együttműködnek, vagy a saját érdeküket előtérbe helyezve inkább defektálnak.
A versengő viselkedés akkor fordul elő, amikor az ügynökök saját előnyükre, vagy a csoportjuk javára tevékenykednek, miközben másoknak hátrányos következményei vannak. A piaci szimulációk gyakran tartalmazzák a különböző csoportok közötti versengést, ahol egyes ügynökök előnyhöz juthatnak mások rovására.
A tömeges viselkedés során az ügynökök vakon követhetik a csoportot, anélkül, hogy saját döntéseiket alapoznák. A pénzügyi piacokon megjelenő buborékok, ahol a befektetők mindegyike ugyanazokat a mintákat követi, tipikus példái ennek a viselkedésnek.
Végül, a defektálás akkor lép fel, amikor egy ügynök ellentétes cselekedetet végez, mint a csoport többi tagja. Az ilyen típusú viselkedés gyakran jelenik meg a pénzügyi modellekben, ahol egyes befektetők szándékosan eltérnek a többség döntéseitől.
Az ügynök-alapú modellek építésének célja
Az ügynök-alapú modellek számos tudományos, gazdasági és mérnöki alkalmazásban kiemelt szerepet játszanak. Az ilyen modellek felépítésének leggyakoribb oka a viselkedés magyarázata, amely alapján megérthetjük a megfigyelt jelenségeket és azok dinamikáját. Az ABM-ek segítségével megfigyelhetjük, hogyan kölcsönhatnak egymással az ügynökök, és hogyan alakul ki a megfigyelt kollektív viselkedés, miközben figyelembe vesszük a viselkedést befolyásoló tényezők érzékenységét is.
Az ügynök-alapú modellezés segítségével nemcsak a múltbeli viselkedés magyarázható meg, hanem a jövőbeni viselkedés is előrejelezhető, különösen, ha nagy mennyiségű egyéni szintű adat áll rendelkezésre. A hagyományos előrejelző modellek mellett az ABM-ek képesek olyan részletes előrejelzéseket adni, amelyek figyelembe veszik a viselkedési dinamikákat és az interakciók komplexitását.
end
Miért nehéz a szervezeti tanulás válságokból és hogyan segítheti a gépi tanulás és az ügynökalapú modellek?
A válságok mindig olyan helyzeteket teremtenek, ahol az elérni kívánt célok és a tényleges eredmények közötti különbség súlyos fenyegetést jelenthet a szervezet számára. Ezen események gyors és hatékony kezelése kulcsfontosságú a további károk elkerüléséhez. A válságok egyúttal meglepetéseket is hoznak magukkal, amikor a kiváltó események bekövetkeznek, és ilyenkor az organizációk számára azonnali reakciók szükségesek.
A szervezeti tanulás és a válságok kapcsolatát különböző megközelítésekből vizsgálhatjuk. Az első megközelítés a "Tanulás válságra", ami az egyes szervezetek reakcióképességét fejleszti, különös tekintettel arra, hogy milyen gyorsan és pontosan képesek reagálni a fenyegetésre. A második megközelítés, a "Tanulás mint válság", arra utal, hogy a válságok abból származhatnak, amikor a döntéshozók mentális modellei és alapvető hiedelmei meginognak a tanulási folyamatok hatására. A harmadik megközelítés, a "Tanulás a válságból", azt jelenti, hogy a szervezetek saját tapasztalataik és mások hibáiból tanulnak, ezzel erősítve a szervezeti ellenálló képességet és előretekintő intézkedéseket hoznak. A negyedik, integrált megközelítés pedig a "Tanulás válság közben" a tanulás és a válság közötti kapcsolat dinamikáját emeli ki, amely magában foglalja az események és a tanulási folyamatok egyidejűségét.
Bár sok kutatás foglalkozik a szervezeti tanulás akadályaival válságok után, számos olyan tényező van, amelyek gátolják a válságokból való tanulást. A válságok közvetlen hatásai után, miután a legfontosabb károk elhárításra kerültek, az elemzések és az okok feltárása gyakran eltérő nézőpontokat és narratívákat eredményezhet, amelyek egyfajta védekező mechanizmusokat hoznak létre az érintettek számára. A válságot sok esetben hibaként, a vezetés hibájának vagy a kontroll elvesztésének következményeként kezelik. Smith és Elliot [4] nyolc fő akadályra mutattak rá, amelyek jelentősen gátolják a válságokból való tanulást.
Az első akadály a "keményedő alapvető hiedelmek, értékek és feltételezések". A túlzott ragaszkodás az alapvető hiedelmekhez és értékekhez gyakran félreértéseket, figyelmen kívül hagyást vagy tagadást eredményez, amikor a dolgok nem a vártak szerint alakulnak. Ez az akadály szorosan kapcsolódik a tanulásellenes dinamikákkal, amelyeket Argyris és Schön [14] kutatásai tártak fel. Emellett Senge [15] "mentális modellek" fogalma is ide tartozik, ami arra utal, hogy azokat szükségszerűen módosítani kell a szervezeti tanulás során.
A második akadály az "ineffektív kommunikáció és információs nehézségek". A válságok után a kommunikáció gyakran torzulhat, ami hozzájárulhat a zűrzavarhoz és a hatékony tanulás hiányához. Az információ túlterhelése, a szakértői nyelvezet túlsúlya, a "szelf-cenzúra" vagy a szervezeten belüli tabuk mind-mind a tanulás hatékonyságát csökkenthetik.
A harmadik akadály a "tagadás, a szakértelem központba helyezése és a külső vélemények figyelmen kívül hagyása". Amikor a válságról szóló diskurzust kizárólag a belső szakértők uralják, a külső nézőpontok figyelmen kívül maradnak, ami megnehezíti a szervezetek számára a külső tanulás és a fejlődés lehetőségeinek kihasználását.
A negyedik akadály a "perifériás kutatás és megtévesztő jelenség", amikor a válságra reagálva a szervezetek hajlamosak figyelmen kívül hagyni a kevésbé világosan meghatározott, de ugyanakkor fontos problémákat, ezzel egy szűkebb és kevésbé rendszerszintű gondolkodásra építve a megoldásokat.
A további akadályok között szerepel még a "kognitív szűkülés", amikor a szervezetek inkább a könnyen kezelhető problémákra koncentrálnak, míg a "maladaptáció" és a "környezeti változásokkal szembeni reakciók elhanyagolása" azt eredményezi, hogy nem veszik kellőképpen figyelembe a válság mélyebb vagy jövőbeli hatásait.
Szervezeti tanulás szempontjából az egyik legfontosabb akadály az, hogy a szervezetek gyakran "egyes hurokú tanulásra" építenek, azaz a meglévő stratégiák módosítása nem terjed ki a mélyebb értékek vagy normák megváltoztatására, amellyel a valós, rendszerszintű fejlődés elmarad.
Ezek a tényezők világosan mutatják, hogy a válságok utáni tanulás akadályai szorosan kapcsolódnak a szervezetek tanulási kultúrájához, és különösen Senge [15] öt kulcsfontosságú "komponens technológiai" elemehez, amelyek elengedhetetlenek a tanuló szervezet kialakításához. Ezen akadályok és a válságok utáni tanulás közötti összefüggések megértése segíthet a jövőben kialakítani olyan megközelítéseket, amelyek hatékonyabbá teszik a szervezetek válaszait és megelőzik a hasonló helyzetek újbóli kialakulását.
Hogyan érhetjük el az egyensúlyt a hatékonyság és az igazságosság között több ügynökös rendszerekben?
A több ügynökös rendszerek (Multi-Agent Systems, MAS) esetében a hatékonyság és az igazságosság közötti egyensúly megtalálása kulcsfontosságú kihívás. Az ilyen rendszerekben az ügynökök (agents) különböző célokat követnek, és ezek az egyéni célok gyakran ütköznek a közös, társadalmi jólét (social welfare) elveivel. Az eddigi kutatások szerint a hatékonyság és az igazságosság közötti viszony alapvetően befolyásolja a modellek tervezését, és ezen a területen két megközelítés tűnik a legígéretesebbnek: FEN és SOTO.
A FEN (Fairness-Enhanced Networks) egy hierarchikus politikai megközelítés, amely a hagyományos jutalmazási rendszert kiegészíti egy információelméleti célkitűzéssel. Az alapötlet az, hogy a modellben szereplő al-ügyek csak egy részét optimalizálják a hagyományos módon, míg a többit alternatív viselkedések felfedezésére használják. Az ilyen típusú modellek gyakran jobb Coefficient of Variation (CV) eredményeket mutatnak, amely a különböző ügynökök közötti eltéréseket méri. Az ilyen architektúrák nagy előnye, hogy az al-ügyek közötti kapcsolatok hierarchikusak, ami javítja az alkalmazás hatékonyságát és az igazságosságot.
A másik fontos megközelítés, amelyet jelenleg az iparági gyakorlatban legjobbnak tartanak, a SOTO (Self-Oriented and Team-Oriented) módszer. A SOTO rendszer két különböző politikai megközelítést alkalmaz, az egyéni orientáltságú (self-oriented) és a csapatorientált (team-oriented) politikákat. Az első célja, hogy maximalizálja az egyes ügynökök egyéni hasznát, míg a második célja, hogy a teljes csapat jólétét növelje. Ez a módszer a Dec-POMDP (Decentralized Partially Observable Markov Decision Process) keretrendszeren alapul, amely lehetővé teszi, hogy minden ügynök a saját megfigyelései alapján hozzon döntéseket, miközben a csapat orientált politika a többi ügynök gazdasági állapotát is figyelembe veszi. A SOTO rendszer további előnye, hogy képes különválasztani az egyéni és csapatszintű célokat, miközben biztosítja, hogy mindkét típusú cél elősegítse egymás megvalósulását.
A SOTO modell egyik kiemelkedő tulajdonsága a tanulási eljárás, amelyben minden ügynök különböző lépéseket tesz meg az egyéni és a csapatszintű politika alapján. A tanulási fázisok során a β változó értéke határozza meg, hogy az ügynök melyik politikát alkalmazza, miközben az egyes ügynökök a közösségi jólét szempontjából előnyös cselekvéseket választanak. A csapatorientált politika kifejezetten a társadalmi jólét szempontjából fontos, mivel az ügynökök ezt alkalmazva maximalizálják a globális hasznot. Az ilyen rendszerek azonban kihívásokat rejtenek, mivel az ügynökök nem minden esetben férnek hozzá pontos információkhoz más ügynökök döntéseiről, ami instabilitást okozhat a tanulási folyamatokban.
Fontos megjegyezni, hogy az igazságosság tanulása nem egyszerűen az egyéni eredmények figyelembevételét jelenti, hanem az ügynökök közötti interakciók és azok hatásainak folyamatos értékelését is. Az igazságos viselkedés megtalálása különösen nehéz, ha az ügynökök decentralizált környezetben dolgoznak, ahol csak részleges információk állnak rendelkezésre a világ állapotáról. A kutatások azt sugallják, hogy a SOTO modell, amely kombinálja az egyéni és csapatszintű politikákat, sikeres lehet az igazságos és hatékony viselkedés közötti egyensúly megtalálásában. Azonban az igazságosság és hatékonyság együttes optimalizálása továbbra is nyitott kutatási kérdés, amely a jövőben több figyelmet igényelhet.
A két megközelítés, FEN és SOTO, jól szemléltetik, hogyan próbálják a kutatók és mérnökök kezelni a hatékonyság és igazságosság közötti feszültséget a több ügynökös rendszerekben. Míg a FEN a hierarchikus politika architektúrájával és az információelméleti célokkal próbálja javítani az eredményeket, a SOTO az egyéni és csapatszintű politikák kombinálásával keres új megoldásokat. Ezen modellek további finomítása és alkalmazása segíthet abban, hogy a jövőben a több ügynökös rendszerek még hatékonyabbá és igazságosabbá váljanak.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский