Federated Edge Learning (FEEL) heeft in de afgelopen jaren veel aandacht gekregen door de groeiende toepassing van gedistribueerde machine learning-modellen op een breed scala aan edge-apparaten. Het optimaliseren van modellen in een federated learning-instelling vereist efficiënte algoritmen die zowel de communicatie- als de rekenkosten minimaliseren, terwijl ze de prestaties van het model verbeteren. Traditioneel worden veel van deze algoritmen gebouwd op basis van eerste- en tweede-orde optimalisatietechnieken, zoals de bekende FedAvg, FedPD en FedNova. Deze algoritmen maken gebruik van gradiënten of Hessiaan-informatie om het optimalisatieproces te sturen. Echter, in situaties waarbij de analytische expressies van verliesfuncties onbereikbaar zijn of computationeel kostbaar om te berekenen, ontstaan er significante obstakels.

Het ontbreken van gradiënten wordt vaak waargenomen in toepassingen zoals federated hyperparameter-tuning, gedistribueerde black-box aanvallen op diepe neurale netwerken en online sensorselectie, waar de berekeningen van gradiënten complexe matrixinversies vereisen. In deze gevallen kan de traditionele aanpak van federated optimization, die afhankelijk is van gradiënten, ineffectief zijn.

De noodzaak voor een alternatieve aanpak heeft geleid tot de ontwikkeling van zeroth-order algoritmen. Deze algoritmen werken zonder de noodzaak voor gradiëntinformatie, wat ze bijzonder geschikt maakt voor toepassingen waar deze informatie moeilijk te verkrijgen is. Een van de meest prominente benaderingen binnen FEEL is de zeroth-order optimalisatie, waarvan het FedZO-algoritme een representatief voorbeeld is.

Het belangrijkste voordeel van FedZO is de mogelijkheid om federated learning toe te passen in omgevingen waar gradiënten onbereikbaar zijn. Dit wordt bereikt door gebruik te maken van een mini-batch-type stochastische gradient estimator, die een benadering van de verliesfunctie maakt zonder gebruik van expliciete gradiënten. De techniek is gebaseerd op het schatten van de richting van de optimale oplossing door te kijken naar de veranderingen in de uitvoer van het model na kleine wijzigingen in de modelparameters. Het vereist geen toegang tot de volledige analytische vorm van de verliesfunctie, wat het een krachtig instrument maakt voor diverse gedistribueerde leerscenario's.

De uitdaging in een FEEL-systeem ligt niet alleen in het verkrijgen van deze stochastische schattingen van de verliesfunctie, maar ook in de efficiëntie van het optimalisatieproces, vooral als er veel edge-apparaten en hoge-dimensionale modelparameters betrokken zijn. Het FedZO-algoritme biedt een oplossing door de mogelijkheid om gedeeltelijke deelname van apparaten toe te staan, wat de communicatiekosten aanzienlijk vermindert. Dit is essentieel, aangezien de communicatie tussen de edge-apparaten en de centrale server vaak een aanzienlijke belemmering vormt voor de prestaties van federated learning-systemen.

De theoretische garanties voor de convergentie van het FedZO-algoritme zijn belangrijk voor het begrijpen van zijn effectiviteit. Studies hebben aangetoond dat het FedZO-algoritme kan convergeren, zelfs in scenario's met beperkte communicatie en waar de functie niet expliciet beschikbaar is. Dit biedt een krachtige aanpak voor federated optimization in situaties waar traditionele eerste- en tweede-orde methoden niet kunnen worden toegepast.

Een ander belangrijk aspect van zeroth-order optimalisatie in FEEL is de rol van communicatie. Het FedZO-algoritme kan de communicatielast tussen de edge-apparaten en de centrale server verminderen door gebruik te maken van een gespreid aantal deelnemende apparaten per ronde. Dit maakt het mogelijk om grotere en complexere systemen te schalen zonder de reken- en communicatie-infrastructuur te overbelasten.

De belangrijkste overwegingen voor een succesvol gebruik van zeroth-order optimalisatie in federated learning zijn de grootte van de mini-batches, de wijze van stochastische schatting en de frequentie van updates. Het gebruik van grotere mini-batches kan de nauwkeurigheid van de schattingen verbeteren, maar leidt vaak tot hogere communicatiekosten en langere convergentietijden. De afweging tussen nauwkeurigheid en efficiëntie is daarom cruciaal bij de implementatie van deze technieken.

Naast het verbeteren van de efficiëntie van het leerproces in federated edge learning, opent zeroth-order optimalisatie de deur naar nieuwe toepassingen die voorheen moeilijk te realiseren waren. Deze technieken maken het mogelijk om federated learning toe te passen in domeinen waar andere methoden zouden falen, zoals bij het optimaliseren van modellen zonder toegang tot gedetailleerde data of bij het omgaan met sterke onzekerheden in de data. Het is dan ook van belang dat onderzoekers zich blijven richten op het verfijnen van deze technieken, met name in het licht van de opkomst van nieuwe technologieën zoals 6G-netwerken, die de schaalbaarheid van federated learning verder zullen vergroten.

Hoe kan men apparaatplanning en tijdstoewijzing optimaliseren in UAV-gedreven federatief leren?

In het kader van federatief leren met behulp van onbemande luchtvaartuigen (UAV's), vormt de gezamenlijke optimalisatie van apparaatplanning, tijdstoewijzing en UAV-trajectontwerp een fundamenteel vraagstuk. Binnen de BCD-LD methode wordt dit probleem systematisch aangepakt door het scheiden van de optimalisatie in twee stappen: eerst worden apparaatplanning en tijdstoewijzing opgelost onder een vast UAV-traject, waarna het traject zelf wordt geoptimaliseerd. Elk subprobleem wordt daarbij analytisch opgelost met behulp van Lagrange-dualiteit, waarmee de rekenkundige complexiteit aanzienlijk wordt verlaagd zonder in te boeten op optimaliteit.

De initiële uitdaging ligt in het elimineren van niet-lineaire en niet-gladde elementen in de restricties. Zo wordt bijvoorbeeld een max-functie in de tijdrestrictie herschreven in lineaire vorm, wat leidt tot een relaxatie van de integer-beperkingen. De continue formulering resulteert in een convex optimalisatieprobleem. Dit probleem, hoewel nog steeds complex, wordt tractabel door de toepassing van de Lagrange-dualiteitsmethode.

De resulterende partiële Lagrangiaan omvat drie typen Lagrangemultipliers: λ voor energiebeperkingen, μ voor tijdsconsumptie per apparaat, en ξ voor datatransmissiebehoeften. Deze multipliers maken het mogelijk de duale functie op te stellen, mits aan de randvoorwaarden is voldaan, met name de voorwaarde dat de som van de μ-multipliers per tijdslot kleiner of gelijk moet zijn aan één. De duale functie wordt vervolgens geminimaliseerd over de primaire variabelen – tijdstoewijzing, apparaatplanning en trajectduur – en vervolgens gemaximaliseerd over de duale variabelen.

Een belangrijk analytisch resultaat wordt verkregen voor de optimale tijdstoewijzing. Deze wordt expliciet uitgedrukt met behulp van de Lambert W-functie, een niet-triviale wiskundige functie die optreedt wanneer exponentiële en logaritmische structuren elkaar kruisen. De resulterende formule koppelt de toegewezen tijd aan signaalsterkte, datasnelheid en verwerkingscapaciteit van het apparaat, wat aantoont dat apparaten met betere kanaalkwaliteit en snellere verwerking voordelig worden behandeld.

De apparaatselectie volgt vervolgens uit een lineair programma waarin elk apparaat geactiveerd wordt als de geassocieerde kostenfunctie negatief of nul is. Hiermee wordt niet alleen het optimale aantal apparaten bepaald, maar ook een voorkeur gegeven aan die met sterke kanalen, grote datasets en hoge rekencapaciteit.

De optimalisatie van de UAV-trajectduur – d.w.z. de benodigde tijd tussen twee opeenvolgende trajectpunten – is lineair en hangt uitsluitend af van de positieverschillen en maximale UAV-snelheid. Onder een bepaalde duale structuur laat de optimale duur zich eenvoudig bepalen, mits men rekening houdt met de differentiabiliteit van de duale functie. Aangezien deze in de praktijk vaak niet differentieerbaar is, wordt een subgradient-procedure toegepast met geprojecteerde updates, wat leidt tot iteratieve bijstellingen van de duale variabelen.

Het gehele optimalisatieproces convergeert naar het optimum door middel van afwisselende updates van de tijdstoewijzingen, apparaatselecties en de Lagrangemultipliers. Uiteindelijk worden alle resultaten teruggevoerd in het oorspronkelijke primaire probleem om de UAV-trajectduur te verfijnen. In dit kader wordt een laatste formulering gepresenteerd die alle variabelen integreert onder de fysieke UAV-beperkingen, zoals maximale snelheid en gegevensbehoefte.

Belangrijk is te begrijpen dat hoewel het duale probleem analytisch elegant en numeriek efficiënt is, de praktische inzet van het model afhankelijk is van dynamisch veranderende netwerkomstandigheden. Denk hierbij aan fluctuaties in kanaalkwaliteit, veranderende UAV-accucondities en prioriteiten van apparaten. Voor robuuste toepassing is adaptiviteit onmisbaar. Verder vereist de praktische uitvoering van de voorgestelde methode toegang tot volledige en actuele informatie over alle deelnemende apparaten – een vereiste die in gedistribueerde en privacygevoelige netwerken niet altijd vervuld kan worden.

Het is ook essentieel om te erkennen dat de keuze voor welke apparaten actief deelnemen, gebaseerd is op een zuiver optimaliteitscriterium. Dit kan resulteren in herhaalde uitsluiting van apparaten met minder gunstige karakteristieken, wat op termijn ten koste kan gaan van de fairness en de algehele representativiteit van het geleerde model. In systemen waar gelijke deelname of privacy centraal staat, moeten dergelijke optimalisatiemethoden dan ook worden aangevuld met mechanismen die deze aspecten expliciet borgen.

Hoe Privacy en Precisie Verbeterd Kunnen Worden in Federated Edge Learning Systemen met Reconfigurabele Intelligente Oppervlakken

In de wereld van Federated Edge Learning (FEEL), waarbij de training van modellen plaatsvindt op gedistribueerde data zonder de gegevens centraal te verzamelen, is het waarborgen van privacy van cruciaal belang. Dit komt doordat FEEL-systemen een balans moeten vinden tussen het handhaven van privacybeperkingen en het behouden van de nauwkeurigheid van het leerproces. In deze context wordt steeds vaker gebruik gemaakt van reconfigurabele intelligente oppervlakken (RIS), die kunnen bijdragen aan zowel de privacy als de prestaties van het systeem, zelfs in omgevingen met ongunstige draadloze kanalen.

Het gebruik van RIS binnen FEEL-systemen kan de signaalkwaliteit verbeteren door het kanaal te optimaliseren, vooral in scenario’s met een lage signaal-ruisverhouding (SNR). Het verbeteren van de signaalkwaliteit heeft een directe invloed op de leernauwkeurigheid, aangezien betere communicatiesystemen zorgen voor meer betrouwbare gegevensoverdracht tussen de apparaten die betrokken zijn bij het leren. Dit is essentieel voor het handhaven van de prestaties, vooral wanneer de systemen onder privacyrestricties werken. Het beleid van "differentiële privacy" (DP), dat ervoor zorgt dat persoonlijke gegevens niet expliciet kunnen worden achterhaald, staat vaak in conflict met het streven naar hoge nauwkeurigheid, aangezien het toevoegen van ruis de efficiëntie van het leerproces kan verminderen. Dit wordt duidelijk in de resultaten van simulaties die de invloed van het privacyniveau (ε) op de leernauwkeurigheid onderzoeken. Terwijl een lager ε zorgt voor betere privacy, gaat dit gepaard met een lagere nauwkeurigheid van het model. Aan de andere kant, als ε wordt verhoogd, verbetert de leerprestatie aanzienlijk doordat de communicatie effectiever is en de privacybeperkingen minder strikt zijn.

De impact van RIS in FEEL-systemen wordt bijzonder duidelijk in scenario's met lage SNR. In dergelijke gevallen kan RIS de leerprecisie aanzienlijk verbeteren door de propagatie van het signaal via een gecontroleerde reflectie te optimaliseren, wat de kwaliteit van de ontvangen signalen verhoogt. Dit biedt een significante verbetering in de prestaties van FEEL-systemen, vooral in omgevingen die normaal gesproken gevoelig zijn voor ruis en interferentie. De simulaties tonen aan dat bij een lage SNR, de RIS-ondersteunde systemen in staat zijn om prestaties te leveren die vergelijkbaar zijn met systemen zonder privacybeperkingen, wat suggereert dat privacy wordt gehandhaafd zonder noemenswaardige afbreuk te doen aan de leernauwkeurigheid.

De invloed van het aantal leerrondes op de leerprestaties is ook een belangrijk aspect van FEEL-systemen. Na verloop van tijd, wanneer het aantal communicatieblokken toeneemt, kunnen de systemen zich aanpassen door de keuze van bepaalde parameters, zoals de leercoefficiënt en de privacyinstellingen. De flexibiliteit van de aanpassing van deze parameters draagt bij aan een betere convergentie en verhoogde robuustheid van het systeem tegen draadloze ruis. Het gebruik van RIS in deze context zorgt ervoor dat FEEL-systemen niet alleen nauwkeuriger worden, maar ook veerkrachtiger tegen de inherente storingen van draadloze netwerken.

Naast de primaire focus op de prestatieverbetering door RIS, is het ook belangrijk te erkennen dat het ontwerp van FEEL-systemen altijd een compromis is tussen nauwkeurigheid en privacy. Het gebruik van RIS verhoogt de efficiëntie van communicatie, maar de noodzakelijke privacymaatregelen, zoals het toevoegen van kunstmatige ruis of het gebruik van privacy-gerelateerde optimalisatie-algoritmen, kunnen de prestaties beïnvloeden. Het is van belang dat ontwikkelaars van FEEL-systemen voortdurend afwegen hoeveel privacybescherming noodzakelijk is en welke prestatieverbeteringen mogelijk zijn zonder de balans tussen privacy en nauwkeurigheid te verstoren.

In het algemeen biedt het gebruik van RIS in FEEL-systemen een innovatieve benadering om de prestaties van draadloze communicatiesystemen te verbeteren zonder concessies te doen aan de privacy. Dit is vooral waardevol in scenario's waar de draadloze omgeving ruisgevoelig is, en waar privacystriktheid essentieel is. Het combineren van geavanceerde privacymechanismen met technologieën zoals RIS biedt de mogelijkheid om zowel de leerprestaties als de vertrouwelijkheid van gegevens te waarborgen, wat cruciaal is voor de toekomstige ontwikkeling van federated learning in dynamische en vaak onbetrouwbare netwerkomgevingen.