Nella progettazione di reti neurali, il principio dell’equivariamento gioca un ruolo fondamentale nell’assicurare che l'architettura mantenga robustezza di fronte alla permutazione dei dati. Un approccio interessante che utilizza encoder comuni per tutti i moduli all'interno di uno stesso strato, consente una migliore robustezza alle perturbazioni, rendendo il modello più efficiente. In particolare, ogni nodo del dispositivo kKk \in K aggrega informazioni da tutti gli altri nodi, garantendo che ciascun nodo ottenga una sufficiente conoscenza del canale (CSI) e favorendo la coordinazione tra i dispositivi edge, RIS (Reconfigurable Intelligent Surface) e il server edge. In tal modo, la rappresentazione del vettore nel nodo kk viene aggiornata come segue:

zk(d)=fcomb,k(d)(zk(d1),zagg,k(d1),fK+1(d)(zK+1(d)),fK+2(d)(zK+2(d)))z_k^{(d)} = f_{\text{comb},k}^{(d)} \left(z_k^{(d-1)}, z_{\text{agg},k}^{(d-1)}, f^{(d)}_{K+1}(z_{K+1}^{(d)}), f^{(d)}_{K+2}(z_{K+2}^{(d)}) \right)

In questa equazione, zk(d)z_k^{(d)} rappresenta la nuova rappresentazione del nodo kk, che è il risultato della combinazione di informazioni provenienti sia dai nodi vicini che dai nodi più distanti, come il RIS e il server edge. Questo approccio migliora la capacità della rete neurale di apprendere la rappresentazione del canale in modo più efficace, sia per quanto riguarda le informazioni trasmesse dal nodo RIS che dal server edge.

Ogni nodo kKk \in K aggrega i vettori di rappresentazione dei nodi RIS e server edge separatamente, mantenendo inalterata la proprietà di invarianza alla permutazione. La progettazione del GNN consente di apprendere la rappresentazione del canale con maggiore accuratezza, sfruttando la sinergia tra i dispositivi edge e la superficie RIS. Inoltre, i vettori di rappresentazione di altri nodi dispositivo, come il nodo edge server e il nodo RIS, vengono trattati separatamente per preservare l'invarianza della permutazione.

Per ottenere segnali da tutti i dispositivi edge, si impiega una tecnica di mean pooling elemento per elemento per il RIS e il server edge. Un aspetto cruciale di questa progettazione è la scelta delle funzioni per garantire l'equivariamento della permutazione nelle operazioni di aggregazione e combinazione. Nel contesto dell'algoritmo di apprendimento GNN proposto, la progettazione delle funzioni di aggregazione è una parte essenziale per garantire che la rete neurale impari correttamente la rappresentazione del canale.

Generazione dei Parametri e Funzione di Perdita

Dopo aver attraversato diversi strati di mappatura grafica, i vettori di rappresentazione vengono aggregati e combinati per ottenere informazioni complessive. Lo strato finale è lo strato di generazione che mappa queste rappresentazioni nei parametri di trasmissione desiderati, come la potenza di trasmissione, il vettore di fase e il fattore di denoising. Per decodificare i vettori di rappresentazione dei nodi RIS, server edge e dispositivi edge, vengono utilizzati tre decodificatori specifici.

La funzione di perdita utilizzata per addestrare l'algoritmo GNN è progettata per minimizzare l'errore medio nel tempo, rispettando al contempo i vincoli di potenza media di trasmissione. La funzione di perdita è definita come:

loss=1Bm=1BkK(Er(t)+Reg(pk(t),pk))\text{loss} = \frac{1}{B} \sum_{m=1}^{B} \sum_{k \in K} \left( E_r(t) + \text{Reg}(p_k(t), \overline{p_k}) \right)

dove BB è la dimensione del mini-batch, e Reg(pk(t),pk)\text{Reg}(p_k(t), \overline{p_k}) è il regolarizzatore per i vincoli sulla potenza media. Il regolarizzatore viene scelto in modo tale da garantire che i vincoli siano soddisfatti senza compromettere la capacità di apprendimento della rete. In particolare, la funzione ReLU viene impiegata come regolarizzatore, dove:

ReLU(xx)=max(0,xx)\text{ReLU}(x - \overline{x}) = \max(0, x - \overline{x})

In questo modo, il modello è in grado di ottimizzare le variabili collegate nella funzione di perdita, rispettando i vincoli sulle potenze di trasmissione.

Considerazioni Importanti

Oltre agli aspetti tecnici trattati, è fondamentale comprendere che il modello GNN proposto non richiede di essere riaddestrato quando cambia il numero di dispositivi edge. Questo è un grande vantaggio rispetto agli approcci basati su DNN tradizionali, che necessitano di riaddestramento completo in scenari simili. Inoltre, l’utilizzo di un approccio grafico permette di gestire vari scenari complessi e dinamici in modo molto più efficiente, rendendo il modello scalabile.

La progettazione di un sistema RIS-assisted federated edge learning (FEEL) implica anche una serie di sfide pratiche, come la gestione dell'interferenza tra i dispositivi e la necessità di bilanciare i carichi computazionali tra i dispositivi edge, RIS e server edge. È quindi importante che il lettore consideri come l’integrazione dei RIS in un’architettura di apprendimento federato non solo migliora le prestazioni, ma può anche introdurre nuove complessità nella gestione e sincronizzazione dei dati tra i vari nodi del sistema.

Come garantire la privacy in un sistema di Federated Edge Learning: approcci e sfide

Il Federated Edge Learning (FEEL) è un modello emergente di apprendimento distribuito che, sfruttando dispositivi edge e server periferici, permette l'addestramento di modelli di machine learning senza la necessità di trasferire i dati grezzi al server centrale. Tuttavia, la trasmissione degli aggiornamenti del modello tra i dispositivi edge e il server solleva preoccupazioni relative alla privacy, poiché potrebbe comportare la divulgazione involontaria di informazioni sensibili. La protezione della privacy diventa quindi un elemento cruciale per garantire l'efficacia e la sicurezza di questo approccio.

Le recenti ricerche nel campo del FEEL hanno introdotto il concetto di privacy differenziale (DP), una teoria matematica che quantifica la quantità di informazioni private che possono essere rivelate durante il processo di aggregazione del modello. In pratica, la privacy differenziale impone l'adozione di tecniche per l'aggregazione del modello che minimizzino il rischio di rivelare informazioni riservate, come i dati dei singoli dispositivi. Tra queste tecniche, la perturbazione casuale è ampiamente utilizzata, in cui vengono aggiunti rumori artificiali ai dati del modello, seguendo distribuzioni come la Gaussiana o la Laplaciana, per mascherare i contributi individuali.

Una delle soluzioni innovative proposte nella letteratura è l'approccio basato su AirComp. Questo metodo sfrutta il rumore del canale wireless come mezzo per proteggere la privacy senza introdurre un costo aggiuntivo in termini di efficienza o complessità computazionale. Gli studi hanno dimostrato che l’anonimato intrinseco di AirComp è tale da nascondere gli aggiornamenti locali, aggregandoli in un unico flusso che garantisce la protezione della privacy, riducendo al contempo la necessità di rumore artificiale. Questo approccio ha dimostrato di essere efficace, poiché assicura che le informazioni locali non vengano mai rivelate in modo diretto, ma vengano invece mescolate e aggregate con quelle di altri dispositivi.

Tuttavia, la garanzia di privacy non è esente da compromessi. L'inserimento di perturbazioni ai dati del modello, sebbene utile per preservare la privacy, ha un impatto negativo sulla qualità del modello stesso. Infatti, l'introduzione di rumore riduce il rapporto segnale-rumore (SNR), il che potrebbe portare a una perdita di accuratezza durante l'apprendimento. Questo implica un delicato bilanciamento tra il desiderio di proteggere la privacy e la necessità di ottenere un modello accurato e robusto. Un miglioramento recente in questo campo è rappresentato dall'uso di RIS (Reconfigurable Intelligent Surfaces), che ottimizzano le condizioni del canale wireless e migliorano la qualità della comunicazione tra il server edge e i dispositivi, aumentando così la precisione del modello senza compromettere la privacy.

Il modello FEEL abilitato da RIS consiste in un server edge a singola antenna, dispositivi edge con antenne singole e un RIS con N elementi riflettenti passivi. In tale configurazione, la trasmissione di aggiornamenti del modello avviene su più blocchi di comunicazione, ogni blocco trasmettendo una porzione dell'aggiornamento del modello. In questo scenario, i dispositivi edge calcolano i loro aggiornamenti locali, che vengono successivamente inviati al server edge per essere aggregati. L’aggregazione degli aggiornamenti, che viene effettuata tramite un processo di discesa del gradiente, si basa su una media ponderata degli aggiornamenti locali, migliorando così la convergenza del sistema.

Nonostante l'adozione di RIS migliori la qualità del segnale, un altro aspetto cruciale per garantire una corretta aggregazione è la gestione del canale. Le condizioni di propagazione del segnale e le limitazioni di potenza dei dispositivi edge possono compromettere l'affidabilità dell'aggregazione del modello. Il RIS interviene migliorando le condizioni del canale, riducendo al contempo il rischio di distorsioni legate a interferenze o a limitazioni di potenza, aumentando così l’efficienza complessiva del sistema.

Infine, la privacy differenziale in FEEL si lega indissolubilmente al concetto di selezione dei client online. Gli approcci più recenti, che includono considerazioni di equità, selezionano in modo dinamico i dispositivi che partecipano a ciascun round di apprendimento, per bilanciare le esigenze di privacy e accuratezza in tempo reale. Sebbene la selezione dei client possa sembrare un passo secondario, in realtà, essa gioca un ruolo fondamentale nel determinare la qualità finale del modello e nell'assicurare che il sistema rimanga resiliente agli attacchi di tipo Byzantine.

In sintesi, la protezione della privacy nel Federated Edge Learning implica l'adozione di tecniche avanzate di aggregazione e l'uso di tecnologie emergenti come AirComp e RIS. Sebbene queste soluzioni migliorino la sicurezza e la privacy, è necessario un compromesso continuo tra l’efficacia dell'apprendimento e la protezione dei dati sensibili. Garantire un giusto equilibrio tra privacy e prestazioni del modello rimane una delle principali sfide di questo campo, ma le tecnologie moderne offrono promettenti vie per ottimizzare entrambe le dimensioni.