A otimização da seleção de dispositivos e do beamforming em ambientes de aprendizado federado de borda é uma tarefa desafiadora, pois envolve múltiplos dispositivos com capacidades computacionais diversas, e a interação entre esses dispositivos deve ser otimizada de maneira a reduzir o erro total da rede. Para resolver esses problemas, é fundamental minimizar o erro ε′ de cada iteração. O processo de otimização se concentra na minimização de variáveis como o fator de escala ηt, que deve ser ajustado para melhorar a eficiência global.

Em um modelo ideal, a função objetivo é minimizada maximizando o número de dispositivos selecionados. No entanto, esse problema é complexo, pois a seleção de dispositivos não é um processo trivial. A expressão para o erro de otimização envolve termos que dependem da interação entre os dispositivos e a relação entre os coeficientes de canal. O termo relacionado ao vetor de beamforming (denotado por at) pode ser expresso de forma que o problema de otimização torne-se não linear e de difícil resolução. A estratégia, então, deve focar na solução precisa, através de uma abordagem que combine técnicas de otimização como o método de DC Algorithm (DCA).

No contexto de sistemas de aprendizado federado de borda, a otimização de beamforming pode ser simplificada quando a seleção dos dispositivos participantes é feita de forma eficiente. No entanto, mesmo depois da escolha dos dispositivos, o problema permanece de difícil resolução, pois o beamforming continua a ser uma questão não convexa, exigindo técnicas como a programação quadrática restrita para encontrar a solução ótima.

Além disso, a busca pelos melhores dispositivos a serem incluídos em cada iteração envolve uma abordagem combinatória, onde a otimização da seleção de dispositivos pode ser feita iterativamente por meio de amostras de Gibbs (GS), um método conhecido que visa reduzir a complexidade computacional ao otimizar os conjuntos de dispositivos de forma gradual. A cada iteração, o algoritmo de amostragem ajusta os conjuntos de dispositivos, com base em distribuições adequadas, o que permite um progresso rumo à solução ótima.

Outro ponto importante é o uso do método DCA para otimização do beamforming no receptor. Esse processo envolve a aplicação de uma técnica de lifting matricial, que transforma o problema de beamforming em uma forma de otimização de baixo rank, facilitando a resolução do problema. Embora o problema original seja de difícil solução devido à presença de termos não convexos, a utilização de um termo de penalidade para garantir que as restrições sejam atendidas permite que se encontre uma solução mais precisa. Essa abordagem resulta em um problema de programação de diferença de funções convexas, que pode ser resolvido por técnicas iterativas de otimização, proporcionando melhores resultados em cada iteração.

O algoritmo DCA apresenta um método robusto para lidar com esses tipos de problemas, possibilitando uma otimização eficaz ao transformar um problema não convexo em um problema de otimização côncava em cada passo. A execução do algoritmo passa por iterações que refinam a solução até que as restrições sejam suficientemente atendidas, o que leva à convergência para a solução ideal de beamforming.

A otimização do sistema, por sua vez, se concentra no uso de estratégias como a técnica de "warm start", que inicializa a solução com os melhores parâmetros encontrados nas iterações anteriores. Essa estratégia é crucial para acelerar o processo de otimização, tornando-o mais eficiente ao evitar a necessidade de reiniciar o processo do zero a cada iteração.

Para a implementação desses conceitos em redes federadas de borda, a combinação de métodos como Gibbs Sampling para seleção de dispositivos e DCA para otimização do beamforming oferece uma solução robusta e eficiente para problemas complexos em que a escolha do dispositivo e a configuração do sistema devem ser constantemente ajustadas.

Além disso, é importante notar que, em cenários reais, a variabilidade das condições de rede e a dinâmica do sistema podem introduzir desafios adicionais. A interferência entre os dispositivos, a heterogeneidade dos canais de comunicação e a variabilidade nas taxas de transmissão podem afetar significativamente a performance do sistema. É fundamental que, ao aplicar esses métodos de otimização, se leve em consideração a necessidade de adaptar os algoritmos à medida que as condições do ambiente de borda mudam, garantindo uma performance ótima durante todo o processo de aprendizado federado.

Como otimizar o aprendizado federado de borda assistido por RIS com AirComp?

A integração entre AirComp (cálculo via ondas) e o Aprendizado Federado de Borda (FEEL – Federated Edge Learning) representa uma resposta promissora às crescentes demandas por eficiência espectral e processamento descentralizado em redes sem fio. Ao aproveitar a propriedade inerente de superposição de sinais do AirComp, torna-se possível agregar modelos de aprendizado de forma eficiente no canal de subida (uplink), sem a necessidade de transmissão sequencial ou separada de cada participante. No entanto, essa abordagem encontra um limite prático: o desempenho do AirComp é fortemente condicionado pelo pior canal de comunicação entre os dispositivos e o servidor de borda, tornando o sistema vulnerável a condições de canal desfavoráveis.

Para mitigar esse gargalo, propõe-se o uso de Superfícies Inteligentes Reconfiguráveis (RIS – Reconfigurable Intelligent Surfaces), que permitem alterar dinamicamente o ambiente de propagação. O RIS é composto por numerosos elementos passivos de reflexão, cuja fase pode ser ajustada de forma a refletir os sinais incidentes em direções e com características específicas, permitindo um alinhamento mais eficaz do sinal recebido. Essa tecnologia já se mostrou útil em múltiplos contextos: desde a preservação de privacidade e aumento de robustez, até a otimização do consumo energético e da eficiência espectral.

A estratégia de aprendizado federado assistido por RIS e AirComp consiste em projetar conjuntamente o transmissor AirComp e os deslocamentos de fase do RIS para realizar uma agregação precisa e rápida dos modelos locais. Contudo, essa tarefa impõe desafios significativos. Em primeiro lugar, a avaliação do desempenho do sistema exige uma análise de convergência rigorosa, baseada em métricas de comunicação que apenas podem ser observadas ao longo de diversas rodadas de aprendizado. Em segundo lugar, o impacto dos erros de agregação precisa ser considerado sob uma perspectiva de longo prazo, dado que esses erros se acumulam ao longo das rodadas, afetando a convergência global do modelo. Em terceiro lugar, a própria otimização conjunta entre os parâmetros do transmissor e as fases do RIS resulta em um problema não trivial, cuja solução por métodos alternados é computacionalmente custosa.

Diante disso, uma abordagem eficaz é considerar diretamente os erros acumulados de agregação ao longo do tempo e derivar um limite superior de convergência para a norma média temporal do gradiente global. Tal limite fornece uma medida teórica do desempenho de convergência do sistema em presença de imperfeições de canal. Para minimizar esse erro médio e, consequentemente, melhorar o desempenho do sistema, propõe-se um algoritmo baseado em otimização alternada dos seguintes parâmetros: potência de transmissão, fator de atenuação de ruído e fases de reflexão do RIS. Essa estratégia permite controlar simultaneamente os principais vetores que influenciam o alinhamento e a qualidade dos sinais agregados, com o objetivo de acelerar a convergência do modelo global e reduzir o impacto da heterogeneidade dos