L’optimisation de la collecte de données par UAV dans un environnement urbain 3D complexe, où coexistent des groupes de données mobiles (GD) et des zones interdites de vol (NFZ), présente un défi majeur. Il s’agit d’une problématique non convexe, exacerbée par la mobilité des GD et la nécessité d’assurer une communication efficace tout en respectant les contraintes spatiales et de confidentialité. Pour y répondre, la méthode proposée repose sur un apprentissage par renforcement multi-agent (MAFRL), où chaque UAV est considéré comme un agent apprenant à optimiser conjointement sa trajectoire 3D et la planification des communications.

L’analyse des trajectoires 3D montre que les UAV adaptent leur altitude en fonction de l’état de la ligne de vue (LoS) avec les GD. En conditions non-LoS, les UAV s’élèvent pour restaurer une liaison directe, réduisant ainsi la distance de transmission et améliorant la qualité du lien. À l’inverse, en présence d’une LoS, ils s’approchent horizontalement des GD afin de maximiser le débit de transmission. Cette stratégie adaptative illustre un compromis fin entre minimisation de la durée de collecte des données et respect des contraintes physiques. La segmentation claire des tâches entre UAV (par exemple, UAV1 s’occupant des GD1, GD3, GD4 et UAV2 des GD2, GD5, GD6) permet également une optimisation des parcours et évite les chevauchements inutiles.

La présence de zones interdites de vol complique l’itinéraire des UAV, qui doivent emprunter des trajets plus longs pour éviter ces espaces restreints, ce qui augmente le temps total d’opération. Cependant, lorsqu’aucune NFZ n’est présente, la collecte s’en trouve accélérée, confirmant l’impact significatif de ces contraintes sur la planification des missions. La méthode proposée se distingue par sa capacité à gérer efficacement l’augmentation du nombre de NFZ, en optimisant les trajectoires et en limitant l’augmentation du temps de vol par rapport aux méthodes traditionnelles, notamment grâce à la modélisation précise de l’environnement et à l’apprentissage dynamique.

L’influence de la taille des données à collecter est également cruciale : plus le volume d’informations à transférer est important, plus le temps d’opération global augmente. Notamment, la méthode centralisée MAFRL se démarque par une gestion efficace du temps de transmission des paramètres de modèle, restant quasi constant quelle que soit la taille des données, contrairement aux autres approches où ce temps croît avec le volume. Néanmoins, cette centralisation implique un partage intensif d’informations sensibles (comme la position des UAV), soulevant des problématiques de confidentialité et de sécurité.

L’approche distribuée proposée pallie ces limites en évitant la transmission constante de paramètres critiques, réduisant ainsi les risques liés à la confidentialité tout en maintenant des performances proches des méthodes idéales centralisées sans NFZ. Elle intègre également un apprentissage par renforcement avec dueling networks, améliorant la robustesse et la précision des politiques d’action pour les UAV.

Il est essentiel de considérer que l’environnement urbain est dynamique et hétérogène : les GD ne sont pas statiques, et leurs mouvements aléatoires imposent une adaptation continue des trajectoires et du planning. La prise en compte de la 3D dans la conception des trajectoires permet d’exploiter pleinement l’espace aérien, offrant des gains substantiels en efficacité par rapport à des trajectoires 2D traditionnelles. L’extension possible de ce modèle à des GD évoluant en trois dimensions ou à des missions multi-tâches témoigne de la flexibilité et du potentiel de cette méthode.

La complexité croissante du système, avec l’augmentation du nombre d’UAV et de NFZ, nécessite un apprentissage fin et des mécanismes de récompense adaptés, notamment pour éviter les collisions ou l’entrée dans les zones interdites. Une fonction de récompense continue, pénalisant ces situations, pourrait renforcer la sécurité opérationnelle. En outre, la confidentialité et la sécurité des échanges d’informations doivent être garanties, particulièrement dans un contexte où les UAV peuvent être la cible d’attaques ou de commandes malveillantes.

Il importe également de comprendre que la réussite de telles méthodes dépend de l’équilibre entre la précision du modèle d’apprentissage, la capacité de calcul embarquée sur les UAV, et la robustesse face à des incertitudes environnementales. La modularité du système permet une adaptation progressive à des contextes variés, allant des scénarios urbains denses aux environnements plus ouverts, tout en intégrant les évolutions technologiques liées aux communications sans fil de prochaine génération.

Comment optimiser la trajectoire d’un UAV pour le transfert d’énergie sans fil : une approche par trajectoires équivalentes

L’optimisation de la trajectoire d’un drone (UAV) dans un système de transfert d’énergie sans fil (WPT) repose sur une reformulation ingénieuse du problème initial, souvent trop complexe à cause des contraintes de vitesse. Partant d’une trajectoire unidirectionnelle respectant la contrainte de vitesse maximale x˙(t)V|\dot{x}(t)| \leq V sur un intervalle de temps [0,T][0,T], il est possible de décomposer cette trajectoire en deux composantes équivalentes qui, combinées, garantissent une performance énergétique identique.

La première trajectoire correspond à un déplacement à vitesse maximale entre une position initiale xIx_I et une position finale xFx_F, parcourue en un temps fixe T=(xFxI)/VT = (x_F - x_I)/V. Cette phase est caractérisée par un mouvement rectiligne sans arrêt. La seconde trajectoire, définie sur le temps résiduel T^=T(xFxI)/V\hat{T} = T - (x_F - x_I)/V, permet une liberté totale de mouvement sans contrainte de vitesse, ce qui autorise au drone de stationner ou de se déplacer librement pour optimiser la distribution de l’énergie reçue par les nœuds au sol.

Cette décomposition repose sur l’égalité intégrale de l’énergie reçue par chaque nœud, formalisée par la relation :

0TQk(x(t))dt=0TQk(x(t))dt+0T^Qk(x^(t))dt,kK,\int_0^T Q_k(x(t)) dt = \int_0^T Q_k(x(t)) dt + \int_0^{\hat{T}} Q_k(\hat{x}(t)) dt, \quad \forall k \in \mathcal{K},

Qk(x(t))Q_k(x(t)) désigne la puissance reçue par le nœud kk lorsque le drone est en position x(t)x(t). La conservation de cette énergie assure que la performance du système WPT reste inchangée malgré la séparation en deux trajectoires distinctes.

Ce principe permet de reformuler le problème d’optimisation initial (P1.1)(P1.1) en un problème équivalent (P2)(P2) où la contrainte de vitesse disparaît, simplifiant considérablement le traitement mathématique. Dans (P2)(P2), l’optimisation porte uniquement sur la trajectoire x^(t)\hat{x}(t) sur l’intervalle [0,T^][0, \hat{T}], avec un terme d’énergie constant EkE_k tenant compte de l’énergie transférée durant le segment à vitesse maximale. La reformulation autorise une liberté accrue dans le choix des positions du drone, éliminant ainsi les couplages temporels complexes induits par la contrainte de vitesse.

Bien que les problèmes (P1)(P1), (P1.1)(P1.1) et (P2)(P2) soient non convexes en raison de la nature intrinsèque du système WPT, ils satisfont à une condition de partage temporel (« time-sharing »), garantissant la dualité forte avec leurs duals de Lagrange. Cette propriété est essentielle pour utiliser efficacement la méthode du dual de Lagrange, qui permet d’aborder l’optimisation avec une complexité réduite.

Le dual de Lagrange pour (P2)(P2) introduit des multiplicateurs λk0\lambda_k \geq 0 associés aux contraintes d’énergie pour chaque nœud. La fonction duale est définie en maximisant la fonction de Lagrange sur les variables primales, sous la contrainte que la somme des multiplicateurs kλk=1\sum_{k} \lambda_k = 1 pour éviter une fonction non bornée. Le problème dual (DP2)(DP2) consiste alors à minimiser cette fonction duale en respectant les contraintes d’égalité et de non-négativité.

Une fois ce dual résolu, il devient possible de déterminer les durées optimales de stationnement (hovering) du drone en des points spécifiques, via un problème de programmation linéaire. L’objectif est de maximiser l’énergie minimale reçue par les nœuds au sol, assurant ainsi une distribution équitable. La trajectoire optimale ainsi obtenue suit une structure dite SHF (Speed-Hover-Fly), où le drone alterne entre déplacement à vitesse maximale et stationnement aux points stratégiques.

Les caractéristiques essentielles de cette solution optimale sont que la trajectoire est segmentée, comportant au plus K+2K+2 points de stationnement, où KK est le nombre de nœuds au sol. Les durées de stationnement sont choisies pour équilibrer la puissance transmise et maximiser l’efficacité globale du transfert d’énergie.

Enfin, la solution optimale du problème équivalent (P2)(P2) sert de base pour reconstruire la trajectoire optimale du problème original (P1.1)(P1.1), en combinant la phase de déplacement à vitesse maximale entre positions extrêmes avec les phases de stationnement aux points identifiés par x^(t)\hat{x}(t).

Il est important de saisir que cette méthode repose sur un équilibre subtil entre contraintes physiques (vitesse maximale) et performance énergétique. La liberté de stationnement introduite dans la reformulation permet de contourner la complexité temporelle initiale, mais impose également une connaissance précise des positions optimales pour maximiser le transfert. De plus, la condition de dualité forte et la validité du partage temporel sont cruciales pour garantir que les solutions obtenues via la méthode duale sont effectivement optimales et applicables dans un contexte pratique.

Ainsi, au-delà de la simple optimisation mathématique, le lecteur doit intégrer la compréhension que les contraintes dynamiques et physiques des UAV sont intimement liées à la topologie spatiale et temporelle du transfert d’énergie. La démarche proposée illustre une stratégie générale pour simplifier des problèmes d’optimisation complexes en exploitant des propriétés structurelles du système, ouvrant la voie à des applications plus larges dans la gestion optimale des ressources mobiles.

Comment optimiser les trajectoires et l’allocation des ressources pour les UAV intégrés à la communication et au sensing ?

Dans les systèmes de communication sans fil intégrant des drones (UAV) pour fournir simultanément des services de communication et de détection, la modélisation précise du canal et l’optimisation des ressources sont essentielles pour maximiser l’efficacité globale. Le canal baseband entre un UAV et un utilisateur k à un instant n est décrit par une fonction complexe hHk(q[n], uk), qui dépend notamment de la position angulaire relative et de la distance entre l’UAV et l’utilisateur. Ce canal est affecté par un facteur de perte en chemin βk(q[n], uk), une composante de phase exponentielle complexe, ainsi qu’un vecteur de réponse d’antenne aH(q[n], uk).

L’UAV transmet un signal d’information sk destiné à l’utilisateur k pendant un créneau temporel n, avec des signaux statistiquement indépendants et distribués normalement complexes circulaires (CN(0,1)). Le vecteur de formation de faisceau wc[n] et le vecteur d’allocation αk[n] déterminent respectivement la direction du signal émis et quel utilisateur est desservi à chaque instant. La contrainte stricte d’un utilisateur unique par créneau impose une gestion dynamique de l’association utilisateur-UAV.

Le signal reçu par l’utilisateur k combine le canal, la formation de faisceau et le bruit additif gaussien, ce qui conduit à un rapport signal sur bruit (SNR) exprimé par γk[n], qui conditionne directement le débit de données Rk[n] via la relation logarithmique Rk[n] = log2(1 + γk[n]). Par ailleurs, les signaux réfléchis par des cibles environnantes sont exploités pour l’estimation des paramètres de ces cibles, le gain du faisceau transmis vers la cible j étant calculé en fonction du vecteur de formation et des caractéristiques du canal entre UAV et cible.

Le problème d’optimisation consiste à maximiser la somme des débits sur toutes les tranches temporelles et tous les utilisateurs, sous plusieurs contraintes rigoureuses : la fréquence et la puissance de détection, les exigences minimales de qualité de service (QoS), les limites de puissance d’émission de l’UAV, la vitesse maximale de déplacement, ainsi que les positions initiale et finale de l’UAV. Cette formulation intègre des variables entières binaires pour l’allocation des utilisateurs et des tâches de détection, ce qui confère au problème une nature non convexe complexe.

Pour surmonter cette complexité, une approche analytique permet de dériver une expression en forme fermée pour le vecteur de formation de faisceau optimal, combinant linéairement deux composantes orientées respectivement vers l’utilisateur et vers la cible. Cette forme met en lumière l’interdépendance entre la trajectoire de l’UAV, la qualité du canal et l’efficacité du faisceau formé. L’analyse de la fonction objective, simplifiée par l’omission de la fonction logarithmique lors de la maximisation du gain, révèle que l’optimisation du SNR se ramène à maximiser une forme quadratique sous contraintes, notamment que le gain vers la cible atteigne un seuil fixé.

Le facteur de corrélation angulaire cosϕk,j entre les canaux de l’utilisateur et de la cible joue un rôle central : lorsque ces canaux sont parfaitement corrélés (cosϕk,j = 1), la puissance reçue à l’utilisateur atteint un maximum dépendant uniquement de la puissance transmise et de la distance ; dans le cas orthogonal (cosϕk,j = 0), le gain diminue, illustrant la nécessité de choisir des trajectoires et des allocations adaptées pour équilibrer les besoins en communication et en détection.

La prise en compte des pertes en chemin, avec des exposants variant entre 2 et 4 selon le modèle bi-statique ou mono-statique, influence aussi la planification des trajets. Des contraintes sont imposées pour garantir que le rapport signal sur bruit des signaux réfléchis soit suffisant pour une détection fiable, ce qui, combiné à la contrainte de qualité de service pour la communication, guide l’allocation temporelle des ressources et la définition des trajectoires.

L’algorithme proposé combine une méthode à deux niveaux reposant sur une pénalisation des contraintes non satisfaites, optimisant simultanément le trajet de l’UAV, l’association utilisateur, la formation de faisceau, et la répartition du temps entre communication et détection. Cette approche permet d’approcher une solution optimale dans un problème autrement inextricable.

La compréhension de ce système révèle plusieurs notions clés : d’une part, la formation de faisceau optimale n’est pas simplement un pointage vers un utilisateur ou une cible isolée, mais une superposition savante modulée par la corrélation des canaux ; d’autre part, la gestion intégrée du déplacement et de la puissance de l’UAV impose des compromis délicats entre maximisation du débit et maintien de performances de détection. Enfin, le caractère dynamique des allocations, avec un seul utilisateur desservi par créneau, reflète la nature séquentielle et multiplexée du système, nécessitant une coordination précise entre les sous-systèmes.

Il est crucial pour le lecteur de saisir que cette architecture intégrée reflète une tendance forte des réseaux sans fil vers la convergence de fonctions autrefois séparées, avec des implications profondes sur la conception des protocoles, la gestion des interférences, et les algorithmes d’optimisation. L’efficacité du système dépend autant de la précision dans la modélisation physique du canal et des phénomènes de propagation que de la sophistication des techniques mathématiques appliquées à la planification des ressources. Par ailleurs, le déploiement concret devra prendre en compte des variations environnementales et des incertitudes, invitant à une extension des modèles vers des approches robustes ou adaptatives. La maîtrise de ces concepts ouvre la voie à des applications innovantes, notamment dans les domaines de la surveillance aérienne, des communications d’urgence, et de l’Internet des objets.

Comment optimiser conjointement l’orientation des antennes directionnelles et la trajectoire des UAV dans les réseaux de transfert d’énergie sans fil

Dans les réseaux de transfert d’énergie sans fil (WPT) assistés par UAV, l’optimisation conjointe de la trajectoire des UAV et de l’orientation des antennes directionnelles s’impose comme une problématique complexe mais cruciale pour maximiser l’efficacité énergétique globale. En effet, contrairement aux antennes omnidirectionnelles classiques, les antennes directionnelles permettent de concentrer le faisceau d’émission, augmentant ainsi la puissance récoltée par les nœuds capteurs (SN) tout en limitant les interférences et les pertes d’énergie.

L’enjeu principal réside dans la nécessité de modéliser précisément le schéma de rayonnement des antennes ainsi que la dynamique de vol de l’UAV. Pour cela, une approche consistant à approximer le modèle de l’antenne par une fonction en cosinus modifiée et à quantifier la trajectoire de l’UAV a permis de transformer le problème initial, très complexe et non convexe, en un problème d’optimisation plus maniable. La construction d’une fonction concave inférieure au modèle de puissance récoltée a autorisé l’établissement d’une approximation convexe serrée, ouvrant la voie à des techniques d’optimisation convexe efficaces.

Les simulations confirment la convergence de l’algorithme proposé et démontrent les bénéfices notables des antennes directionnelles par rapport aux antennes omnidirectionnelles, et ce dans différents scénarios de densité de capteurs et d’altitude de vol. L’optimisation simultanée de l’orientation de l’antenne et de la trajectoire constitue une avancée majeure dans la conception des réseaux WPT assistés par UAV, avec un potentiel d’adaptation à d’autres contextes, notamment lorsque les positions des nœuds capteurs sont inconnues ou quand les ressources doivent être allouées de façon dynamique.

Bien que les travaux présentés se concentrent sur un réseau d’antennes linéaires unidimensionnelles (1DULA), l’extension à des réseaux bidimensionnels ou tridimensionnels reste envisageable, le modèle de cosinus modifié conservant sa pertinence. Cette généralisation ouvre la voie à des applications plus complexes où la spatialisation fine du faisceau joue un rôle déterminant.

Il est fondamental de comprendre que l’efficacité du transfert d’énergie dans ces systèmes ne dépend pas seulement des paramètres physiques tels que la puissance émise ou la distance entre UAV et capteurs, mais aussi de la précision du modèle énergétique non linéaire du circuit de récolte. Les dispositifs de récupération d’énergie ont des comportements non linéaires qui doivent être rigoureusement intégrés dans la conception des algorithmes d’optimisation pour garantir une performance réelle et non théorique.

Par ailleurs, la variabilité environnementale, les obstacles physiques, ainsi que les contraintes dynamiques du vol doivent être prises en compte dans une perspective pragmatique, ce qui complexifie encore la tâche. L’optimisation conjointe s’inscrit donc dans une démarche systémique où chaque élément, antenne, trajectoire, modèle énergétique, influence les autres et doit être co-conçu pour atteindre l’objectif global d’efficacité énergétique maximale.

Ainsi, au-delà de l’algorithme et de la modélisation présentés, il importe pour le lecteur de saisir l’importance de cette approche intégrée dans les futures architectures des réseaux de transfert d’énergie sans fil. Ces avancées représentent une étape indispensable vers des systèmes autonomes, intelligents et adaptatifs, capables d’alimenter des capteurs répartis dans des environnements variés avec un minimum de ressources.