La conception optimale de la trajectoire d’un UAV pour maximiser le transfert d’énergie sans fil à plusieurs dispositifs (GD) repose sur la formulation d’un problème complexe où la trajectoire spatiale et temporelle est étroitement liée à l’énergie récoltée par chaque dispositif. L’équation fondamentale qui modélise cette dynamique intègre des sommes multiples sur les différentes étapes de vol et de stationnement du drone, ainsi que des contraintes spatiales définissant une zone rectangulaire où l’UAV doit évoluer, excluant toute efficacité à survoler en dehors de l’enveloppe convexe des dispositifs. Cette restriction géométrique est essentielle, car elle garantit que l’énergie délivrée ne soit pas diluée inutilement en s’éloignant des cibles.
L’énergie collectée par un GD pendant la phase de charge est formulée comme une intégrale temporelle de la fonction non linéaire Fnl appliquée à la puissance reçue, fonction qui dépend elle-même de la position et du temps via la trajectoire du drone. Cette fonction Fnl est cruciale : elle traduit la réalité physique du transfert d’énergie, prenant en compte les pertes et la saturation des circuits de réception, ce qui la rend non linéaire et introduit une difficulté majeure dans l’analyse et l’optimisation.
Le problème d’optimisation initial (noté P3) vise à maximiser l’énergie minimale collectée parmi tous les GD, sous la contrainte stricte que la somme des durées de vol et de stationnement ne dépasse pas la période de charge T, tout en respectant les limites spatiales. La non-convexité inhérente à ce problème est due au caractère non linéaire de la fonction Fnl, et notamment à la dépendance implicite de l’énergie récoltée à la trajectoire. Cette non-convexité empêche d’emblée l’usage des techniques classiques d’optimisation convexe.
Pour dépasser cette difficulté, une approximation convexe est introduite. Elle repose sur la construction d’une borne inférieure concave E(r) des fonctions d’énergie Ek, assurant Ek ≥ E(r), avec égalité au point local d’approximation (x(r), y(r), t(r)). Cette méthode permet de découper le problème complexe en sous-problèmes plus traitables. La phase de stationnement (hovering) est approximée en exploitant la convexité de la fonction Fnl quadratique par rapport aux distances spatiales au centre des GD, donnant naissance à une borne inférieure affine pondérée par des coefficients qui varient localement.
La phase de vol à vitesse maximale est traitée par subdivision de chaque segment de trajectoire en un grand nombre de sous-segments statiques virtuels, ce qui permet d’approximer l’intégrale temporelle par une somme finie. Chaque sous-segment est alors traité comme une position fixe avec une durée virtuelle de stationnement. Cette technique autorise un calcul précis et convexifiant l’énergie récoltée en vol, en s’appuyant sur la linéarité des approximations utilisées durant la phase de stationnement.
Le recours à ces approximations successives transforme un problème globalement non convexe en une suite de problèmes convexes, résolubles itérativement pour ajuster la trajectoire spatiale et temporelle (x, y, t) du drone. Chaque itération affine la borne inférieure E(r) jusqu’à convergence vers une solution proche de l’optimal.
Il est fondamental de noter que le choix judicieux des bornes et de la décomposition temporelle permet non seulement d’optimiser l’énergie collectée, mais aussi de garantir la faisabilité de la trajectoire dans un espace limité. La modélisation précise de la fonction Fnl et sa convexité locale jouent un rôle clé dans la réussite de cette méthode.
L’approche développée illustre une méthodologie générale applicable aux problèmes de transfert d’énergie sans fil où la dynamique spatiale intervient de manière non triviale, notamment en environnement multi-utilisateur. La stratégie de convexification combinée à une discrétisation temporelle fine est une solution robuste pour surmonter les obstacles mathématiques et physiques imposés par la nature non linéaire du phénomène.
Au-delà des détails mathématiques, il est important de comprendre que la performance d’un système de transfert d’énergie sans fil dépend fortement de la coordination entre la trajectoire de la source mobile et les propriétés physiques du canal de transmission. Les contraintes de temps, de vitesse, et d’espace influent directement sur la quantité d’énergie effectivement reçue par les dispositifs, ce qui impose un compromis délicat entre mobilité et efficacité énergétique.
Les modèles non linéaires employés reflètent aussi la réalité des circuits récepteurs, qui ne convertissent pas l’énergie de manière proportionnelle à la puissance reçue, d’où la nécessité d’intégrer cette non-linéarité dans la conception. Ignorer cet aspect conduirait à des résultats théoriques non applicables.
Enfin, la méthode présentée, bien que centrée sur un scénario de transfert d’énergie, possède un potentiel d’adaptation à d’autres problématiques de trajectoire et d’allocation de ressources dans les réseaux sans fil, où les fonctions objectives non convexes et les contraintes physiques rigoureuses sont monnaie courante.
Comment modéliser et optimiser la trajectoire d’un UAV pour le offloading computationnel en environnement urbain ?
Le modèle de propagation du signal entre un UAV (véhicule aérien sans pilote) et une station terrestre (Ground Terminal, GT) repose sur une distinction fondamentale entre les canaux en ligne de vue (LoS) et hors ligne de vue (NLoS). La probabilité qu’un lien soit en LoS dépend de l’angle d’élévation θ entre l’UAV et la station au sol, et se modélise par une fonction de la forme
avec des constantes B_i liées à l’environnement spatial, en particulier urbain, où les obstacles modifient fortement la visibilité directe. La probabilité NLoS est simplement complémentaire à celle de LoS.
Le gain du canal est alors une combinaison stochastique entre les gains en LoS et NLoS, pondérés par une variable binaire aléatoire représentant l’occurrence de chacun de ces états. La modélisation précise des gains est essentielle car elle intègre une atténuation supplémentaire μ en NLoS, reflétant la perte de puissance due à la diffraction et à la diffusion. La distance euclidienne d entre l’UAV et la station ainsi que l’angle d’élévation jouent un rôle déterminant dans ces calculs.
L’efficacité de la communication, mesurée en débit binaire, est fonction du rapport signal sur bruit (SNR), lui-même influencé par la puissance de transmission, le gain de canal et le bruit de fond. La capacité moyenne attendue du canal intègre ainsi les probabilités de LoS et NLoS, modélisant la nature aléatoire des liens sans fil dans un environnement urbain dynamique.
En matière de traitement de données, une fois les tâches déchargées des GTs vers l’UAV, ce dernier commence immédiatement leur traitement, supposant que la charge de travail est négligeable par rapport au temps de transmission. Le temps total de traitement dépend ainsi essentiellement du volume de données de la dernière tâche. Le modèle considère le nombre de cycles CPU nécessaires par donnée et la capacité de calcul de l’UAV.
Le domaine d’évolution de l’UAV est contraint par la topographie urbaine, où les bâtiments définissent un volume d’espace interdit ϒ dans un espace 3D total 𝒞. La zone accessible à l’UAV est donc le complémentaire de ϒ dans 𝒞, obligeant à un cheminement évitant strictement les obstacles. La projection au sol de ce domaine accessible coïncide avec la zone d’évolution des GTs.
Le problème d’optimisation vise à minimiser la durée totale d’opération en coordonnant simultanément la trajectoire 3D de l’UAV et la programmation temporelle des transmissions d’offloading et de réception des résultats. Cette optimisation se fait sous des contraintes multiples : contraintes d’altitude, de déplacement maximal entre instants, de non-collision avec les obstacles, et de garantie que chaque tâche est totalement transmise et réceptionnée. De plus, seules certaines GTs peuvent être servis simultanément, ajoutant une complexité combinatoire au problème.
Ce problème, à la fois mixte, non convexe, et soumis à l’aléa des petites variations de canal ainsi qu’à la mobilité imprévisible des GTs, défie les méthodes analytiques classiques. L’approche proposée est d’employer un apprentissage par renforcement profond (Deep Reinforcement Learning, DRL) fondé sur un Double Deep Q-Network (DDQN) amélioré par un réseau à architecture dueling et par propagation multi-étapes. Cette méthode permet à l’UAV d’apprendre une politique adaptative optimisant sa trajectoire via l’interaction répétée avec l’environnement, sans dépendre de la connaissance précise des positions futures des GTs.
Le cadre mathématique du DRL est un processus décisionnel de Markov (MDP), où l’état du système, les actions possibles, les probabilités de transition, et la fonction de récompense sont formalisés. Le DDQN, en séparant la mise à jour du réseau cible et du réseau en ligne, et en évaluant indépendamment la valeur d’état et la valeur d’action, améliore la stabilité et la performance de l’apprentissage.
Ce travail souligne l’importance d’intégrer de façon cohérente les modèles physiques des canaux, les contraintes géométriques imposées par l’environnement urbain, et les algorithmes d’apprentissage pour concevoir des systèmes UAV autonomes capables de gestion efficace des ressources dans des contextes complexes et incertains.
Il est essentiel de comprendre que la complexité réelle de ces systèmes ne se limite pas à la modélisation des gains de canal ou aux contraintes géométriques, mais inclut aussi la dynamique temporelle des tâches, la coordination multi-utilisateurs, et la robustesse face à l’imprévisibilité du mouvement des stations au sol. Par ailleurs, l’intégration de la théorie de l’information, des techniques avancées d’optimisation non convexe, et des algorithmes d’intelligence artificielle fait de ce domaine une interdiscipline riche, où la maîtrise des fondements physiques, mathématiques et informatiques est indispensable pour pousser les performances des UAV vers leur potentiel maximal.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский