La modulazione OFDM (Orthogonal Frequency Division Multiplexing) è una tecnica avanzata che consente di trasmettere dati su una serie di frequenze portanti ortogonali, permettendo di aumentare l'efficienza spettrale e la resistenza agli errori di sincronizzazione. Nelle comunicazioni wireless tradizionali, come il Wi-Fi, OFDM è frequentemente utilizzato insieme a tecniche di modulazione di base ad alta ordine, come la modulazione a quadratura di ampiezza (QAM), per ottimizzare l'uso della larghezza di banda. Tuttavia, nel dominio acustico, l'applicazione di questa tecnica presenta diverse sfide dovute alle caratteristiche uniche del canale acustico, come la propagazione a più vie, gli effetti Doppler e il fading selettivo in frequenza.
Nel contesto delle comunicazioni acustiche, la modulazione OFDM è spesso implementata tramite software piuttosto che tramite hardware specializzato, come avviene nei sistemi RF. Questo limita il pieno sfruttamento del potenziale di OFDM, poiché funzioni avanzate come il rilevamento della portante, la stima dello stato del canale e la correzione dello spostamento di frequenza della portante sono difficili da implementare su dispositivi acustici standard. Le difficoltà derivano soprattutto dai severi requisiti temporali e dal tempo di coerenza del canale relativamente breve tipico degli ambienti acustici.
Inoltre, nei sistemi di comunicazione acustica, i segnali OFDM sono generalmente generati tramite un sistema multi-portante di modulazione di frequenza (FSK), in cui l'informazione viene principalmente codificata tramite variazioni di frequenza e ampiezza piuttosto che tramite fase. Questo è dovuto all'instabilità intrinseca della fase nei canali acustici, che rende problematico l'uso della modulazione basata sulla fase, comune nei sistemi RF. In pratica, la modulazione ASK (Amplitude Shift Keying) è una scelta più comune per le implementazioni acustiche di OFDM, sebbene ciò comporti una riduzione dell'efficienza complessiva.
La modulazione OFDM è particolarmente adatta per applicazioni a breve distanza, dove la bassa velocità di trasmissione e l'alto Bit Error Rate (BER) possono essere tollerati, ma la sua applicazione è limitata rispetto ad altre tecniche come il Chirp, che si presta meglio a comunicazioni a lunga distanza grazie alla sua resistenza alle interferenze e al suo ampio spettro di frequenze.
Le forme d'onda per il rilevamento acustico, invece, sono progettate in modo diverso. Mentre la progettazione di forme d'onda per la comunicazione acustica enfatizza la resistenza del segnale e la minima distorsione, per il rilevamento acustico è cruciale che le caratteristiche di propagazione del segnale cambino in modo significativo in risposta alle variazioni ambientali, al fine di massimizzare la rilevabilità e migliorare la risoluzione. Pertanto, le onde acustiche utilizzate per il rilevamento devono essere progettate per rispondere in modo sensibile alle variazioni ambientali e per ottimizzare la rilevazione di oggetti o dei loro movimenti.
In molte applicazioni di rilevamento acustico, si ricorre a segnali spread spectrum (SS), grazie alle loro proprietà vantaggiose, come l'autocorrelazione a forma di puntino e la cross-correlazione prossima a zero. Questi segnali sono altamente rilevabili, resistenti agli effetti di multipath e robusti al rumore, risultando particolarmente adatti per applicazioni di rilevamento preciso. Le sequenze ortogonali come il codice GSM, il codice Barker, la sequenza M e la sequenza Zadoff-Chu (ZC) sono comunemente utilizzate nelle applicazioni di rilevamento acustico. Il codice GSM, progettato per ridurre le distorsioni del canale e equalizzare i ritardi di propagazione, e la sequenza Barker, spesso usata nei radar a compressione di impulso, sono esempi di tecniche utili in questo contesto.
Le sequenze ZC, che trovano applicazione nei moderni sistemi cellulari, tra cui LTE e 5G NR, presentano diverse caratteristiche ideali, come un'ampiezza costante, autocorrelazione ciclica nulla e proprietà di cross-correlazione ottimali, rendendole molto efficaci per la sincronizzazione e la stima del canale. In generale, queste sequenze sono particolarmente vantaggiose per i sistemi in cui la qualità della stima del canale è cruciale.
Le sequenze M, utilizzate ad esempio nei sistemi 5G, sono generate tramite un registro a scorrimento con retroazione lineare (LFSR) e presentano buone proprietà di autocorrelazione. Queste sequenze, definite deterministiche ma pseudo-casuali, sono ampiamente usate in applicazioni come la sincronizzazione. La formula matematica che definisce la sequenza M tiene conto del risultato dell'operazione XOR su coefficienti che determinano la sequenza di bit.
Le proprietà autocorrelazionali delle diverse sequenze, come quelle della sequenza ZC, sono confrontabili attraverso il rendimento delle correlazioni per ciascun tipo di sequenza, come mostrato nei grafici comparativi. La sequenza ZC, in particolare, raggiunge il miglior risultato in termini di autocorrelazione, con un solo picco acuto a ritardo zero.
L'adozione di diverse forme d'onda nei sistemi di rilevamento acustico offre vantaggi in termini di prestazioni e capacità di adattarsi a diversi ambienti acustici. La scelta della forma d'onda giusta dipende da vari fattori, tra cui la resistenza al rumore, la capacità di sincronizzazione e la precisione nella stima del canale, tutti aspetti cruciali per il successo delle applicazioni di rilevamento acustico.
Come Gestire gli Artefatti di Movimento nel Monitoraggio dei Segnali Vitali: Sfide e Soluzioni Tecnologiche
Gli artefatti di movimento possono introdurre spostamenti che non solo sono imprevedibili, ma anche significativamente più grandi dei piccoli movimenti causati dai segni vitali. Questa disparità spesso porta a cambiamenti improvvisi nelle bin del range che corrispondono all'individuo monitorato. Un impatto critico di tale fenomeno è che la frequenza di campionamento del sistema può risultare insufficiente per catturare adeguatamente queste rapide variazioni delle bin, che trasportano le informazioni relative ai segni vitali. Un altro problema principale è la difficoltà nell'identificare correttamente la riflessione toracica quando si è di fronte a interferenze causate da altre parti del corpo in movimento, come le mani o la testa, rendendo quasi impossibile una rilevazione accurata. Inoltre, il contenuto in frequenza di particolari artefatti di movimento, come i movimenti del corpo modulati dal tremolio delle gambe o dalla corsa sul tapis roulant, può coincidere con il range di frequenza dei segni vitali, causando interferenze gravi. La sovrapposizione spaziale tra gli artefatti di movimento e i segni vitali rende le strategie di filtraggio spaziale come il beamforming inutilizzabili. Pertanto, per garantire l'accuratezza, la maggior parte dei metodi proposti si limita semplicemente a scartare i periodi di tempo influenzati dagli artefatti di movimento.
Un ulteriore ostacolo è rappresentato dall'effetto dispersivo del canale acustico, che può complicare ulteriormente l'identificazione precisa del picco corrispondente ai segni vitali. Idealmente, la bin di range dovrebbe corrispondere univocamente al portatore il cui fase è modulato dai segni vitali, a condizione che la risoluzione del range sia sufficiente a risolvere il massimo spostamento causato da tali segni. Tuttavia, in pratica, le bin adiacenti potrebbero contenere anch'esse segnali relativi ai segni vitali, a volte anche con un rapporto segnale-rumore superiore, complicando ulteriormente il processo di estrazione del movimento causato dai segni vitali. Sebbene una possibile soluzione intuitiva sia quella di campionare le fasi da più bin adiacenti e applicare l'analisi dei componenti principali (PCA), questa metodologia risulta efficace solo in scenari statici.
La mutuale interferenza tra i segnali vitali, come la respirazione e il battito cardiaco, rappresenta un ulteriore problema significativo. Questi segnali sono infatti spazialmente co-locati e non possono essere separati utilizzando tecniche spaziali, creando interferenze reciproche. Un problema rilevante deriva dalla notevole differenza di ampiezza tra questi due segnali vitali. Rilevare il segnale più debole, il battito cardiaco, richiede una sensibilità sufficientemente alta, che può essere raggiunta migliorando la risoluzione del range attraverso l'interpolazione. Tuttavia, un aumento della sensibilità rende il sistema più suscettibile alle interferenze. Quando la sensibilità è alta, gli errori di quantizzazione derivanti dalle variazioni nelle bin del range durante il campionamento del segnale respiratorio maggiore possono introdurre rumore nella fase, oscurando potenzialmente i deboli segnali del battito cardiaco. Al contrario, se la sensibilità è impostata troppo bassa, per catturare solo la respirazione, c'è una grande probabilità che il segnale del battito cardiaco venga perso. Alcuni suggeriscono che l'aumento del numero di campioni e l'applicazione di una trasformata veloce di Fourier (FFT) possa migliorare la sensibilità al battito cardiaco, compensando così la ridotta sensibilità. Tuttavia, questa strategia fornisce solo informazioni statistiche, come la frequenza del battito cardiaco, su un periodo di misurazione esteso, ma non risulta efficace nel rilevare rapidamente irregolarità nel battito cardiaco.
Le ricerche esistenti nel campo del monitoraggio fisiologico si concentrano principalmente sull'estrazione di informazioni statistiche come la frequenza del battito cardiaco o la frequenza respiratoria, sfruttando l'analisi spettrale e generalmente condotte in condizioni statiche. Tuttavia, il recupero di forme d'onda dettagliate, in particolare per il battito cardiaco, in condizioni di canale avverse come gli artefatti di movimento, rimane ancora ampiamente inesplorato. Alcuni studi preliminari hanno però cercato di ottenere un monitoraggio dei segni vitali robusto agli artefatti di movimento. I principi di questi approcci iniziali sono promettenti e potrebbero stimolare ulteriori ricerche nel settore. Questi lavori si dividono in due categorie principali: i metodi di elaborazione del segnale analitica e le soluzioni basate sull'apprendimento profondo.
I metodi di elaborazione del segnale analitico si avvalgono di modelli interpretabili per descrivere adeguatamente la dinamica del segnale. L'efficacia di tali metodi dipende fortemente dalla qualità dei modelli sviluppati. Un esempio di approccio in questo ambito è il lavoro di CORA, che sfrutta la differenza significativa di ampiezza tra la respirazione e gli artefatti di movimento. Per ottenere questo, si impiegano due tipi di segnali, in particolare la frequenza modulata continua a onda (FMCW) e lo spazio ortogonale tempo-frequenza (OTFS), ognuno con sensibilità diverse. Il segnale OTFS è progettato per essere sensibile solo agli artefatti di movimento, mentre il segnale FMCW è configurato con alta sensibilità per catturare la respirazione, ma registra anche una notevole interferenza dovuta agli artefatti di movimento. La strategia dietro questo approccio è quella di sfruttare la naturale fluidità del movimento umano, consentendo ai segnali OTFS meno sensibili di recuperare efficacemente la forma d'onda degli artefatti di movimento. Questi segnali OTFS possono anche mediare le piccole variazioni causate dalla respirazione durante il campionamento degli artefatti di movimento. La forma d'onda accuratamente recuperata degli artefatti di movimento può quindi essere utilizzata per compensare il segnale FMCW, permettendo l'isolamento del segnale respiratorio attraverso un processo di sottrazione.
Le tecniche basate sull'apprendimento profondo (DL) si concentrano generalmente sugli ultimi passaggi della tipica pipeline di elaborazione del segnale. Sebbene questi approcci non siano facilmente interpretabili, hanno dimostrato di avere capacità notevoli. BreathListener, ad esempio, utilizza le capacità audio degli smartphone per stimare la forma d'onda dettagliata della respirazione in scenari di guida, impiegando una serie di tecniche di elaborazione per ridurre il rumore di fondo e ricostruire la forma d'onda. Altri approcci come SpiroSonic utilizzano toni puri per rilevare il segnale combinato di movimento e respirazione, quindi applicano tecniche di post-elaborazione basate su reti neurali per ridurre l'impatto degli artefatti di movimento leggeri. Nonostante il successo di queste tecniche basate sull'apprendimento profondo, queste spesso richiedono enormi quantità di dati di addestramento e procedure complesse, e possono soffrire di problemi legati alla generalizzabilità.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский