Akustiska kanaler har väldigt olika egenskaper beroende på om de är fasta material eller luftburna. Till exempel, i fasta material är akustisk dispersion mer framträdande, medan luftburna kanaler är kraftigt påverkade av temperatur, luftfuktighet och lufttryck. För att uppskatta kanalens impulsrespons (CIR) sänds en känd referenssignal (pilot signal) och den mottagna signalen spelas in. Det finns olika typer av vågformer som kan användas som pilot signal, som till exempel chirp-signaler, impulssignaler eller pseudo-slumpmässiga binära sekvenser som maximal längd-sekvenser (MLS) eller M-sekvenser, som beskrivs i avsnitt 2.3.
En enkel metod för att uppskatta CIR är att dekonvolvera den mottagna signalen med den sända pilot signalen. Denna metod kan effektivt implementeras i frekvensdomen, men den ignorerar signalens brusspektrum och kan leda till stora fel vid frekvenskomponenter i pilot signalen med mycket låga magnituder. Därför är denna metod endast lämplig för bredbands-pilot signaler. Frekvensdomänens representation ger inte mycket information om de geometriska egenskaperna hos kanalen, som till exempel antalet vägar och deras respektive fördröjningar. Dessa egenskaper är viktiga för många akustiska mätapplikationer, som till exempel i akustisk sensing.
För att få CIR i tidsdomänen kan man utföra en invers diskret Fouriertransform (IDFT) på den resulterande spektrala kanalresponsen. Under antagandet om linjära tidsinvarianter (LTI) och Finita Impulsrespons (FIR)-kanaler ges relationen mellan pilot och mottagna signaler av en ekvation där varje tap motsvarar en specifik fördröjning och dess associerade vikt (koefficient). För att uppskatta tapparna formuleras systemet i matrisform, där en matris för pilotsekvensen används för att lösa denna relation. MMSE (minimum mean square error) metoden, även känd som FIR Wiener-filter, finner de optimala tapviktningarna genom att använda statistiken för ingångs- och utgångssignaler för att minimera det genomsnittliga kvadratiska felet mellan den uppskattade signalen och den mottagna signalen.
Eftersom det i praktiken är omöjligt att exakt beräkna kovarianser, och eftersom matrisinversion är kostsam, används ofta metoder som Least Mean Squares (LMS)-algoritmen för att iterativt närma sig det optimala Wiener-filtret genom gradientnedstigning. I denna algoritm uppdateras vikterna genom att använda de observerade ingångs- och utgångssignalerna.
Akustiska simuleringar spelar en viktig roll i den här processen. De är baserade på fysikaliskt fundamenterade beräkningsmodeller som förutspår hur ljud sprider sig och interagerar med olika miljöer. Dessa verktyg är särskilt användbara vid design och tidiga tester av akustisk kommunikation och sensing-algoritmer. Simuleringarna erbjuder fördelar som upprepbarhet, kontroll och förmågan att undvika kostnader och tidskrävande experiment. Numera, med framväxten av datatunga maskininlärningsmodeller, har akustiska simuleringar blivit ett värdefullt verktyg för att generera storskaliga, märkta datamängder till låg kostnad. Men beroende på de förenklingar som görs i modellerna kan dessa simuleringar ibland kompromissa med noggrannheten för att uppnå beräkningsmässig effektivitet.
Det finns två huvudsakliga metoder för akustiska simuleringar: vågbaserade metoder och geometriska metoder. Vågbaserade metoder utgår från att akustiska signaler är vågor som rör sig genom ett medium. Den akustiska tryckfältet som ljudvågorna genererar följer vågekvationen, som är beroende av faktorer som ljudhastighet och mediets densitet. Denna metod kräver ofta numeriska lösningar, som finita differensmetoder, gränselementmetoder eller finita elementmetoder, för att kunna hantera komplexa akustiska kanaler.
Geometrisk akustik, eller strålakustik, innebär att ljudvågornas spridning approximeras som strålar. Denna metod ger en bra approximation när ljudvågens våglängd är mycket mindre än de karakteristiska dimensionerna i miljön, vilket gör den användbar för enklare miljöer utan komplexa reflektioner eller diffusionsfenomen. För mer komplicerade miljöer där ljud reflekteras eller bryts av objekt och ytor, används ofta mer avancerade modeller som tar hänsyn till dessa effekter.
För att kunna tillämpa dessa metoder på akustisk sensing och kommunikation krävs förståelse för både de teoretiska aspekterna av ljudspridning och de tekniska verktygen som gör det möjligt att simulera och analysera dessa fenomen. Att förstå hur dessa simuleringar genomförs, vilka förenklingar som görs och vilka potentiella felkällor som kan uppstå är avgörande för att få ut maximal nytta av simuleringsdata.
Hur Rörelseartefakter Påverkar Vitala Tecken: Utmaningar och Lösningar
Rörelseartefakter kan skapa förskjutningar som inte bara är oförutsägbara utan även betydligt större än de små rörelser som orsakas av vitala tecken. Denna skillnad leder ofta till plötsliga förändringar i intervallet av bin, som motsvarar den övervakade individen. En kritisk påverkan är att systemets samplingsfrekvens kan vara otillräcklig för att fånga dessa snabba variationer i binen, vilka bär vitala teckeninformation. En annan stor utmaning är svårigheten att korrekt identifiera bröstreflexen när interferens från andra rörliga kroppsdela, som händer eller huvud, gör det nästan omöjligt att detektera på ett korrekt sätt. Dessutom kan frekvensinnehållet hos vissa rörelseartefakter, såsom kroppsrörelse modulerad av benrörelser eller löpning på löpband, sammanfalla med vitala teckens frekvensområde och orsaka allvarlig interferens.
En annan försvårande faktor är det spatiala överlappet mellan rörelseartefakter och vitala tecken, vilket gör att spatiala filtreringsstrategier som beamforming blir oanvändbara. Därför, för att säkerställa noggrannhet, har de flesta föreslagna metoderna resorterat till att helt enkelt kassera de tidsperioder som påverkas av rörelseartefakter.
Den dispersiva karaktären hos det akustiska kanalen kan ytterligare försvåra den noggranna identifieringen av topparna som motsvarar de vitala tecknen. Idealiskt sett bör binet f2., som visas i Fig. 6.2b, unikt motsvara den bärande signalen vars fas är modulerad av vitala tecken, förutsatt att upplösningen av räckvidden är tillräcklig för att lösa den största förskjutningen orsakad av dessa tecken. I praktiken kan dock även angränsande bins till f2., både till vänster eller höger, också innehålla vitala teckensignaler inom sina faser, ibland till och med med en bättre signal-till-brusförhållande (SNR). Detta fenomen försvårar tillvägagångssättet för att extrahera den förskjutning som orsakas av vitala tecken.
En intuitiv lösning skulle kunna vara att sampla faserna från flera angränsande bins och sedan tillämpa huvudkomponentanalys (PCA) för att lösa detta problem. Men effektiviteten hos denna metod är vanligtvis begränsad till statiska scenarier. Detta leder till att metoden har sina begränsningar när det gäller att hantera rörelseartefakter i dynamiska miljöer.
De vitala tecknen, nämligen andning och hjärtslag, är också spatialt kolokaliserade och kan därmed inte separeras med hjälp av rumsliga tekniker, vilket leder till ömsesidig interferens. En betydande utmaning uppstår från den stora skillnaden i amplitud mellan dessa två vitala tecken. Att detektera den svagare signalen, hjärtslaget, kräver tillräcklig känslighet, som kanske uppnås genom att förbättra upplösningen av räckvidden via interpolation. Ökad känslighet gör dock systemet mer mottagligt för interferens. När känsligheten är hög kan kvantiseringsfel som orsakas av variationer i range bins under samplingsperioden för den större andningssignalen skapa brus i fasen, vilket potentiellt kan dölja de svaga hjärtslagssignalerna. Å andra sidan, om känsligheten är låg, tillräcklig för att fånga andningen men inte optimerad för hjärtslaget, finns det en hög sannolikhet att hjärtslagssignalen kommer att missas.
Att öka antalet prov och utföra en lång sekvens av snabb Fouriertransformering (FFT) kan föreslås för att öka känsligheten för hjärtslag, vilket skulle kompensera för den reducerade känsligheten. Men denna metod kan bara ge statistisk information, såsom hjärtfrekvensen, över en längre mätperiod, och skulle inte vara effektiv för att snabbt detektera oregelbundna hjärtslagsmönster.
Nuvarande forskning inom akustisk baserad fysiologisk övervakning fokuserar främst på att extrahera statistisk information som hjärtfrekvens eller andningsfrekvens, ofta med hjälp av spektral analys under statiska förhållanden. Återställningen av detaljerade vågformer, särskilt för hjärtslag, under ogynnsamma kanalförhållanden såsom rörelseartefakter, förblir huvudsakligen oupptäckt. Trots detta har vissa preliminära insatser gjorts för att uppnå rörelsebeständig vital signalsensorering. De grundläggande principerna i dessa initiala förslag är lovande och kan potentiellt stimulera vidare forskning inom detta område.
Föreslagna metoder kan grovt delas in i två kategorier: analytiska signalbehandlingsmetoder och lösningar som använder djupinlärningstekniker.
Analytiska signalbehandlingsmetoder drar nytta av tolkningsbara modeller som beskriver signalernas dynamik väl. Effektiviteten hos dessa metoder beror i hög grad på de utformade modellerna. I arbetet av CORA utnyttjar forskarna den betydande skillnaden i amplitud mellan andning och rörelseartefakter. För att exploatera detta använder de två typer av signaler: frekvensmodulerad kontinuerlig våg (FMCW) och ortogonal tidsfrekvensrymd (OTFS).
Djupinlärningstekniker har också visat sig vara kraftfulla, även om de ofta inte är förklarbara. Exempel på detta är BreathListener, som använder smartphones för att uppskatta detaljerade andningsvågformer i körscenario. Ett annat exempel är SpiroSonic, som använder flera rena toner för att detektera en kombinerad signal av rörelse och andning, och därefter använder neurala nätverksbaserade efterbehandlingsmetoder för att minska påverkan av milda rörelseartefakter.
Endtext

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский