In draadloze communicatie worden vaak vooraf bekende preambules gebruikt om kanaalschattingsprocessen te ondersteunen. Deze schattingen helpen bij het compenseren van verstoringen in draaggolfsignalen, wat uiteindelijk de bitfoutpercentage (BER) vermindert. In de context van lucht-akoustische communicatie (AAC) blijkt deze compensatie echter slechts effectief wanneer deze binnen een coherente tijdsinterval wordt uitgevoerd, waarin de kanaalrespons relatief constant blijft. Dit roept twee belangrijke uitdagingen op in AAC. Ten eerste is de coherente kanaaltijd erg kort, vaak slechts een paar milliseconden in een typische binnenruimte (zoals 8 ms, zoals aangegeven in [7]). Hierdoor is het gebruik van lange trainingssequenties onpraktisch vanwege de lage datasnelheid. Ten tweede vereist kanaalcompensatie vaak complexe berekeningen in real-time, wat een uitdaging kan zijn voor IoT-apparaten met beperkte verwerkingscapaciteit.

Meting en analyse van akoestische stabiliteit

Om meer inzicht te krijgen in de stabiliteit van akoestische signalen, werd een serie metingen uitgevoerd om cruciale parameters zoals frequentie, fase en amplitude te evalueren, die mogelijk nuttig kunnen zijn voor modulatie. De experimenten werden uitgevoerd met behulp van een desktopcomputer die een zuivere toon van 20 kHz afspeelde via een 3,5mm-audiojack, versterkt door een 20 W klasse-A versterker om vervormingen te verminderen. Het signaal werd vervolgens uitgezonden via een 10-inch luidspreker. Een Samsung Galaxy S5 smartphone, op een afstand van 20 cm van de luidspreker, registreerde het uitgezonden signaal met een op maat gemaakte applicatie. Deze applicatie, gebouwd op de Android AudioTrack-klasse, registreerde onbewerkte PCM-gegevens, zonder enige interne softwarefiltering. De metingen werden gedurende 40 seconden uitgevoerd in een kantooromgeving, met een gemiddeld achtergrondgeluidsniveau van ongeveer 44 dB, met pieken die soms 76 dB overschreden door omgevingsgeluiden zoals menselijke spraak, toetsenbordaanslagen en deskgeluiden.

De verkregen resultaten toonden aan dat het frequentiespectrum van het akoestische signaal relatief stabiel bleef, wat suggereert dat modulatie mogelijk is via frequentiemodulatie. Echter, zowel de amplitude als de fase vertoonden aanzienlijke fluctuaties. Het amplitude-envelope vertoonde grote variaties, van een piek van 1 tot bijna nul. Dit maakt amplitude-modulatie een ongeschikte keuze voor AAC, omdat de onbetrouwbaarheid ervan het moeilijk maakt om het signaal nauwkeurig te encoderen. De fase vertoonde een bijna lineaire toename over tijd, met fasen verschuivingen van meer dan 10 radialen over een interval van 10 seconden, wat de infrequentie van fase-gebaseerde modulatie in real-world akoestische omgevingen verklaart.

Uitdagingen van amplitude en fase in AAC

De onbetrouwbaarheid van zowel amplitude als fase in akoestische communicatie is te wijten aan verschillende factoren. Wat betreft de amplitude, is achtergrondinterferentie een belangrijke oorzaak van onbetrouwbaarheid. Bovendien zorgt de automatische versterkingsregeling (AGC) in akoestische systemen voor extra complicaties. Wanneer er plotselinge harde geluiden optreden, zoals een klap op een bureau, kan de AGC het volume verlagen om te voorkomen dat het signaal wordt vervormd. Dit heeft als gevolg dat de AGC de versterking vermindert, wat de intensiteit van andere signalen vermindert. Dit dynamische proces maakt amplitude-modulatie onpraktisch voor AAC.

Wat de fase betreft, ontstaan er vaak grote afwijkingen door de aanwezigheid van een draagfrequentie-offset (CFO) of een samplefrequentie-offset (SFO). Deze afwijkingen ontstaan doordat de samplefrequenties van verschillende apparaten vaak niet perfect zijn afgestemd, wat leidt tot een opeenstapeling van fouten in de tijd. In traditionele radiosystemen kunnen dergelijke afwijkingen worden gecorrigeerd met behulp van kanaalequalisatie technieken. In akoestische systemen is een dergelijk compensatiemechanisme echter niet praktisch vanwege de beperkte rekenkracht en hardwarecapaciteit van de gebruikte apparaten. Dit verklaart waarom frequentiemodulatie vaak de voorkeur heeft in AAC-systemen, aangezien deze techniek robuuster is tegen deze type verstoringen.

Frequentieshiftmodulatie (FSK) in AAC

Frequentieshiftmodulatie (FSK) is een digitale techniek die veel gebruikt wordt in draadloze systemen voor het verzenden van digitale informatie. FSK maakt gebruik van frequentiemodulatie, waarbij de draaggolffrequentie van het signaal varieert afhankelijk van de binaire input. In FSK wordt de draagfrequentie tussen twee discrete frequenties geschakeld: een voor een binaire “1” en de andere voor een binaire “0”. In de praktijk wordt de frequentie van de draaggolf aangepast op basis van het binaire signaal, bijvoorbeeld door de frequentie van 19 kHz toe te wijzen aan een "1" en 22 kHz aan een "0". Dit maakt het mogelijk om digitale informatie te coderen in de frequentiedomein.

FSK is bijzonder nuttig in akoestische communicatie omdat het robuuster is tegen kanaaldistoringen, zoals de eerder genoemde amplitude- en faseinstabiliteit. Door het gebruik van frequentiemodulatie kan het systeem de data toch nauwkeurig overbrengen, zelfs als er lichte verstoringen in het signaal optreden. Dit heeft als gevolg dat FSK een effectieve keuze is voor het realiseren van betrouwbare communicatie in de lucht-akoustische systemen.

Wat verder te overwegen?

Het gebruik van FSK en andere modulatie-technieken in AAC vereist een gedegen begrip van de omgevingsinvloeden op akoestische signalen. Het is belangrijk om de interactie van de automatische versterkingsregeling en achtergrondruis in overweging te nemen, evenals de beperkingen van de gebruikte apparaten. Bij het ontwerpen van een robust AAC-systeem moeten ontwerpers rekening houden met de korte coherente tijd van het kanaal, de rekenkrachtbeperkingen van de IoT-apparaten en de noodzaak om modulatie te kiezen die ongevoelig is voor de genoemde verstoringen.

Hoe Acoustic Tracking Technologieën de Nauwkeurigheid van Objectvolging Verbeteren

In de wereld van geluidsgebaseerde tracking zijn er diverse technologieën ontwikkeld die de nauwkeurigheid van objectvolging in verschillende toepassingen verbeteren. Een van de meest geavanceerde benaderingen is het gebruik van zowel device-based als device-free tracking. De technologieën maken gebruik van akoestische signalen die via verschillende methoden worden gemeten en verwerkt, met als doel het nauwkeurig volgen van objecten in zowel gecontroleerde als dynamische omgevingen.

MilliSonic is een voorbeeld van een systeem dat sub-millimeter nauwkeurigheid biedt bij het volgen van objecten in 1D met behulp van een enkele beacon. Dit systeem presteert zelfs goed in omgevingen met multipath-interferentie, wat het robuust maakt voor diverse scenario’s. Dit soort technologieën maakt het mogelijk meerdere apparaten tegelijkertijd te volgen door gebruik te maken van een TDMA-schema (Time Division Multiple Access), wat de efficiëntie en nauwkeurigheid van de tracking verbetert.

Naast device-based tracking, waarbij een apparaat wordt bevestigd aan het object dat gevolgd moet worden, is er ook device-free tracking, die het mogelijk maakt om passieve objecten in een omgeving te volgen zonder dat ze een specifiek apparaat bij zich dragen. Deze benadering maakt gebruik van reflecterende akoestische signalen, waarbij de verzwakking van de signalen een uitdaging vormt voor het behalen van hoge precisie. Vaak wordt device-free tracking beperkt tot toepassingen met een korte afstand, zoals interactie tussen mensen en computers.

FingerIO is een technologie die een mobiele telefoon of een smartwatch omtovert tot een actieve sonar, die in staat is om bewegende vingers te volgen. Het stelt gebruikers in staat om fysiek te interageren met hun apparaat op een manier die de grenzen van traditionele interfaces overschrijdt. De technologie bereikt een mediane nauwkeurigheid van 8 mm binnen 5,92 ms door gebruik te maken van OFDM-gecodeerde signalen voor het schatten van de Channel State Information (CSI) tussen de hand en het smartphone-apparaat. Dit stelt het systeem in staat om vingerbewegingen te volgen door opeenvolgende channel frames met elkaar te vergelijken. De techniek is in staat om robuust vingerbewegingen te detecteren en werd de basis voor verschillende vervolgonderzoeken.

Een ander belangrijk systeem in deze categorie is LLAP, een multitone device-free gebaarvolgsysteem. LLAP maakt gebruik van coherente detectie om de fasen van akoestische echo’s te extraheren en de positie van de vinger te lokaliseren. Het systeem levert een nauwkeurigheid van 3,5 mm voor handbewegingen in 1D en 4,57 mm voor tekenbewegingen in 2D, met een latentie van minder dan 15 ms. Hoewel zowel FingerIO als LLAP gevoelig zijn voor interferentie van nabijgelegen apparaten, heeft Strata een oplossing ontwikkeld die gebruik maakt van een coherente detector en een GSM-trainingssequentie die is gemoduleerd door BPSK (Binary Phase Shift Keying). De evaluatieresultaten tonen aan dat Strata de andere systemen in alle gevallen overtreft met een gemiddelde trackingnauwkeurigheid van 3 mm.

Voor grotere lichaamsdelen, zoals de handen of het volledige lichaam, wordt vaak gebruik gemaakt van krachtigere luidsprekers om het bereik van het systeem te vergroten. Het systeem dat in een recente studie werd voorgesteld, maakt gebruik van een akoestisch radarplatform in combinatie met geavanceerde verwerkingsmethoden zoals MIMO (Multiple-Input Multiple-Output) beamforming en deep learning om de signaalkwaliteit te verbeteren. Dit systeem bereikt trackingfouten tussen 1,2 cm en 3,7 cm binnen een bereik van 4,5 meter en ondersteunt multiuser tracking.

CovertBand is een ander actief meetsysteem dat gericht is op het volgen van meerdere objecten. Dit systeem maakt gebruik van dezelfde parametermodellen als FingerIO, maar breidt de technologie uit door gebruik te maken van actieve sonar. CovertBand heeft een mediane nauwkeurigheid van 18 cm voor het volgen van mobiele doelen en een nauwkeurigheid van 8 cm voor statische objecten tot een afstand van 8 meter in line-of-sight (LOS) omstandigheden.

De bovenstaande systemen hebben in verschillende toepassingen aangetoond dat ze in staat zijn nauwkeurigheid op centimeter-niveau te bereiken, vooral door het gebruik van time-of-flight en Doppler-metingen van akoestische golven. Dit maakt het mogelijk om objecten van verschillende groottes en bewegingskenmerken te volgen, variërend van kleine handheld apparaten tot volledige lichaamsbewegingen.

Hoewel deze technieken indrukwekkende vooruitgangen hebben geboekt, blijven er enkele beperkingen. Geluidsoverlast in omgevingen met veel ruis vormt een uitdaging, omdat de prestaties van de tracking aanzienlijk kunnen worden aangetast door storingen. Bovendien kunnen er problemen ontstaan wanneer meerdere akoestische systemen tegelijkertijd werken in dezelfde ruimte, wat kan leiden tot interferentie, botsingen bij transmissies of het verwisselen van identificaties. Toekomstig onderzoek zou zich moeten richten op robuuste technieken voor ruisonderdrukking, adaptieve signaalverwerking en efficiënte strategieën voor het delen van media of spectrum om de betrouwbaarheid en schaalbaarheid van akoestische volgsystemen te verbeteren.

Hoe Gevoelige HRTF Metingen en Simulaties Persoonlijk Gemaakt Kunnen Worden

Het meten van de Head-Related Transfer Function (HRTF) is een cruciaal onderdeel in de studie van de geluidsperceptie, vooral bij toepassingen zoals 3D-geluidsimulaties en virtual reality. De meest nauwkeurige manier om deze functie te verkrijgen, is door gedetailleerde akoestische metingen uit te voeren in een anechoïsche kamer. Dit proces houdt in dat luidsprekers rondom een proefpersoon worden geplaatst in alle relevante richtingen, terwijl microfoons aan de ingang van hun gehoorgangen worden geplaatst om de impulsresponsen op te nemen. Hoewel deze methode als de gouden standaard wordt beschouwd, is het ook intensief voor zowel de proefpersoon als de onderzoekers. De proefpersoon moet vaak lange tijd immobiel blijven, wat fysiek belastend kan zijn.

Om het meten efficiënter te maken, wordt in sommige gevallen de techniek van de meervoudige exponentiële sweep (MESM) toegepast, waarbij excitatie-signalen in de tijd overlappen. Dit vereist echter een nauwkeurige timing om de superpositie van verschillende impulsen te vermijden. Er bestaan alternatieven zoals de wederkerige techniek, waarbij twee kleine luidsprekers in de oren van de proefpersoon worden geplaatst en microfoons op een boog rondom het hoofd van de proefpersoon worden geplaatst. Hoewel deze methode de metingstijd kan verkorten, brengt het gebruik van in-ear luidsprekers ook nadelen met zich mee. Aangezien de geluidssterkte die door deze luidsprekers wordt gegenereerd beperkt is, kan dit resulteren in een laag signaal-ruisverhouding, wat de nauwkeurigheid van de metingen aantast.

Nieuwe benaderingen proberen de tijdrovende aard van deze directe metingen te overwinnen door gebruik te maken van gesimuleerde benaderingen en spaarzaam verkregen gegevens. Een interessante methode werd ontwikkeld door Zandi et al., die gebruik maken van een algoritme voor de individualisatie van HRTF, waarbij met behulp van mobiele apparaten nauwkeurige HRTF-schattingen kunnen worden verkregen met slechts een handvol metingen. Dit algoritme maakt gebruik van een variatiële auto-encoder om de HRTF van een gebruiker aan te passen op basis van metingen van slechts 60 posities, die in ongeveer vijf minuten kunnen worden verzameld. Dit heeft geleid tot een aanzienlijke vooruitgang in de toegankelijkheid van HRTF-verwervingsmethoden, vooral voor consumenten.

Aan de andere kant biedt numerieke simulatie een alternatieve aanpak die vooral nuttig is wanneer directe metingen niet mogelijk of praktisch zijn. In plaats van het fysieke proces van meten in een anechoïsche kamer, wordt hier een gedetailleerd 3D-model van het hoofd en de oren van de proefpersoon gebruikt als input voor simulatiesoftware. Dit model kan bijvoorbeeld worden verkregen via magnetische resonantiebeelden (MRI) of goedkope 3D-scanningstechnologieën zoals Apple’s FaceID sensor. Het voordeel van simulatie is dat het geen speciale apparatuur zoals luidsprekers of een anechoïsche kamer vereist, wat het proces aanzienlijk toegankelijker maakt. Het model berekent vervolgens de HRTF door numerieke technieken toe te passen op de geluidsgolven die zich door de oren van de gebruiker voortplanten.

Hoewel simulatie een veelbelovende benadering is, zijn er ook enkele beperkingen. De belangrijkste daarvan is het verkrijgen van een kwalitatief hoogstaand 3D-model van het hoofd en de oren van de proefpersoon. Het model moet nauwkeurig de geometrie van het hoofd vastleggen, zonder gaten of onnauwkeurigheden die de simulatie kunnen verstoren. Verder kunnen externe factoren zoals gezichtsbeharing of vochtigheid de nauwkeurigheid van de simulatie beïnvloeden, aangezien deze aspecten invloed hebben op de geluidsweerkaatsing en -diffusie. Dit maakt het verkrijgen van een hoogwaardig mesh-model een technisch uitdagende en tijdrovende taak, wat kan leiden tot onnauwkeurigheden in de uiteindelijke HRTF-schattingen.

Bij het gebruik van simulaties is het cruciaal om niet alleen de geometrie van het hoofd goed vast te leggen, maar ook om ervoor te zorgen dat het simulatie-algoritme effectief werkt over het volledige frequentiebereik. De nauwkeurigheid van de simulatie kan sterk variëren afhankelijk van hoe goed het model de fysische eigenschappen van het hoofd en de oren reproduceert. Dit maakt simulaties een krachtige, maar ook veeleisende methode voor het verkrijgen van gepersonaliseerde HRTFs.

De simulatiemethoden bieden een gedetailleerder en accurater resultaat dan oudere benaderingen, zoals de antropometrische metingen of het gebruik van vereenvoudigde mathematische modellen. Het gebruik van geavanceerde simulatiesoftware kan de mogelijkheid bieden om zelfs de fijnere anatomische details, zoals de oorplooi of de specifieke vorm van de schedel, nauwkeurig vast te leggen en mee te nemen in de berekeningen. Dit resulteert in een HRTF die veel dichter bij de werkelijke ervaring ligt, wat van groot belang is voor toepassingen die afhankelijk zijn van een zeer gedetailleerde en persoonlijke geluidsperceptie, zoals het creëren van virtual reality-omgevingen of geluidsisolatie in gehoorapparaten.

Wanneer men deze methoden in overweging neemt, is het van belang om niet alleen de voordelen van elke techniek te begrijpen, maar ook de beperkingen en de bijkomende kosten. Het kiezen van de juiste benadering, of het nu via directe metingen in een anechoïsche kamer of via simulaties, hangt af van de beschikbare middelen en de gewenste nauwkeurigheid van de uiteindelijke resultaten. Verder moeten onderzoekers zich bewust zijn van het feit dat zelfs de nieuwste technieken, zoals de variatiële auto-encoders en simulaties, nog steeds niet volledig immuun zijn voor fouten en onnauwkeurigheden. Het blijft belangrijk om de resultaten van deze methoden zorgvuldig te evalueren en, indien mogelijk, te valideren met behulp van traditionele meetmethoden.