In veel akoestische systemen is het essentieel om de tijd van vlucht van signalen nauwkeurig te schatten, bijvoorbeeld voor toepassingen in de tijd-differentie van aankomst (TDoA) of de tijd-van-aankomst (ToA) metingen. De gebruikelijke benaderingen voor het schatten van deze tijdsintervallen zijn gebaseerd op kruiscorrelatie van ontvangen signalen. Hoewel deze methoden nuttig zijn, hebben ze beperkingen in resolutie, die vaak worden beperkt door de bemonsteringsfrequentie van de analoog-naar-digitaalomzetter (ADC). Dit resulteert in een resolutie van tijd die veelal niet kleiner is dan enkele microseconden, wat kan leiden tot meetfouten in de orde van 40-60 microseconden.
Een mogelijke manier om de tijdsresolutie te verbeteren, is door gebruik te maken van fase-informatie van de ontvangen signalen. Het gebruik van fase-informatie kan een veel fijnere tijdresolutie bieden dan traditionele methoden, omdat veranderingen in fase nauwkeuriger kunnen worden gemeten dan veranderingen in het tijdsdomein.
Fase-informatie in toestelvrije systemen
In toestelvrije systemen, waar de zender en ontvanger op dezelfde plaats zijn, kan de fase van het gereflecteerde geluidssignaal een sleutelrol spelen bij het verbeteren van de tijdsmeting. Wanneer het geluidssignaal wordt gereflecteerd door een object, verandert de fase van het signaal in overeenstemming met de afstand en de tijd van vlucht. Door deze faseverandering te meten, kan de tijd van vlucht met veel grotere precisie worden bepaald dan met kruiscorrelatie.
In dit soort systemen kunnen zowel zuivere toon-signalen als chirp-signalen worden gebruikt om de fase-informatie te extraheren. Bij zuivere toon-signalen wordt de faseverandering berekend door het verschil te nemen tussen de opeenvolgende fasen, terwijl bij chirp-signalen de tijdsmeting wordt omgezet in frequentie-informatie, wat het mogelijk maakt om zeer kleine tijdsverschillen te detecteren.
Zuivere toon-signalen
Bij het gebruik van zuivere toon-signalen kunnen de fasen van de signalen worden gemeten met behulp van een coherent ontvangstsysteem. In een dergelijk systeem wordt het ontvangen signaal vermenigvuldigd met een versies van zichzelf die respectievelijk in fase en in kwartfase verschoven zijn. Na het doorgeven van het resultaat door een laagdoorlaatfilter, kunnen de in-fase (I) en de kwartfase (Q) componenten worden geëxtraheerd. De werkelijke fase van het signaal kan worden berekend door de inverse tangens van de ratio tussen de Q- en I-componenten te nemen. Door het verschil tussen opeenvolgende fasen te nemen, kan de tijdsverschuiving met een resolutie die kleiner is dan de sampletijd van de ADC worden berekend.
Deze methode heeft echter zijn beperkingen, vooral wanneer het signaal wordt verstoord door achtergrondruis of multipad-effecten. Dit kan leiden tot onnauwkeurigheden in de gemeten fasen en daarmee in de tijdsmeting.
Chirp-signalen en tijdsmeting
Chirp-signalen bieden een alternatief voor zuivere toon-signalen door de tijdsmeting om te zetten in frequentie-informatie. Een chirp-signaal is een signaal waarvan de frequentie geleidelijk verandert over de tijd, bijvoorbeeld een lineair stijgend signaal. Wanneer een chirp-signaal wordt gereflecteerd door een object, verandert de fase van het gereflecteerde signaal in overeenstemming met de tijd van vlucht. Door het ontvangen chirp-signaal te vermengen met het oorspronkelijke signaal en het resultaat door een laagdoorlaatfilter te halen, kunnen we een frequentiesignaal verkrijgen dat de tijdsverschillen representeert.
Door vervolgens de discrete Fourier-transformatie (DFT) van dit signaal toe te passen, kan de frequentie van het resulterende signaal worden gemeten, en deze frequentie geeft direct de tijdsvertraging tussen het verzenden en ontvangen van het signaal aan. De resolutie van deze tijdsmeting is afhankelijk van de bandbreedte van het chirp-signaal: hoe breder de bandbreedte, hoe nauwkeuriger de tijdsmeting. Dit betekent dat chirp-signalen in staat zijn om veel kleinere tijdsverschillen te meten dan conventionele kruiscorrelatie-gebaseerde methoden.
Faseambiguïteit en oplossingen
Een uitdaging bij het gebruik van fase-informatie voor tijdsmeting is faseambiguïteit. Faseambiguïteit ontstaat omdat de fase-informatie van een periodiek signaal modulo bekend is. Dit betekent dat bij het meten van een faseverschil tussen twee signalen, de werkelijke tijdsverschil kan worden uitgedrukt als , waarbij een willekeurig geheel getal is. Dit maakt het moeilijk om nauwkeurige tijdsmetingen te verkrijgen zonder aanvullende technieken om de ambiguïteit te verhelpen.
Een oplossing voor faseambiguïteit is het gebruik van meerdere frequenties, bijvoorbeeld door twee signalen met verschillende frequenties te gebruiken. Het verschil in fase tussen deze twee signalen kan worden gebruikt om de ambiguïteit op te lossen en zo de tijdsmeting verder te verbeteren. De frequenties van de twee signalen moeten echter zorgvuldig worden gekozen, zodat het verschil klein genoeg is om effectief een "kloppend" frequentie-effect te genereren.
Belangrijke overwegingen bij het gebruik van fase-informatie
Bij het gebruik van fase-gebaseerde technieken voor tijdmeting is het belangrijk om rekening te houden met enkele extra factoren die de nauwkeurigheid van de metingen kunnen beïnvloeden. Ten eerste moeten systeemfouten zoals draaggolffrequentieverschuivingen (CFO) en bemonsteringsfrequentieverschuivingen (SFO) worden geminimaliseerd. CFO verwijst naar het verschil tussen de bedoelde draaggolffrequentie en de werkelijke frequentie die wordt gebruikt, vaak veroorzaakt door onnauwkeurigheden in oscillatoren of Dopplerverschuivingen. SFO verwijst naar het verschil tussen de bedoelde bemonsteringsfrequentie en de werkelijke frequentie van de ADC. Deze fouten kunnen de nauwkeurigheid van fase-gebaseerde tijdsmetingstechnieken aanzienlijk verminderen.
Daarnaast kan de gebruikte bandbreedte van het signaal een grote invloed hebben op de nauwkeurigheid van de metingen. Hoe breder de bandbreedte van het gebruikte signaal, hoe hoger de tijdsresolutie die kan worden bereikt. Dit is een belangrijke overweging bij het ontwerp van akoestische systemen die fase-gebaseerde tijdmeting gebruiken.
Hoe Chirp Verspreidingsspectra en Orthogonale Modulatietechnieken de Gegevensoverdracht in Akoestische Communicatie Verbeteren
In akoestische communicatie, waar signalen vaak moeten reizen over lange afstanden met beperkte bandbreedte, is de keuze van modulatie een cruciale factor voor de efficiëntie van gegevensoverdracht. Dit veld maakt gebruik van verschillende technieken, waarbij de uitdaging ligt in het minimaliseren van interferentie en het maximaliseren van de datatransmissiesnelheid. Het gebruik van chirp-modulatie, bijvoorbeeld, heeft aanzienlijke voordelen, maar roept ook vraagtekens op qua complexiteit en prestaties.
In tegenstelling tot long-range communicatie, zoals LoRa (Low Power Wide Area Network), die kleine hoeveelheden gegevens over grote afstanden verzendt, maakt akoestische communicatie zelden gebruik van een minimumfrequentie . In plaats daarvan wordt vaak de parameter ingezet om de modulatietechnieken aan te passen, aangezien de beschikbare bandbreedte in de akoestische domeinen beperkt is. De benadering om chirp-signalen te gebruiken voor berichtmodulatie verschilt fundamenteel van technieken zoals Orthogonal Frequency Division Multiplexing (OFDM). Bij OFDM, ondanks de aanwezigheid van inter-symbol interferentie, is de interferentie tussen aangrenzende symbolen nul op de bemonsteringspunten. Hierdoor worden symbolen in OFDM als orthogonaal beschouwd. Dit wordt uitgedrukt door de relatie , waarbij en verschillende symbolen zijn, en een operatie zoals kruiscorrelatie betekent.
Het creëren van orthogonaliteit tussen signalen die gebruik maken van chirp spread spectrum (CSS) blijkt echter een complexere taak. Een oplossing voor dit probleem werd voorgesteld door de onderzoekers in [9], die Orthogonal Chirp Division Multiplexing (OCDM) introduceerden, een modulatietechniek die gebaseerd is op de Fresnel-transformatie. OCDM maakt het mogelijk om orthogonale chirps te genereren die voldoen aan de voorwaarden van de bovenstaande orthogonaliteit (). Ondanks de voordelen heeft OCDM een hoge gevoeligheid voor synchronisatieverschillen, wat de praktische toepasbaarheid ervan beperkt. Daarom maken de meeste systemen gebruik van tijdsdivisie, waarbij verschillende symbolen aan verschillende tijdsintervallen worden toegewezen.
De beperking van tijdsdivisie is echter dat het verkorten van de symbolduur noodzakelijk is om een hogere gegevenssnelheid te bereiken, wat uiteindelijk leidt tot een lagere verwerkingsefficiëntie voor chirp-gebaseerde draaggolven en een verhoogde bitfoutpercentage (BER). Om de wederzijdse interferentie tussen symbolen te verminderen, kan ook de parameter worden aangepast. In [2, 3] stellen de auteurs voor om de "losse orthogonaliteit" te gebruiken, wat betekent dat twee chirp-draaggolven en als los orthogonaal kunnen worden beschouwd als de mate van interferentie tussen de twee onder een bepaalde drempelwaarde blijft.
Dit idee werd verder uitgewerkt in [6] door het concept van "draaimomenten" in de modulatietechniek te introduceren. Hier wordt de modulatiewaarde gebruikt om verschillende "draaimomenten" in de chirps te creëren, wat leidt tot een hogere modulatiedichtheid, namelijk quadratuur orthogonaal sleutelbeheer (QOK). Door het gebruik van draaimomenten worden verschillende symbolen in de chirps gemaakt, die hoewel ze dezelfde frequentie en duur hebben, toch onderscheidbaar zijn door hun verschillende draaimomenten. Dit verhoogt de modulatiedichtheid en verbetert zo de gegevensoverdracht.
Daarbij werd de modulatietechniek verder uitgebreid, waarbij naast de teken van de modulatiecoëfficiënt ook het frequentiebereik als extra parameter werd ingezet. Hoewel het gelijktijdig gebruik van meerdere carriers binnen hetzelfde tijdsinterval normaal gesproken zou leiden tot inter-carrier interferentie (ICI), toonde het onderzoek aan dat, mits de interferentie laag genoeg blijft, deze techniek kan worden toegepast om de modulatiedichtheid te verhogen, wat kan leiden tot een gegevensoverdrachtsnelheid van 1 kbps. Dit is een aanzienlijke verbetering ten opzichte van de traditionele technieken die slechts enkele tientallen bps haalden.
De demodulatie van CSS-signalen vereist vaak aanzienlijke rekenkracht, omdat dit afhankelijk is van gematchte filtering. Het primaire doel van een gematcht filter is om het inkomende signaal te correleren met een vooraf gedefinieerd sjabloon. Het gedetecteerde symbool wordt bepaald op basis van de correlatieresultaten. Bij hoge-modulatietechnieken, waarbij elk informatiesymbool zijn eigen unieke referentiesjabloon heeft, vereist dit een herhaalde berekening voor elk mogelijk symbool.
In de context van akoestische communicatie speelt de structuur van een akoestisch frame een belangrijke rol. Een typisch frame is opgebouwd uit drie essentiële delen: een preamble, datasymbolen en een beschermingsinterval tussen opeenvolgende frames. Het preamble-gedeelte helpt de ontvanger het frame te detecteren. Dit preamble-gedeelte maakt vaak gebruik van een chirp-draaggolf die de volledige toegestane bandbreedte en tijdsduur benut, wat de detectiesensitiviteit verhoogt. Het beschermingsinterval heeft als doel de negatieve effecten van multipadpropagatie te verminderen en inter-symbol interferentie (ISI) te minimaliseren.
Wanneer zowel de zender als de ontvanger statisch zijn en de communicatieafstand kort is, kan eenvoudige matched filtering effectief de informatie-symbolen extraheren. In dynamische omstandigheden, echter, zijn geavanceerdere signaalverwerkingsstappen nodig om een betrouwbare prestaties te garanderen. Een van de uitdagingen in akoestische communicatie is de beperkte coherentie van het kanaal, wat traditionele technieken zoals kanaalequalisatie ineffectief maakt. Het onderzoek heeft echter enkele methoden voorgesteld om deze uitdagingen aan te pakken, zoals het schatten van kanaalomstandigheden op basis van vooraf gedefinieerde symbolen.
Hoe kunnen de Fysiologische en Gedragsmatige Aspecten van HRTF-estimatie de Geluidslokalisatie en Hoorgezondheid Verbeteren?
De akoustische impedanties van blootgestelde huid kunnen de gesimuleerde HRTF's (Head-Related Transfer Functions) beïnvloeden [17]. Dit heeft gevolgen voor de nauwkeurigheid van de simulatie van HRTF’s, waarbij de benaderingen die worden gebruikt om de convergentie van numerieke methoden te versnellen, onnauwkeurigheden in de uitkomsten kunnen introduceren. Het resultaat is dat gesimuleerde HRTF's een redelijk nauwkeurigheid vertonen bij lage tot middelhoge frequenties, tot ongeveer 6 kHz, maar grotere afwijkingen vertonen bij hogere frequenties [17].
HRTF's zijn sterk afhankelijk van de fysieke structuur van de luisteraar, wat vele studies heeft aangespoord om indirecte schattingen van deze functies te maken met behulp van antropometrische gegevens. Er zijn verschillende benaderingen ontwikkeld om deze doelstelling te bereiken, die verder kunnen worden onderverdeeld in drie sub-benaderingen.
De eerste benadering, adaptatie, begint met een niet-gepersonaliseerde HRTF. Door een schaalverandering in het frequentiedomein toe te passen, kan individualisatie worden bereikt [47]. De schaalfactoren voor dit proces kunnen worden afgeleid uit metingen van het hoofd en de oorschelp [48]. Subjectieve evaluaties met 9-11 deelnemers toonden een verbeterde nauwkeurigheid in geluidslokalisatie in vergelijking met het gebruik van niet-gepersonaliseerde HRTF's. Verdere verbetering kan worden gerealiseerd door frequentieschaling te combineren met ruimtelijke rotatie om rekening te houden met de hoofdhelling [45].
Een tweede benadering maakt gebruik van de "nearest-neighbor"-methode. Hierbij wordt eerst de meest vergelijkbare HRTF-set geselecteerd uit een database op basis van antropometrische metingen. De overeenkomst tussen twee individuen kan direct worden bepaald aan de hand van hun morfologische kenmerken [85] of via kenmerken die door een neuraal netwerk worden gegenereerd [75]. Daarna kunnen de adaptatietechnieken van de vorige benadering worden toegepast voor verdere verfijning.
De derde benadering is regressie, waarbij wordt geprobeerd een wiskundige of probabilistische relatie vast te stellen tussen de antropometrische metingen en de bepalende kenmerken van HRTF’s. Vaak wordt Principal Component Analysis (PCA) gebruikt om het aantal input- en/of outputvariabelen te verminderen [29]. In sommige gevallen wordt een lineair model verondersteld, en worden HRTF’s voor een nieuw individu voorspeld op basis van de antropometrische parameters van deze persoon. Hoewel subjectieve evaluaties goede overeenstemming meldden bij verschillende horizontale hoeken, werd de prestaties met betrekking tot verticale hoeken niet onderzocht.
Daarnaast zijn er indirecte benaderingen die zijn gebaseerd op perceptuele feedback. In deze benadering wordt een referentiegeluid, zoals Gaussiaanse ruis of muziekfragmenten, verwerkt met behulp van geselecteerde HRTF’s uit een dataset en gepresenteerd aan de luisteraar via een koptelefoon om virtuele 3D-geluidsbelevingen te genereren. De luisteraar beoordeelt deze geluidsvoorstellingen op basis van hoe nauwkeurig de waargenomen geluidslocatie overeenkomt met de werkelijke bronlocatie. Nadat de K-subjecten die het meest overeenkomen met de luisteraar zijn geïdentificeerd, kan de uiteindelijke HRTF van de luisteraar worden bepaald door middel van selectie- of adaptatietechnieken. Het gebruik van adaptatiemethoden biedt vaak verbetering, maar heeft doorgaans langere kalibratietijden nodig.
Het creëren van technieken voor eenvoudige en nauwkeurige schatting van gepersonaliseerde HRTF’s zonder de behoefte aan gespecialiseerde hardware blijft een belangrijk onderzoeksgebied. De mate van nauwkeurigheid die vereist is, hangt echter af van de beoogde toepassingen. Menselijk gehoor is opmerkelijk robuust tegen subtiele variaties in HRTF's en kan zich aanpassen aan aanzienlijke veranderingen. Bijvoorbeeld, hoewel oordopjes, oorstukjes en elektronische gehoorapparaten HRTF's kunnen veranderen en de ruimtelijke gehoorcues kunnen beïnvloeden, hebben studies aangetoond dat training met feedback het menselijk brein in staat stelt zich aan te passen binnen 5 tot 8 uur na de wijziging [46]. Opmerkelijk is dat deze aanpassingen in de perceptie van de auditieve ruimte maandenlang kunnen aanhouden, zelfs zonder voortdurende blootstelling aan de geleerde cues. Daarom is het belangrijk bij het beoordelen van methoden voor HRTF-individualisatie zowel kwantitatieve maatstaven, zoals vervormingsniveaus, als kwalitatieve maatstaven op basis van perceptuele evaluaties in overweging te nemen.
Bij het ontwerpen van toepassingen voor het verbeteren van geluidslokalisatie en het personaliseren van audiotechnologieën, is het van belang te begrijpen dat er grenzen zijn aan hoe nauwkeurig en gedetailleerd deze technologieën moeten zijn. Geluidssignalen kunnen variëren afhankelijk van verschillende omgevingsfactoren, en zelfs de kleinste onnauwkeurigheden in HRTF-simulaties kunnen de luisterervaring sterk beïnvloeden. Terwijl de technologieën zich blijven verbeteren, moeten ontwerpers en onderzoekers zich ervan bewust zijn dat de effectiviteit van deze aanpassingen sterk afhankelijk is van de mate waarin ze kunnen worden afgestemd op de unieke fysieke kenmerken van elke gebruiker.

Deutsch
Francais
Nederlands
Svenska
Norsk
Dansk
Suomi
Espanol
Italiano
Portugues
Magyar
Polski
Cestina
Русский