Het genereren van sequenties voor akoestische detectie omvat meerdere fasen. Allereerst moeten systeemparameters worden gedefinieerd, zoals de signaalbandbreedte B, de bemonsteringsfrequentie fs, de draaggolffrequentie fc, en de duur T van de waarnemingsgolfvorm. Vervolgens wordt een orthogonaal code XOC van lengte BT gegenereerd. Als de lengte niet precies gelijk is aan BT, is het aan te raden om de duur T licht aan te passen om de autocorrelatie-eigenschappen van de geselecteerde code te behouden. De resulterende code wordt vervolgens omhoog gesampled met een interpolatiefactor van fs/B om het basisbandsignaal sbase(t) te produceren. Deze interpolatie kan ook in het frequentiedomein worden uitgevoerd door nullen aan het einde van het signaal toe te voegen. Ten slotte wordt het basisbandsignaal omgezet naar een intermediaire frequentie (IF) door middel van een frequentieverschuivingsoperatie: sIF(t) = sbase(t) cos(2πfct). Het signaal sIF(t) is dan klaar voor transmissie via luidsprekers.

Aan de ontvangerzijde wordt dit proces omgekeerd. Gegeven een ontvangen IF-signaal rIF(t), is de eerste stap om het signaal omlaag te converteren naar basisband rbase(t) = LPF{rIF(t) cos(2πfct)}. Vervolgens kan een correlatieoperatie tussen rbase(t) en sbase(t) worden uitgevoerd voor nauwkeurige synchronisatie. Daarna kunnen verschillende signaalkenmerken worden geëxtraheerd uit rbase(t) voor detectie, waaronder fase, spectrum, etc.

Een voorbeeld van dit proces kan worden geïllustreerd met behulp van de complexe ZC-sequentie. Stel dat een akoestische detectieapplicatie werkt met een framerate van 100Hz, wat betekent dat de signaalduratie T = 10 ms is. Bij een bemonsteringsfrequentie van 48 kHz komt dit neer op 480 monsters per frame. Stel dat de beschikbare bandbreedte B = 4 kHz is en de draaggolffrequentie is ingesteld op fc = 20 kHz, zodat het IF-signaal zich uitstrekt over het bereik van 18-22 kHz en onhoorbaar blijft voor de mens. Gezien de bandbreedte B = 4 kHz, wordt de benodigde lengte van de orthogonale code bepaald door B × T = 4000 × 0,01 = 40. Aangezien ZC-sequenties een priemgetallengrote sequentie vereisen, wordt gekozen voor NZC = 41 met een wortelindex q = 7.

De autocorrelatiefunctie van de gegenereerde ZC-sequentie, die de uitstekende correlatie-eigenschappen aantoont, kan worden gezien in de bijbehorende grafiek. De volgende stap is het omzetten van de ZC-sequentie naar een basisband-ZC-signaal. Dit kan worden gedaan door interpolatie in het tijdsdomein of door nulvulling in het frequentiedomein. Voor het behoud van spectrale consistentie wordt in dit geval de laatste methode gekozen. Gegeven een frameduur van 10 ms, moet het resulterende basisband-ZC-signaal 480 monsters bevatten. De oorspronkelijke 41-monster ZC-sequentie wordt geïnterpoleerd om een 480-monster basisband-signaal te worden, terwijl de 4 kHz bandbreedte behouden blijft. Omdat de ZC-sequentie inherent een dubbelbandig signaal is, wordt de Fast Fourier Transform (FFT) toegepast op de oorspronkelijke 41-monster ZC-sequentie en wordt het resulterende frequentiespectrum verdeeld in twee symmetrische delen. De eerste 21 monsters, die de DC-component bevatten, worden op de eerste 21 indices van het frequentiespectrum geplaatst, en de resterende monsters worden symmetrisch gepositioneerd op de hoogste frequentie-indices om de integriteit van het spectrum te waarborgen.

Na interpolatie wordt het basisband-signaal omgezet naar een IF-signaal zoals beschreven in de bovenstaande stappen. Het uiteindelijke IF-signaal wordt vervolgens via een luidspreker verzonden.

Aan de ontvangerszijde ondergaat het ontvangen IF-signaal rIF(t) een omlaagconversie naar basisband: rbase(t) = LPF{rIF(t) cos(2πfct)}, waarbij LPF de hoogfrequente componenten verwijdert die tijdens het mengen zijn geïntroduceerd. Het resulterende tijd-frequentie-representatie van het ontvangen basisbandsignaal kan worden geanalyseerd om signaalkenmerken te extraheren, waaronder fase, spectrum en tijd van vlucht (ToF) voor detectieapplicaties.

Naast de basismethoden voor golfvormen en signaalverwerking moeten ontwerpers aandacht besteden aan andere overwegingen, zoals het kiezen van de juiste ontwerpparameters. De bandbreedte van het signaal speelt een cruciale rol, aangezien deze direct de prestaties beïnvloedt. Het is essentieel om een balans te vinden tussen de bandbreedte en andere parameters zoals de duur van het signaal en de resolutie van het systeem. Een bredere signaalbandbreedte leidt doorgaans tot fijnere resolutie, maar dit kan ten koste gaan van de interferentiegevoeligheid, vooral bij kortere afstanden. De keuze voor een juiste bandbreedte hangt dan ook sterk af van de specifieke eisen van de applicatie en de beperkingen van het hardwareplatform.

Hoe kan radartechnologie worden ingezet voor het monitoren van vitale signalen?

De technologie die achter het monitoren van vitale signalen staat, is in wezen radar, of in het geval van akoestische signalen, sonar. Een typisch verwerkingsproces om fysiologische signalen te extraheren maakt gebruik van een model zoals geschetst in vergelijking (6.1), en kan als volgt worden samengevat: (i) het ontwerpen van een geschikte signaalgolfvorm voor sonar, (ii) het extraheren van verplaatsing d(t) van vitale signalen via model h(t), rekening houdend met interferentie zoals bewegingsartefacten of multipad-effecten, en (iii) het scheiden van de gezamenlijk geïnterfereerde vitale signalen door gebruik te maken van verschillende fundamentele frequenties.

Om deze techniek verder te illustreren, gebruiken we het meest gangbare FMCW (Frequency Modulated Continuous Wave) systeem. Bij het ontwerpen van een geschikte chirp-golfvorm voor het monitoren van vitale signalen, is de bandbreedte de belangrijkste factor om te overwegen, aangezien deze de haalbare resolutie van de metingen bepaalt. De meeste akoestische apparaten hebben echter een bandbreedte die vaak beperkt is tot 24 kHz, met het onhoorbare gedeelte tussen 18 en 22 kHz. Om de onhoorbare bandbreedte uit te breiden, stellen onderzoekers een techniek voor genaamd ‘fasewitten’, waarbij het chirpsignaal zodanig wordt gemanipuleerd dat het wordt waargenomen als witte ruis. Dit kan de bandbreedte uitbreiden naar 24 kHz, wat een aanzienlijke verbetering van de meetresolutie oplevert, maar dit kan een complex faseherstelproces vereisen, wat op zijn beurt de prestaties in real-time zou kunnen beïnvloeden.

Een ander belangrijk element om te overwegen bij het ontwerp is de duur van de chirp. Dit beïnvloedt zowel de maximale meetafstand als de mate van multipad-effecten. Empirisch bewijs toont aan dat een duur van 0,04 seconden (bij een bemonsteringssnelheid van 48 kHz) effectief blijkt te zijn. Wanneer een referentiechirp wordt verzonden, zal deze vertraging en complexe demping ondergaan voordat deze een microfoon bereikt. Het proces van synchronisatie van het ontvangen signaal met het verzonden signaal wordt uitgevoerd via een gematcht filter, gevolgd door het segmenteren van de ontvangen signalen in frames.

Binnen elk frame komt een tijdsvertraging t in het ontvangen signaal overeen met een proportionele frequentieverschuiving f in het frequentiedomein ten opzichte van het verzonden signaal. Dit proces wordt vaak in het frequentiedomein uitgevoerd door middel van een dechirp-bewerking. Deze bewerking kan als volgt worden voorgesteld: een mengbewerking, aangeduid als , tussen het ontvangen signaal r(t) en het verzonden chirpsignaal s(t). Het resultaat hiervan wordt door een laagdoorlaatfilter geleid om de hoge frequenties te elimineren, waarna het bijbehorende powerspectrum wordt berekend. In een ideale situatie zou dit spectrum twee prominente pieken bevatten: één voor het directe signaal en één voor de reflectie van het borstgebied van het subject.

De pieken in dit spectrum helpen om de positie van het subject te lokaliseren en de frequentie-indices te vergrendelen die vitale signalen bevatten. De resolutie van het bereik wordt bepaald door de bandbreedte B en de snelheid van het sonar-apparaat. Wanneer het spectrum eenmaal is gedescretiseerd, kan de frequentieverschuiving de afstand tussen het sonar-apparaat en het subject aangeven. De frequentiereeks die het vitale signaal bevat, wordt daarom vaak aangeduid als het ‘bereikbin’.

Het proces van het extraheren van vitale signalen vereist een fijne resolutie van het bereik, maar wanneer de resolutie te groot is, kunnen de subtiele veranderingen in de vitale signalen, zoals hartslag of ademhaling, moeilijk te detecteren zijn. Om dit te verhelpen, wordt de resolutie van het bereik vaak aangepast voor elke individuele vitale signaal, bijvoorbeeld door het toevoegen van nullen in het frequentiedomein om de gewenste resolutie te bereiken. Bij het meten van hartslag wordt de resolutie specifiek ingesteld om iets boven de verwachte maximale verplaatsing door de hartslag te komen. Dit zorgt ervoor dat de faseveranderingen die optreden als gevolg van de hartslag goed zichtbaar zijn.

Echter, ademhaling kan de pieken die het borstgebied representeren in het powerspectrum verschuiven, wat de meting van de hartslag bemoeilijkt. In dit geval kunnen oplossingen zoals het tijdelijk inhouden van adem of het combineren van fase-informatie uit aangrenzende bereikbinen nuttig zijn. Door deze technieken te combineren, kunnen de vitale signalen effectief worden gereconstrueerd.

Een ander groot probleem dat zich kan voordoen in dit soort monitoring is het multipad-effect, dat twee primaire uitdagingen introduceert. Ten eerste kan dit effect de identificatie van de pieken in het spectrum bemoeilijken, vooral wanneer reflecties van ver verwijderde objecten sterker zijn dan die van de nabijheid van het subject. Dit kan de nauwkeurigheid van de metingen verminderen. Ten tweede kan het multipad-effect de fase van de dragers in het spectrum verstoren, waardoor het combineren van fasen uit verschillende bereikbinen tot ruis leidt.

Naast de uitdagingen die de multipad-effecten met zich meebrengen, kan ook de aanwezigheid van bewegingsartefacten de nauwkeurigheid van de fysiologische monitoring beïnvloeden. Beweging van het subject kan leiden tot aanzienlijke verstoringen in de ontvangen signalen, wat het proces van het extraheren van vitale signalen bemoeilijkt. Het is essentieel om algoritmes te ontwikkelen die deze artefacten effectief kunnen identificeren en compenseren.

Hoe biometriële technologieën de menselijke identiteit waarborgen

Biometrie omvat het meten en computergestuurd analyseren van unieke menselijke kenmerken en eigenschappen. Biometrische authenticatie, ook wel realistische authenticatie genoemd, is een methode voor identificatie en toegangscontrole. Deze technologie maakt gebruik van technieken die actief sensorische signalen benutten om een individu te identificeren aan de hand van kenmerkende patronen in de overdracht van akoestische golven. Het uitgangspunt van deze benadering is om unieke patronen te detecteren die de actief uitgezonden geluidssignalen kunnen moduleren.

Veel gebruikte methoden in dit veld maken gebruik van chirp-signalen, gevolgd door de verzameling van multipad-profielen die worden beïnvloed door specifieke biometrische kenmerken. Deze profielen kunnen vervolgens worden geanalyseerd met behulp van classificatietechnieken zoals deep learning voor authenticatie. Uit eerder onderzoek blijkt dat verschillende biometrische kenmerken, zoals gezichtspatronen, de specifieke geometrie van vingers tijdens bepaalde gebaren, of handgeschreven handtekeningen, unieke biometrische handtekeningen kunnen genereren, en daarmee kenmerkende multipad-profielen.

In een studie werd een aangepaste resonantiecaviteit gepresenteerd die de unieke kenmerken van vingerafdrukken versterkt, wat een alternatieve benadering voor biometrische authenticatie biedt. De auteurs van het onderzoek ontwikkelden een methode die gebruik maakt van goedkope en breed beschikbare smartphonehoesjes, waarin mini-structuren met holle kamers zijn geïntegreerd. Deze structuren vertonen zowel ruimtelijke als frequentie-diversiteit, wat controle biedt over de propagatie van structureel overgedragen geluid. Wanneer verschillende gebruikers of vingers met de hoes in contact komen, creëren de unieke biometrische kenmerken van de vinger distincte patronen die voor authenticatie gebruikt kunnen worden.

Om de authenticatie te verfijnen, maken de onderzoekers gebruik van chirp-signalen die een frequentiebereik van 18 kHz–22 kHz bestrijken in stappen van 1 kHz, waarbij elke chirp-sweep 25 ms duurt. Dit stelt hen in staat om onderscheid te maken tussen structureel gedragen en door de lucht gedragen geluid, op basis van de verschillende snelheid van voortplanting van de geluidsgolven. Om aanvallen met herhalingssignalen te voorkomen, worden de verzonden signaalpatronen gerandomiseerd. Bij het extraheren van kenmerken worden tijdsdomeinfeatures zoals het gemiddelde, de standaarddeviatie, de maximum- en minimumwaarden, het bereik, kurtosis en scheefheid gecombineerd met frequentiedomeinfeatures zoals spectrale kracht en Mel-frequentie cepstrale coëfficiënten (MFCC), waarmee unieke biometrische sjablonen voor gebruikers worden opgebouwd.

Een andere veelbelovende biometrische techniek is gebaseerd op de unieke geometrie van de gehoorgang, die tijdens het uitspreken van woorden varieert tussen verschillende individuen. De onderzoekers ontdekten dat deze vervorming een karakteristiek patroon vormt, wat kan worden benut voor een continu authentificatieproces zonder actieve deelname van de gebruiker. Het principe achter deze benadering is het gebruik van de dynamische beweging van de gehoorgang (ear canal dynamic motion, ECDM) die optreedt tijdens spraak. De bewegingen van de kaak en het temporomandibulaire gewricht veroorzaken veranderingen in de vorm van de gehoorgang, en deze veranderingen kunnen worden vastgelegd in akoestische profielen. Het resulterende profiel wordt vervolgens geanalyseerd met behulp van geavanceerde machine learning technieken.

Naast biometrische authenticatie speelt het gehoor een cruciale rol in ons dagelijks leven. Het stelt ons niet alleen in staat om te communiceren en onze omgeving veilig te navigeren, maar beïnvloedt ook ons sociaal welzijn en onze emotionele gezondheid. Het vermogen van het menselijk gehoor om geluiden te lokaliseren in een complexe omgeving, zoals een drukke ruimte, is essentieel voor effectief functioneren. Dit vermogen wordt mogelijk gemaakt door de filtereffecten van de oren, het hoofd en het bovenlichaam, die variëren afhankelijk van de richting en de frequentie van het geluid. Deze filtereffecten, beschreven door de Head-Related Transfer Function (HRTF), maken het mogelijk om geluiden te lokaliseren, zelfs in drukke of lawaaierige omgevingen.

De HRTF vertegenwoordigt de manier waarop geluiden vanuit verschillende ruimtelijke richtingen worden waargenomen door de oren en is specifiek voor ieder individu. Deze filtereffecten worden beïnvloed door de vorm en grootte van het oor, het hoofd en het bovenlichaam. Het nauwkeurig berekenen van de HRTF van een persoon is van essentieel belang voor het verbeteren van technieken zoals geluidlokalisatie en 3D-geluidsruimte, en voor de verbetering van binaurale geluidsverwerking in bijvoorbeeld hoortoestellen.

Voor de personalisatie van de HRTF bestaan er verschillende methoden. Een directe benadering is het verkrijgen van een individuele HRTF door specifieke metingen van het hoofd van een persoon. Deze methoden zijn essentieel voor toepassingen die precisie vereisen in geluidslocatie, zoals in audiotechnologie en in hoortoestellen die speciaal op de individuele behoeften van een gebruiker zijn afgestemd. Aangezien de HRTF uniek is voor elk individu, kunnen algemene of onpersoonlijke HRTF’s onnauwkeurigheden veroorzaken in de geluidservaring, wat leidt tot minder accurate geluidslokalisatie en suboptimale luisterervaringen.

Met de opkomst van draagbare technologieën en smartphones is er een groeiende belangstelling voor het meten van gehoor- en akoestische responsen via alledaagse apparaten. Deze benaderingen maken het mogelijk om de gezondheid van het gehoor te monitoren en vroegtijdig gehoorverlies te detecteren, wat op zijn beurt bijdraagt aan het welzijn van de gebruiker. Het is van groot belang dat deze technologieën niet alleen efficiënt en nauwkeurig zijn, maar ook gebruiksvriendelijk en toegankelijk voor een breed publiek.