Akustiska signaler är mycket känsliga för variationer i deras amplitud och fas. Detta innebär att information ofta överförs genom att modulera bärvågans frekvens. Ett OFDM-vågform (Orthogonal Frequency Division Multiplexing), som namnet antyder, refererar till en akustisk vågform som moduleras med hjälp av denna metod. OFDM-modulering är en effektiv teknik för att koda datorsymboler på ett flertal ortogonala bärvågsfrekvenser. Denna moduleringsteknik uppvisar god motståndskraft mot synkroniseringsfel och erbjuder potential för högre genomströmning inom en given bandbredd.

I trådlösa kommunikationssystem, som Wi-Fi, används OFDM-modulering ofta med högre ordningens basbandsmoduleringstekniker, såsom 256-QAM (quadrature amplitude modulation), för att optimera spektraleffektiviteten. I den akustiska domänen är dock sådana högnivåmoduleringar inte genomförbara, eftersom de lider av allvarliga kanalförsämringar som multipath-propagation, Doppler-effekter och frekvensselektiv fading. Därför används istället vanligen amplitudmodulering som binary amplitude shift keying (ASK) vid akustisk OFDM-implementering, vilket innebär att informationen huvudsakligen kodas genom variationer i frekvens och amplitud snarare än fas.

Akustiska kommunikationssystem som använder OFDM, där information kodas i olika frekvenser, kan ofta inte realiseras till fullo på vanliga akustiska enheter, eftersom avancerade processeringsfunktioner, såsom bärvågssökning och kanalstatusuppskattning, är svåra att implementera direkt i sådana miljöer. De striktare tidskraven och den korta koherenstiden i kanalerna gör att det akustiska mediet inte alltid kan utnyttja dessa tekniker på samma sätt som RF-baserade OFDM-system.

Akustiska detekteringssystem, som bygger på spridningsegenskaperna hos akustiska signaler, utnyttjar inte bara frekvensmodulering utan även fasförändringar, Doppler-skift och spektrala förändringar för att identifiera och bedöma rörelser eller målobjekt. För effektiv akustisk detektering är det viktigt att den valda vågformen reagerar starkt på förändringar i miljön. Till exempel används Chirp-signaler, rena toner och OFDM-vågformer ofta i detekteringsapplikationer där högre detekteringsförmåga och upplösning är av största vikt. Spridningsspektrum (SS) signaler är särskilt användbara för detta ändamål på grund av deras förmåga att motstå multipath-effekter och brus, vilket gör dem ideala för precisa mätningar och synkronisering.

En viktig aspekt av SS-signaler är användningen av ortogonala koder, som exempelvis GSM-träningssekvenser, Barker-koder, M-sekvenser eller Zadoff-Chu-sekvenser (ZC). Dessa sekvenser är designade för att optimera kanalens prestanda i olika typer av kommunikationssystem. GSM-träningssekvenser används för att motverka kanalförvrängningar och minska fördröjningar, medan Barker-koder och M-sekvenser används för att maximera signaldetektering i radar- och synkroniseringssystem. Zadoff-Chu-sekvenser, i sin tur, har mycket fördelaktiga egenskaper för synkronisering och kanaluppskattning på grund av sina ideala autokorrelerande och korskorrelerande egenskaper.

Trots att dessa tekniker är starkt kopplade till olika former av trådlös kommunikation, har de också stor betydelse i den akustiska domänen. Deras användning i akustiska detekteringssystem bidrar till att optimera både signalens detekterbarhet och dess förmåga att genomgå multipath-effekter och andra störningar som är typiska för akustiska kanaler. För att maximera effekten av dessa vågformer är det avgörande att man anpassar systemets prestanda till de specifika utmaningarna i den akustiska miljön.

Vidare är det viktigt att förstå att medan OFDM-system kan erbjuda betydande fördelar i kommunikation över korta avstånd, kan deras effektivitet begränsas av miljöfaktorer som ljudreflektioner och andra störningar. När akustiska signaler används för detektering snarare än för kommunikation är det ofta viktigt att fokusera mer på signalens robusthet mot externa faktorer än på dess dataöverföringskapacitet.

Det finns därför flera faktorer som måste beaktas för att välja rätt vågform beroende på applikationen – om det handlar om att säkerställa hög datagenomströmning för kommunikation eller att optimera detektering och mätning i en ljudmiljö. Valet av metod beror i hög grad på de specifika utmaningarna som presenteras av den akustiska miljön, samt på systemets behov av precision, räckvidd och störningsresistens.

Hur kan akustisk gestigenkänning förbättra interaktivitet i moderna system?

Akustisk gestigenkänning bygger på att identifiera och tolka rörelsemönster genom att analysera akustiska reflektioner som genereras av en användares handrörelser. Till skillnad från vitalparametrar som mäts genom avståndsförändringar eller rörelsespårning, där huvudsakliga målet är att övervaka avstånd, fokuserar akustisk gestigenkänning på att förstå och känna igen de mönster som skapas av dessa reflektioner. För att kunna fånga de snabba förändringarna i dessa reflektioner krävs en tillräckligt hög samplingsfrekvens. Det innebär att långvariga vågformer, som till exempel chirps, inte är lämpliga för gestigenkänning. Istället används signalspridande signaler såsom Zadoff-Chu (ZC) sekvenser, Barker-koder och GSM träningssekvenser. De grundläggande bearbetningsstegen involverar normalt: (i) extrahering av ekoprofilen för den specifika gesten, (ii) igenkänning av grundläggande gestmönster med hjälp av deterministiska eller probabilistiska metoder, och (iii) avancerad gestigenkänning. För att ytterligare belysa de algoritmiska procedurerna kommer vi nu att introducera två specifika gestigenkänningssystem.

Det första systemet använder en förutsägbar metod för gestigenkänning genom att utnyttja Dopplereffekten. I denna metod sänder en akustisk sändare ut enfrekventa ljudvågor mot en hand som antingen närmar sig eller avlägsnar sig från sändaren längs linjen av syn. När handen närmar sig enheten orsakar Dopplereffekten en uppåtgående frekvensförändring, medan en avlägsnande hand orsakar en nedåtgående frekvensförändring. Detta gör det möjligt att entydigt identifiera gester genom att observera specifika frekvensförändrade akustiska reflektioner i jämförelse med den ursprungliga sända frekvensen. En av utmaningarna med denna metod är den svaga naturen hos dessa akustiska reflektioner, vilket ofta gör att de försvinner i bakgrundsbrus. För att motverka detta används olika filtermetoder som kan reducera självinterferens, exempelvis Cascaded Integrator-Comb (CIC) filter eller Moving Target Indicator (MTI) filter. Genom att justera dessa filter för att passa den specifika sända frekvensen kan effekten av interferens minskas betydligt.

För att maximera Doppleresolutionen är det viktigt att välja den högsta praktiskt uppnåeliga frekvensen för de sända signalerna. Vidare kan användning av nollpadding under beräkningen av snabb Fouriertransform (FFT) av effektspektrumet förbättra upplösningen ytterligare. Efter att frekvensspektret har beräknats, undersöks det för att identifiera gestens grundläggande komponenter. Dessa kan sedan kombineras för att känna igen mer komplexa gester, såsom dubbeltryck eller svepande rörelser.

Det andra systemet bygger på kanalesimtering, som hämtar inspiration från tekniker som används i trådlös kommunikation. Här används en specifik signal, som exempelvis ZC, GSM eller Barker-kod, för att analysera de dynamiska egenskaperna hos kommunikationskanalen mellan en sändare och en hand under en gest. Denna process genererar kanalstatusinformation (CSI) som, beroende på gesten, visar tydligt skilda mönster. För att maximera systemets känslighet är det viktigt att välja en signal som kan detektera subtila förändringar i kanalens dynamik. Det innebär att ett system med hög känslighet lättare kan särskilja mellan olika reflektioner, exempelvis de som kommer från olika fingrar, vilket förbättrar gesterna igenkänning.

När CSI för varje ram har beräknats, samlas flera ramdata ihop till en signalmatris, vilket möjliggör identifiering av unika kännetecken i samband med olika gester. För att eliminera effekterna av statisk bakgrundsreflektion kan en differentieringsoperation tillämpas, vilket gör det möjligt att fokusera på de mönster som genereras av själva gesten. Det resulterande matrisen kan sedan användas för att träna en klassificeringsmodell, exempelvis en djupinlärningsalgoritm, som kan genomföra gestigenkänning i realtid. Genom att använda metoder som dataaugmentation eller meta-lärande kan systemet tränas för att känna igen gester även i situationer med begränsad träningsdata.

Dessa tekniker för akustisk gestigenkänning representerar inte bara en teknologisk utveckling inom interaktiva system, utan öppnar också dörren för nya användningsområden inom olika domäner som sjukvård, spelteknologi och hemautomation.

För att gestigenkänning ska fungera optimalt i verkliga tillämpningar måste den kunna hantera en mängd praktiska utmaningar, som bakgrundsbrus och störningar. Dessutom måste systemen vara tillräckligt snabba och exakt nog för att möjliggöra realtidsinteraktion utan fördröjning. Det är också viktigt att förstå att, trots framstegen, finns det fortfarande begränsningar i teknologin när det gäller att differentiera mellan gester som är visuellt lika, eller när användaren utför gester snabbt och oförutsägbart.

Endtext

Hur fungerar trycksensorn i smartphones utan dedikerade trycksensorer?

ForchPhone [63] är ett system för att känna av tryck i smartphones som saknar dedikerade trycksensorer. Genom att använda endast mjukvara kan dessa smartphones uppfatta olika nivåer av tryck genom att analysera förändringar i resonansfrekvenser. Systemet betraktar telefonen som ett mass-fjäder-system, där en signal med en mängd olika frekvenser sänds från en del av enheten och fångas upp av en mikrofon på motsatt sida. Denna arrangemang gör att telefonen vibrerar och får resonans vid specifika frekvenser. När användaren applicerar tryck på skärmen förändras styrkan i dessa resonansfrekvenser. Genom att studera dessa förändringar kan systemet avgöra vilken trycknivå som applicerats och skapa applikationer som reagerar på tryckkänslighet.

Touch-and-Active [52] är ett interaktivt system som både känner av platsen och trycket av beröring genom användning av akustisk resonans. I detta system placeras en piezoelektrisk högtalare och en mikrofon på ytan av ett objekt. Högtalaren sänder ut en svept frekvenssinusoidal signal som sedan fångas upp av mikrofonen. Detta gör det möjligt att mäta objektets akustiska respons över ett spektrum av frekvenser. När en användare rör vid ytan ändras objektets resonanskarakteristik, vilket gör att systemet kan identifiera denna interaktion. Om objektets form kan ändras, kommer varje konfiguration att visa ett annat resonansmönster, vilket leder till en unik frekvensrespons. Dessutom kan trycket som appliceras orsaka en förskjutning i resonansfrekvensen, vilket gör att systemet samtidigt kan upptäcka var beröringen inträffade och dess intensitet. Denna metod möjliggör exakt avkänning av interaktioner på olika ytor.

Denna typ av trycksensorteknik, som använder akustiska resonanser, kan ha många tillämpningar i olika typer av apparater och enheter. För smartphones innebär det att användare kan interagera med sina enheter på nya och mer känsliga sätt, genom att variera trycket på skärmen eller ytor. Det öppnar upp för mer exakta användargränssnitt där små förändringar i trycket kan medföra olika funktioner, och där varje användares interaktion kan tolkas individuellt.

För att förstå dessa system bättre är det viktigt att inse hur resonans fungerar i olika material och strukturer. Resonans, i sin grundform, är ett fenomen där ett objekt eller ett system vibrerar vid en specifik frekvens. I ForchPhone och Touch-and-Active är denna resonans inte bara en funktion av objektets fysiska egenskaper, utan också hur dessa egenskaper förändras i realtid beroende på användarens interaktioner. Att det hela sker genom att analysera ljudvågor som reflekteras eller förändras ger ett intressant perspektiv på hur även mjukvara kan efterlikna fysiska sensorer.

Det är också avgörande att förstå att dessa metoder inte bara handlar om att detektera tryck. Det handlar om att kunna differentiera mellan olika typer av tryck och identifiera var på en yta trycket sker. Därmed kan till exempel olika applikationer reagera inte bara på hur hårt någon trycker, utan även på var trycket uppstår. Detta skapar möjlighet för mer komplexa och användardrivna interaktioner med enheter som smartphones och andra bärbara enheter.

När vi ser på framtiden för denna teknik, är det viktigt att tänka på dess potential för att omdefiniera hur vi interagerar med våra enheter. Förutom att förbättra användargränssnitt, kan tekniken också integreras i hälso- och säkerhetsapplikationer där tryckavläsningar och interaktionsmönster kan ge värdefull information om användarens fysiska tillstånd eller miljön runtomkring. Här finns också en möjlighet att tillämpa denna teknik på bredare sätt inom IoT (Internet of Things) för att skapa mer dynamiska och responsiva system.