I akustisk kommunikation, där överföringen av data sker via ljudvågor snarare än radiovågor, skiljer sig modulationsteknikerna avsevärt från de som används i traditionell trådlös kommunikation, som t.ex. LoRa (Long Range). En av de mest framträdande egenskaperna hos akustisk kommunikation är den begränsade bandbredden, vilket gör att tekniker som använder frekvenser som ligger nära varandra måste hantera större utmaningar vid moduleringen. Här undersöks de tekniker som används för att effektivt modulera meddelanden i det akustiska domänet, samt de fördelar och nackdelar dessa tekniker innebär.

Modulering i den akustiska domänen använder sällan den lägsta frekvensen (fmin), som är vanligt i exempelvis LoRa. Istället används ofta en parameter k för att modulera signaler, vilket är mer lämpligt för akustiska system på grund av den begränsade bandbredden. Här kommer tekniken för chirpmodulering till användning, där signaler som varierar i frekvens under en tidsperiod används för att bära data. En sådan metod är Chirp Spread Spectrum (CSS), som tillåter överföring av data även över relativt stora avstånd med hjälp av frekvensmodulerade ljudvågor.

En av de största utmaningarna med CSS är att skapa en effektiv separation mellan olika symboler. I den traditionella OFDM (Orthogonal Frequency Division Multiplexing) är symbolerna ortogonala, vilket innebär att de inte stör varandra. Detta uppnås genom att symbolerna är åtskilda vid provtagningspunkter. I kontrast kräver akustisk kommunikation en mer komplex metod för att uppnå ortogonalitet. För att lösa detta problem har forskare utvecklat tekniken Orthogonal Chirp Division Multiplexing (OCDM), som bygger på Fresneltransformen. OCDM gör det möjligt att skapa ortogonala chirps, men den lider av en stor känslighet för synkroniseringsfel, vilket begränsar dess användning i praktiken.

För att hantera denna utmaning används i många system tidsdivision, där symbolerna fördelas över olika tidsintervall. Denna metod har dock en inneboende trade-off: för att öka datahastigheten måste varje symbols varaktighet minskas, vilket resulterar i en förlust av signalens bearbetningsfördel och därmed en högre bitfelshastighet (BER).

För att ytterligare minska ömsesidig interferens mellan olika symboler introducerade forskare begreppet "lös ortogonalitet". Om två chirp-sändare, f och g, används samtidigt i samma system, kan de betraktas som löst ortogonala om graden av interferens mellan dem ligger under en viss tröskel, definierad som α. Ju lägre α, desto lättare blir det att separera de två signalerna från varandra. Ett sätt att skapa lös ortogonalitet är att variera k, moduleringens koefficient, för att kodifiera information, en teknik som kallas Binary Orthogonal Keying (BOK). Här kodas binära siffror genom att använda positiva och negativa värden på k för att skapa upp- och ned-chirps.

Ett vidare steg i utvecklingen av modulationstekniker är att använda fler "vändpunkter" i chirp-modulationen, vilket leder till Quadrature Orthogonal Keying (QOK). Här kan fler symboler skapas genom att moduleringskoefficienten k justeras för att skapa olika vändpunkter i signalen, vilket ger ytterligare distinktion mellan signalerna, även om dessa fortfarande är löst ortogonala. Genom att öka antalet vändpunkter i modulationen ökar man modulationens ordning, vilket gör det möjligt att överföra mer information på samma tidsintervall.

För att ytterligare förbättra dataöverföringshastigheten föreslogs en lösning där olika chirp-sändare med olika centrala frekvenser används samtidigt. Genom att hålla inter-carrier-interferensen (ICI) till ett minimum kan detta system effektivt öka modulationens ordning och därigenom höja dataöverföringshastigheten från några få bitar per sekund till upp till 1 kbps.

Vid demodulering av chirp-modulerade signaler krävs vanligtvis betydande beräkningsresurser, särskilt när matchad filtrering används. En matchad filtermetod innebär att den mottagna signalen r(t) korreleras med en förbestämd referenssignal för att hitta den symbol som bäst stämmer överens med signalens mönster. I system med högre ordning av modulation krävs det att varje informationssymbol har sin egen unika referens, vilket innebär att det krävs upprepade beräkningssteg för varje möjlig symbol.

När det gäller själva den akustiska ramen, som är grundläggande för att strukturera och överföra data i akustisk kommunikation, är det vanligt att en sådan ram består av tre delar: en förord, datatecken och ett skyddsintervall mellan ramarna. Förordet används för att detektera ankomsten av en ny akustisk ram, medan datatecknen moduleras med hjälp av tidigare nämnda tekniker. Skyddsintervallet har två huvudsyften: att minska effekterna av multipath-propagation (när signaler reflekteras och tas emot vid olika tidpunkter) och att minska inter-symbol-interferens (ISI), vilket är när symbolerna "blöder" in i varandra på grund av tidsöverlagring.

Akustiska kommunikationssystem med dynamiska kanalvillkor, där både sändare och mottagare är i rörelse, kräver mer avancerad signalbehandling. Metoder för att kompensera för Dopplerförskjutningar, som orsakas av relativ rörelse mellan sändare och mottagare, har föreslagits, inklusive användning av ren-ton-signaler parallellt med modulerade symboler för att estimera och justera för dessa skiftningar.

För att sammanfatta innebär utvecklingen av modulationstekniker för akustisk kommunikation en balans mellan att öka dataöverföringshastigheten och att hantera de tekniska utmaningarna som följer med begränsad bandbredd, multipath-effekter och interferens mellan symboler. De lösningar som utvecklats, såsom OCDM och BOK, har visat sig vara lovande, men kräver avancerad synkronisering och beräkningskraft för att uppnå maximal effektivitet.

Hur fungerar akustiska sensorsystem och deras tillämpningar?

Akustiska sensorsystem använder ljudvågor för att detektera objekt eller för att samla in information om omgivningen. Dessa system involverar en ljudkälla, en detektor (mikrofon), och ett medium genom vilket ljudvågorna färdas. Objekt i miljön kan antingen vara målen som ska uppfattas eller element som påverkar ljudvågornas spridning. Beroende på hur mikrofoner och högtalare är placerade kan akustiska sensorsystem operera i olika konfigurationer: mono-statiska, bi-statiska eller multi-statiska.

I mono-statiska system, ofta kallade akustiska sonarer, är både högtalare och mikrofoner placerade på samma enhet och drivs vanligtvis av samma klocka. Dessa system är enkla att implementera och är bra för närhetsdetektering. De har dock en begränsad räckvidd. Bistatiska system har separata enheter för att sända och ta emot ljudsignaler, medan multi-statiska system involverar flera sändare och/eller mottagare som är geografiskt separerade. Dessa system erbjuder större täckning och förbättrad spatial upplösning, men de kräver mer komplex installation och kan antingen operera asynkront eller synkroniseras genom andra metoder.

I ett typiskt ljudinspelningssystem omvandlas akustiska signaler först till spänningssignaler av en mikrofon. Dessa signaler förstärks av en automatisk gainkontroll (AGC) eller en programmerbar förstärkare (PGA) för att passa den dynamiska räckvidden hos en analog-till-digital omvandlare (ADC). Detta gör det möjligt att förbättra upplösningen vid digitalisering och minska risken för mättnad. Signalernas amplitud regleras vidare av ett lågpassfilter (LPF) innan de omvandlas till digitala prover. Ljuduppspelningssystemet reverserar processen, där digitala prover interpoleras, konverteras till analoga signaler och förstärks innan de omvandlas tillbaka till akustiska vågor via en högtalare.

De viktigaste parametrarna för akustiska inspelningssystem är samplingsfrekvens, bitupplösning och antalet kanaler (eller mikrofoner). En högre samplingsfrekvens och högre bitupplösning förbättrar signalens kvalitet, vilket möjliggör en större frekvensinnehåll och minskar kvantiseringseffekter. Fler mikrofonkanaler ger en mer detaljerad spatial upplösning och gör det möjligt att få mer precisa akustiska representationer.

I moderna konsumentenheter som smartphones och smarta hörlurar är det vanligt att enheter har fler än en mikrofon och högtalare. Till exempel använder många smartphones två högtalare för att spela upp stereo-ljud och flera mikrofoner för att förbättra inspelningskvaliteten. Mikrofonernas placering och högtalarnas konfiguration är avgörande för att utforma effektiva akustiska algoritmer. Detta är också viktigt när man utformar funktioner som brusreducering och transparensläge i hörlurar.

Kommersiella enheter har ofta en icke-platt frekvensrespons i sina akustiska system, vilket innebär att ljudsignaler får olika förstärkning vid olika frekvenser. Detta fenomen, känt som frekvensselektivitet, kan skapa problem vid inspelning eller uppspelning av signaler som sträcker sig över ett brett frekvensområde. Dessutom kan högtalarnas tröghet orsaka dämpning av högfrekventa signaler, vilket kan ge upphov till oönskade ljudartefakter, som ringing-effekter eller frekvensläckage.

Inom akustisk sensing har många tillämpningar vuxit fram, och nya innovationer fortsätter att dyka upp i en accelererande takt. Trots den stora mängden tillämpningar kan de huvudsakligen kategoriseras i tre huvudgrupper: luftakustisk kommunikation (AAC), lokaliseringstjänster och objektigenkänning. Luftakustisk kommunikation använder ljudvågor för att överföra data genom luften, vilket gör det möjligt med lågströmöverföring för enheter som parkoppling, kortdistansdataöverföring och autentisering. Lokaliseringstjänster använder akustiska signaler för att mäta avstånd eller för att navigera inomhus.

För att tillämpa dessa system på ett effektivt sätt, måste man förstå vikten av akustiska signalers egenskaper, såsom deras spridning genom olika medier, effekterna av externa objekt som kan störa signalerna, samt den roll som den spatiala upplösningen spelar i detektering och avståndsberäkningar. Det är också viktigt att förstå hur akustiska sensorer och deras komponenter, som mikrofoner och högtalare, påverkar den totala prestandan hos ett system. När dessa komponenter inte är korrekt konfigurerade eller om deras inbyggda egenskaper inte beaktas kan det leda till stora felmarginaler eller försämrad systemfunktionalitet.