Komunikacja akustyczna w przestrzeni powietrznej, pomimo wielu wyzwań, ma ogromny potencjał w porównaniu do tradycyjnych metod, takich jak Bluetooth. Współczesne aplikacje dążą do umożliwienia współistnienia urządzeń w bliskiej odległości, a badania nad tą technologią stają się coraz bardziej intensywne. Firmy technologiczne, takie jak Google, wprowadzają rozwiązania akustyczne w celu zapewnienia łatwego połączenia urządzeń w tej samej przestrzeni [12]. Jednak podstawowe różnice w propagacji fal radiowych (RF) i fal akustycznych, takie jak prędkość sygnałów, charakterystyki tłumienia oraz ograniczenia pasma, oznaczają, że technologie opracowane z myślą o komunikacji radiowej nie mogą być bezpośrednio zastosowane w komunikacji akustycznej.

Jednym z kluczowych wyzwań, z jakim spotykamy się w przypadku komunikacji akustycznej, jest efekt Dopplera. Prędkość dźwięku w powietrzu wynosi około 340 m/s w temperaturze pokojowej, co w połączeniu z niskimi częstotliwościami nośnymi wykorzystywanymi w akustycznych systemach komunikacyjnych sprawia, że nawet niewielkie ruchy, takie jak chodzenie, mogą powodować znaczne przesunięcia Dopplera. To zjawisko stanowi duże wyzwanie dla projektowania odpornych na zakłócenia fal akustycznych w aplikacjach mobilnych. Wymaga ono starannego uwzględnienia przesunięć częstotliwości oraz zmienności czasowych, aby zapewnić niezawodną transmisję.

Wspomniane wyzwanie staje się jeszcze bardziej skomplikowane przez obecność hałasu tła, który w akustycznych kanałach komunikacyjnych ma szeroki zakres częstotliwości, od 20 Hz do 22 kHz. Hałas ten może całkowicie zakłócić jakość sygnału. Z tego względu projektowanie fal akustycznych do komunikacji powietrznej musi obejmować techniki redukcji hałasu, aby poprawić niezawodność transmisji i zachować wierność sygnału, szczególnie w trudnych warunkach akustycznych.

Również selektywność częstotliwości stanowi problem w przypadku tradycyjnych transduktorów akustycznych, takich jak głośniki czy mikrofony. Te urządzenia są zoptymalizowane pod kątem ludzkiej mowy, co powoduje wzrost czułości i zysku w okolicach 4 kHz. Poza tym pasmem efektywność tych urządzeń znacząco spada. W związku z tym projektowanie systemów komunikacji akustycznej wymaga zastosowania technik kompensacji częstotliwości, aby zminimalizować wpływ tego efektu na jakość transmisji.

Jednak mimo tych wyzwań, komunikacja akustyczna w powietrzu posiada szereg zalet w porównaniu do systemów radiowych. Po pierwsze, transduktory akustyczne są powszechnie dostępne w urządzeniach konsumenckich i naturalnie wspierają przetwarzanie sygnałów na poziomie warstwy fizycznej, co pozwala na stosowanie różnych schematów modulacji bez konieczności modyfikacji sprzętu. Po drugie, stosunek pasma do prędkości propagacji sygnałów akustycznych jest znacznie wyższy niż w przypadku sygnałów radiowych. To znacząco poprawia rozdzielczość przestrzenną i czułość systemów akustycznych, umożliwiając dokładniejszą charakterystykę środowiska i wykrywanie obiektów. Po trzecie, komunikacja akustyczna zmniejsza ryzyko podsłuchu, ponieważ sygnały akustyczne mają ograniczony zasięg i nie przechodzą łatwo przez ściany.

Aby sprostać wyzwaniom związanym z propagacją fal akustycznych, często stosuje się odpowiednie techniki projektowania fal, które są odporne na przesunięcia Dopplera oraz zakłócenia środowiskowe. Problem selektywności częstotliwości jest na ogół rozwiązywany przez kompensację kanału [11]. W następnej części omawiamy powszechnie stosowane fale akustyczne w komunikacji akustycznej powietrznej (AAC), takie jak sygnały chirpowe [7] i ich warianty [8, 29], sygnały sinusoidalne oraz wielodostępne sygnały z podziałem na częstotliwości (OFDM).

Sygnały chirpowe są jednym z najczęściej używanych rodzajów fal w komunikacji akustycznej. Stosuje się je do kodowania preambuł podczas procesów synchronizacji, a także do kodowania symboli informacyjnych. Sygnały chirpowe charakteryzują się wysoką odpornością na hałas tła, efekt Dopplera oraz propagację wielościeżkową, co czyni je atrakcyjnymi w trudnych warunkach akustycznych. Warto dodać, że ich unikalne właściwości pozwalają na komunikację nawet poniżej poziomu szumu. Sygnał chirpowy charakteryzuje się częstotliwością, która wzrasta (chirp w górę) lub maleje (chirp w dół) w czasie. W szczególności liniowy chirp, znany również jako sygnał o modulowanej częstotliwości (LFM), zachowuje stałe tempo zmiany częstotliwości przez cały czas trwania sygnału [34].

Sygnały sinusoidalne, z drugiej strony, oferują prostotę zarówno w procesie kodowania, jak i dekodowania, ale są mniej skuteczne niż sygnały chirpowe w radzeniu sobie z hałasem i wielościeżkowym tłumieniem. Empiryczne badania (opisane w rozdziale 4) pokazują, że amplituda sygnałów czystej tonacji oraz ich reprezentacja w dziedzinie czasu i częstotliwości również nie spełniają w pełni oczekiwań w warunkach trudnych.

W kontekście rozwoju nowych metod akustycznych ważnym kierunkiem są technologie wspomagające większą odporność na zakłócenia oraz zapewniające wyższe prędkości transmisji danych, co jest szczególnie istotne w zastosowaniach z ograniczoną mocą obliczeniową, jak w przypadku urządzeń IoT.

Jak skutecznie szacować czas przelotu fal akustycznych w systemach detekcji?

Wykorzystanie sygnałów akustycznych w systemach detekcji, takich jak te oparte na pomiarach czasu przelotu (ToA) czy różnicy czasu przelotu (TDoA), wymaga precyzyjnego szacowania momentów przybycia sygnałów do odbiorników. Pomimo różnych wyzwań związanych z synchronizacją urządzeń oraz problemem propagacji sygnałów w różnych środowiskach, techniki te stały się fundamentem wielu zastosowań w zakresie lokalizacji i zasięgu. Celem tych metod jest jak najdokładniejsze oszacowanie momentu dotarcia fali akustycznej od nadajnika do odbiornika, co stanowi klucz do uzyskania precyzyjnych wyników.

Zjawisko to jest szczególnie istotne, gdy mowa o aplikacjach, w których sygnały akustyczne rozchodzą się po różnych ścieżkach – zarówno po prostych, jak i odbitych. Zjawisko to prowadzi do tzw. efektu NLOS (Non-Line-of-Sight), w którym sygnały odbite mogą powodować dodatkowe szczyty w wynikach krzyżowej korelacji, które w niektórych przypadkach mogą być nawet większe od tych, które pochodzą od sygnałów propagujących się w linii widzenia (LOS). Z tego powodu detekcja preambuły, czyli początkowych fragmentów sygnału, odgrywa istotną rolę w eliminacji błędów związanych z tego rodzaju interferencjami.

Aby skutecznie rozwiązać problem związany z detekcją w warunkach różnych ścieżek propagacji, zaproponowano metodę normalizacji wartości krzyżowej korelacji. W tej metodzie krzyżową korelację wartości próbek sygnału odbieranego porównuje się z sumą intensywności poprzednich próbek. Podejście to pozwala na dynamiczną adaptację progu detekcji w zależności od względnej wartości uzyskanej krzyżowej korelacji. Taka procedura znacząco poprawia wykrywalność początków sygnałów, pozwalając na minimalizację błędów związanych z fałszywymi alarmami oraz przeoczeniami.

W kontekście pomiaru czasu przelotu, istotną rolę odgrywają różne podejścia, które zależą od zastosowanego sprzętu – zarówno w metodach opartych na urządzeniach (device-based), jak i w metodach bez urządzeń (device-free). W pierwszym przypadku, systemy mogą wykorzystywać krzyżową korelację sygnałów akustycznych do uzyskania bardzo dokładnych wyników na poziomie próbek. W przypadku podejść bez urządzeń, możliwe jest wykorzystanie informacji o fazie fal akustycznych, co umożliwia uzyskanie precyzyjnych wyników z dokładnością do sub-próbek.

Pomiar ToA w metodzie jednostronnej

Pomiar ToA (Time-of-Arrival) w metodzie jednostronnej polega na uzyskaniu informacji o czasie dotarcia sygnału do odbiornika poprzez jedną stronę transmisji. Systemy tego typu opierają się na precyzyjnej synchronizacji pomiędzy nadajnikiem a odbiornikiem, aby umożliwić odbiornikowi precyzyjne określenie momentu wysłania sygnału. Z tego powodu zastosowanie wysokoszybkich sygnałów synchronizujących, takich jak WiFi, Bluetooth czy Zigbee, stało się popularnym rozwiązaniem. Dzięki temu różnica w czasie przylotu sygnałów akustycznych oraz synchronizujących pozwala na dokładne oszacowanie ToA.

Metoda jednostronna jest stosunkowo prosta i skuteczna, ale jej głównym ograniczeniem jest konieczność zapewnienia bardzo dokładnej synchronizacji, szczególnie w przypadku urządzeń rozmieszczonych w różnych lokalizacjach. Problemy z synchronizacją wynikają często z niepewności związanych z opóźnieniami systemowymi, które mogą istotnie obniżyć dokładność pomiarów. Choć możliwe jest złagodzenie tych trudności poprzez wykorzystanie dedykowanego sprzętu czy implementacji jądrowych w systemach operacyjnych, to praktyczna realizacja metody jednostronnej w takich aplikacjach wciąż napotyka na poważne ograniczenia.

Pomiar TDoA w metodzie jednostronnej

Pomiar różnicy czasu przelotu (TDoA) w metodzie jednostronnej polega na obliczeniu różnicy czasu dotarcia sygnału do dwóch lub więcej odbiorników znajdujących się w różnych miejscach. TDoA pozwala na oszacowanie położenia źródła sygnału na podstawie tej różnicy czasów. W tym przypadku konieczne jest zapewnienie, by wszystkie urządzenia, zarówno nadajniki, jak i odbiorniki, były synchronizowane. Dzięki synchronizacji, która może odbywać się za pomocą wspólnego zegara lub innych metod synchronizujących, możliwe jest dokładne określenie różnic czasowych przybycia sygnału do różnych odbiorników.

Pomiar ToA w metodzie dwukierunkowej

Aby uniknąć konieczności precyzyjnej synchronizacji w systemach jednostronnych, zaproponowano metodę dwukierunkową, która bazuje na dwukierunkowej transmisji akustycznej. Każde urządzenie w takim systemie musi być wyposażone zarówno w głośnik, jak i mikrofon. W tym przypadku, sygnał wysyłany przez jedno urządzenie jest odbierany przez drugie, które po pewnym czasie wysyła odpowiedź. Cały proces detekcji opiera się na pomiarze czasów odbioru i wysyłania sygnałów, co pozwala na obliczenie czasu przelotu.

Podstawową zaletą metody dwukierunkowej jest możliwość eliminacji problemu synchronizacji pomiędzy urządzeniami, ponieważ każde urządzenie samo dokonuje pomiaru czasów wysyłania i odbioru sygnałów. Problemem tej metody jest jednak konieczność bardziej zaawansowanego sprzętu oraz obróbki sygnałów, co zwiększa złożoność systemu. Jednak dzięki tej metodzie, możliwe jest uzyskanie dokładniejszych wyników, nawet w przypadkach, gdy synchronizacja urządzeń jest trudna do osiągnięcia.

Dodatkowe aspekty do rozważenia

Podstawowym wyzwaniem związanym z metodami szacowania ToA i TDoA w systemach akustycznych jest kontrola nad błędami związanymi z propagacją fal w różnych warunkach. Zjawiska takie jak odbicia, dyfrakcja czy zmiany w gęstości medium mogą wpływać na dokładność pomiarów. Istotnym krokiem jest więc rozwijanie technik kalibracji oraz poprawy algorytmów detekcji, aby minimalizować wpływ tych zakłóceń.

Ponadto, należy zwrócić uwagę na praktyczność implementacji systemów akustycznych w różnych warunkach środowiskowych. Choć zaawansowane algorytmy i sprzęt mogą zapewnić wysoką dokładność, w wielu aplikacjach na co dzień napotykamy na ograniczenia związane z jakością sygnału, dostępnością odpowiednich urządzeń oraz ich kosztami.

Jakie techniki modulacji są wykorzystywane w komunikacji akustycznej?

W kontekście komunikacji akustycznej, modulacja odgrywa kluczową rolę w przekazywaniu informacji w ograniczonych warunkach pasma częstotliwościowego. Większość nowoczesnych systemów akustycznych, ze względu na ograniczoną szerokość pasma, polega na stosowaniu takich metod modulacji, które są dostosowane do specyfiki transmisji dźwiękowych, w tym m.in. modulacji z wykorzystaniem chirpów. Cechą charakterystyczną tego typu technologii jest zastosowanie odpowiednich parametrów, takich jak współczynnik modulacji (k) czy faza początkowa (φ), które różnią się od standardowych technik wykorzystywanych w telekomunikacji radiowej, jak np. OFDM.

W klasycznych systemach OFDM, mimo występowania interferencji między symbolami, interferencja z symbolami sąsiednimi jest neutralizowana w punktach próbkowania, co skutkuje tym, że symbole są uważane za ortogonalne. Równanie (4.5) pokazuje, że dla symboli si oraz sj, które są różne, wewnętrzna operacja (np. korelacja) wynosi zero. Z kolei w przypadku modulacji akustycznej, takich jak CSS (Chirp Spread Spectrum), zapewnienie ortogonalności pomiędzy sygnałami okazuje się wyzwaniem. W celu rozwiązania tego problemu, zaproponowano technikę OCDM (Orthogonal Chirp Division Multiplexing), która pozwala tworzyć ortogonalne chirpy, spełniające określone warunki. Niemniej jednak, OCDM charakteryzuje się dużą wrażliwością na przesunięcia synchronizacji, co ogranicza jej praktyczne zastosowanie.

Pomimo tego ograniczenia, wiele systemów akustycznych decyduje się na wykorzystanie podziału czasowego, gdzie poszczególne symbole przypisane są do różnych przedziałów czasowych. Taki system, mimo że skuteczny, wprowadza pewien kompromis: krótszy czas trwania symboli pozwala na uzyskanie wyższego przepustowości, ale jednocześnie prowadzi do zwiększenia wskaźnika błędu bitowego (BER) z powodu zmniejszonego zysku przetwarzania związanego z nośnymi opartymi na chirpach.

Alternatywnym podejściem jest manipulowanie współczynnikiem k, który wpływa na kształt modulacji. Na przykład, w pracy [2, 3], autorzy zaproponowali pojęcie luźnej ortogonalności. W tym podejściu, dwa różne nośne chirpowe (f i g) mogą być traktowane jako luźno ortogonalne, jeżeli spełniają określone warunki, jak pokazano w równaniu (4.6). Dla tej metodologii istotnym parametrem jest wartość α, która opisuje stopień interferencji pomiędzy dwoma chirpami.

Rozwój tej koncepcji umożliwił wprowadzenie techniki BOK (Binary Orthogonal Keying), która wykorzystuje znak współczynnika modulacji k do zakodowania informacji binarnych. W tej metodzie, dodatni współczynnik k0 koduje cyfrę binarną "1" (chirp w górę), natomiast jego negatywny odpowiednik, -k0, koduje cyfrę binarną "0" (chirp w dół). Takie podejście ma swoje zalety w kontekście prostoty implementacji i efektywności w warunkach niskiej przepustowości.

W późniejszych badaniach, koncepcja "punktów zwrotnych" w współczynniku k, zaprezentowana przez Ka i in. [6], pozwala na dalszy rozwój tej metodologii, osiągając wyższy porządek modulacji. W tej metodzie, różne symbole mogą być rozróżniane na podstawie zmieniających się punktów zwrotnych w chirpach, co prowadzi do formy luźnej ortogonalności. Jak pokazano na rysunku 4.8, symbole s1 i s2 są różnicowane przez punkt zwrotny, który pojawia się w różnych momentach czasu. Zasada ta znajduje zastosowanie również dla innych symboli, jak s3 i s4, co pozwala na uzyskanie wyższego porządku modulacji, a tym samym na efektywniejsze przesyłanie danych.

Jednym z wyzwań w modulacjach opartych na chirpach jest wysoka złożoność obliczeniowa wymagania procesu demodulacji. Zwykle wymaga on zastosowania filtrów dopasowanych, które dość intensywnie obciążają procesor. Funkcja filtra dopasowanego polega na korelowaniu sygnału odbieranego r(t) z uprzednio przygotowanym wzorcem si(t). W przypadku wysokiego porządku modulacji, każdy symbol informacyjny ma swój unikalny wzorzec referencyjny, co skutkuje koniecznością wykonywania obliczeń dla każdego możliwego symbolu.

Na zakończenie, warto zwrócić uwagę, że modulacja oparta na chirpach nie jest wolna od problemów związanych z interferencją między nośnymi oraz efektem Dopplera. Dlatego konieczne jest stosowanie dodatkowych technik, które minimalizują wpływ tych zakłóceń i zapewniają wysoką jakość transmisji w warunkach zmiennych. Ponadto, rozwój bardziej zaawansowanych metod modulacji, jak np. luźna ortogonalność, może pomóc w dalszym zwiększaniu przepustowości systemów akustycznych.

Jak rozpoznawanie gestów może zmieniać interakcję z technologią? – Nowe metody i ich zastosowanie

Rozpoznawanie gestów, wspierane nowoczesnymi metodami przetwarzania sygnałów, staje się coraz bardziej powszechne w różnych dziedzinach, od interakcji z urządzeniami mobilnymi po zastosowania w medycynie. W praktyce, wykorzystywanie zasad radaru akustycznego do monitorowania gestów jest jednym z najbardziej efektywnych podejść. Chociaż w przypadkach takich jak monitorowanie oznak życiowych czy śledzenie ruchu głównym celem jest zmiana odległości, to w kontekście rozpoznawania gestów kluczowe jest uchwycenie wzorców w echosygnałach, które powstają w wyniku ruchu dłoni czy innych części ciała. Ważnym wyzwaniem w tym obszarze jest uchwycenie szybkich zmian w tych echosygnałach, co wymaga odpowiednio wysokiej częstotliwości próbkowania.

Z tego powodu, długotrwałe fale, jak na przykład „chirpy” (szerokopasmowe impulsy), które są używane w innych dziedzinach radarowych, okazują się mniej odpowiednie w kontekście rozpoznawania gestów. Zamiast tego, wykorzystywane są sygnały rozprzestrzenione w widmie, takie jak sekwencje Zadoffa-Chu (ZC), kody Barkera, czy sekwencje treningowe GSM. Podstawowe kroki przetwarzania sygnałów w takich systemach obejmują: (i) ekstrakcję profili echa generowanych przez cel gestu, (ii) rozpoznawanie podstawowych wzorców gestów za pomocą metod deterministycznych lub probabilistycznych oraz (iii) przeprowadzenie zaawansowanego rozpoznawania gestów. Dwa konkretne systemy rozpoznawania gestów mogą pomóc wyjaśnić szczegóły związane z algorytmicznymi procedurami.

Rozpoznawanie gestów oparte na efekcie Dopplera

Pierwszy system rozpoznawania gestów oparty jest na efekcie Dopplera. W tym przypadku, emitowane są fale akustyczne o jednolitej częstotliwości w kierunku ręki wykonującej gest, która może się zbliżać lub oddalać od urządzenia. W wyniku efektu Dopplera, gdy dłoń zbliża się do urządzenia, częstotliwość echa wzrasta, natomiast gdy się oddala, częstotliwość spada. Dzięki temu zjawisku można jednoznacznie zidentyfikować gesty, obserwując zmiany częstotliwości echa (w porównaniu do częstotliwości oryginalnej f0). Jednak słabość tych odbić akustycznych może prowadzić do ich zamaskowania przez interferencje wewnętrzne, co wymaga skutecznego ich tłumienia.

Aby pokonać tę trudność, proponuje się kompleksowy system rozpoznawania gestów, który pozwala na maksymalizację rozdzielczości Dopplera, co wiąże się z wyborem najwyższej możliwej częstotliwości f0 dla wysyłanych tonów. Dodatkowo, stosowanie zerowego wypełniania podczas obliczania szybkiej transformaty Fouriera (FFT) w celu uzyskania widma mocy może poprawić rozdzielczość. W przypadku redukcji interferencji wewnętrznych, stosowane są różnorodne metody filtrowania, jak np. filtr CIC (Cascaded Integrator-Comb) oraz filtr MTI (Moving Target Indicator). Filtry te charakteryzują się odpowiednią odpowiedzią częstotliwościową, co pozwala na znaczną redukcję zakłóceń.

Probabilistyczne rozpoznawanie gestów oparte na estymacji kanału

Innym podejściem jest system rozpoznawania gestów oparty na estymacji kanału, inspirowany technikami stosowanymi w komunikacji bezprzewodowej. Kluczowym elementem tego podejścia jest wykorzystanie sygnału, takiego jak sekwencje ZC, kody Barkera czy sekwencje GSM, do oceny charakterystyki dynamicznej kanału komunikacyjnego między nadajnikiem akustycznym a ręką wykonującą gest. Wynikiem tego procesu estymacji kanału są informacje o stanie kanału (CSI), które wykazują wyraźne różnice w zależności od typu gestu. Proces ten, który rozpoczyna się od wyboru odpowiedniego sygnału do estymacji kanału, jest ukierunkowany na zapewnienie odpowiedniej czułości systemu oraz szybkości przetwarzania danych.

Sygnały o wyższej czułości pozwalają na wychwycenie subtelnych różnic w odbiciach, co pozwala na wyraźniejsze rozróżnienie gestów. Przygotowanie macierzy sygnałowej, którą tworzy się na podstawie wielu kolejnych ramek estymacji CSI, umożliwia dalsze przetwarzanie, które ma na celu wykrycie cech charakterystycznych gestu. Otrzymaną macierz można następnie wykorzystać do szkolenia algorytmów klasyfikacji, takich jak modele głębokiego uczenia, w celu umożliwienia rozpoznawania gestów w czasie rzeczywistym.

Dodatkowe aspekty, które powinny zostać uwzględnione w systemach rozpoznawania gestów

Warto zauważyć, że wybór odpowiedniej technologii w kontekście rozpoznawania gestów zależy nie tylko od jej efektywności, ale również od specyfiki zastosowania. Ważnym czynnikiem, który wpływa na skuteczność systemu, jest środowisko, w którym gesty będą wykonywane. Różne materiały i przestrzenie mogą znacząco wpływać na sposób propagacji fal akustycznych, a więc na dokładność rozpoznawania gestów. Ponadto, rozwój metod sztucznej inteligencji i uczenia maszynowego stwarza nowe możliwości w kontekście rozpoznawania złożonych gestów, jak np. sekwencje czy kombinacje prostych gestów.

W kontekście praktycznego zastosowania, istotne jest także zrozumienie, jak dane o gestach mogą być zintegrowane z innymi systemami interaktywnymi. Współczesne technologie wymagają, aby interakcje były możliwie jak najbardziej naturalne, co wiąże się z minimalizowaniem opóźnień w rozpoznawaniu gestów. Należy również uwzględnić aspekty ergonomiczne, takie jak komfort użytkowania i intuicyjność interfejsu, co jest szczególnie ważne w aplikacjach konsumenckich i medycznych.