In moderne autonome voertuigen spelen sensoren een cruciale rol bij het verkrijgen van gedetailleerde informatie over de omgeving. Dit stelt de voertuigen in staat om effectief te navigeren en veilige interacties met andere weggebruikers te garanderen. Een van de meest geavanceerde technologieën die wordt gebruikt, is Lidar (Light Detection and Ranging). Door gebruik te maken van Lidar en andere complementaire sensoren, zoals radar en camera's, kunnen autonome voertuigen hun waarnemingsvermogen en reactievermogen aanzienlijk verbeteren.

Lidar-sensoren bieden een gedetailleerd en nauwkeurig beeld van de omgeving door lasers te sturen en het gereflecteerde licht te meten. Dit stelt het voertuig in staat om objecten in de omgeving te detecteren, evenals de afstanden en hoogtes van deze objecten. Een voorbeeld hiervan is de integratie van een 2.5D Lidar van het type ibeo LUX 4L in de voorbumper van het voertuig, die een horizontaal gezichtsveld van 85 graden in vier-laags modus of 110 graden in twee-laags modus biedt. Deze sensor heeft een bereik van maximaal 200 meter en is essentieel voor objectdetectie, maar ook voor het verkrijgen van aanvullende informatie, zoals kleur en textuur. De voordelen van Lidar worden verder versterkt wanneer ze worden gecombineerd met radar. Radar kan beweging detecteren door de Dopplereffecten te gebruiken, wat een voordeel is bij slechte weersomstandigheden. Bovendien is radar minder gevoelig voor omgevingsfactoren, zoals mist of regen, wat de betrouwbaarheid verhoogt. Een voorbeeld hiervan is de Continental ARS 308 radar die naast de Lidar-sensor wordt gemonteerd.

Hoewel Lidar gedetailleerde informatie biedt, mist het vaak robuuste informatie over de weg zelf, zoals wegmarkeringen en grenzen. In dit geval wordt een SICK LMS100-10000 laserafstandsmeter aan de voorkant van het voertuig gemonteerd, waardoor een 270-graden gezichtsveld wordt verkregen. Dit maakt het mogelijk om de staat van de weg beter te begrijpen en te reageren op specifieke markeringen en grenzen. Het gecombineerde gebruik van verschillende sensoren, zoals Lidar voor objectdetectie en de SICK Lidar voor wegbegrip, biedt een geoptimaliseerd systeem dat de prestaties in autonome voertuigen aanzienlijk verbetert.

Naast Lidar en radar spelen andere technologieën een belangrijke rol in de algehele waarneming van het voertuig. Een GNSS-ontvanger, zoals de Magellan ProFlex 500, wordt gebruikt voor de nauwkeurige lokalisatie van het voertuig, waarbij het gebruik van Real-Time Kinematic (RTK) correctie de nauwkeurigheid van GPS-positie tot op centimeters verbetert. Dit is bijzonder belangrijk in omgevingen waar hoge precisie vereist is, zoals in stedelijke gebieden of bij het navigeren in complexe verkeersomstandigheden.

De Inertial Measurement Unit (IMU) is een ander essentieel hulpmiddel voor autonome voertuigen. Deze meet de lineaire versnelling, de hoeksnelheid en de absolute oriëntatie van het voertuig. Wanneer de IMU samenwerkt met de GNSS-ontvanger, kunnen voertuigen zeer nauwkeurige gegevens verkrijgen over hun beweging en oriëntatie. Dit draagt bij aan de nauwkeurige afstemming van de sensoren en maakt het mogelijk om objecten effectief te detecteren, te volgen en te classificeren.

De verzamelde gegevens van alle sensoren, zoals Lidar, radar, camera's en IMU, worden verwerkt door een embedded computing eenheid, die essentiële functies zoals SLAM (Simultaneous Localization and Mapping), sensorfusie, voertuiglokalisatie en padplanning uitvoert. De sensoren zijn allemaal verbonden met een netwerk dat is gekoppeld aan een centrale workstation, waarop de benodigde gegevensverzameling en logging plaatsvinden. Deze hardwarematige infrastructuur maakt het mogelijk om ruwe data in real-time te verzamelen en later offline te verwerken, wat cruciaal is voor de ontwikkeling en het testen van autonome rijtechnologieën.

De integratie van verschillende sensoren biedt niet alleen voordelen in termen van betrouwbaarheid en nauwkeurigheid, maar ook in de mogelijkheid om een robuustere dataset op te bouwen voor verder onderzoek. Het vergelijken van datasets van verschillende autonome voertuigen helpt onderzoekers en ontwikkelaars om de effectiviteit van verschillende sensortechnologieën te evalueren. Bijvoorbeeld, het KITTI-dataset wordt vaak gebruikt voor benchmarking, hoewel het ook enkele beperkingen heeft, zoals het gebruik van één-op-één frame-synchronisatie en een beperkte variëteit aan rijomstandigheden. Dit benadrukt het belang van het ontwikkelen van datasets die een breder scala aan omgevingsfactoren weerspiegelen.

Bij het ontwikkelen van autonome systemen is het van groot belang dat alle sensoren goed zijn gekalibreerd. De kalibratie van de sensoren, zoals camera’s en Lidar-systemen, zorgt ervoor dat de data van verschillende sensoren goed op elkaar is afgestemd. Dit zorgt voor een betere algehele nauwkeurigheid van het systeem. Bij het kalibreren van Lidar-sensoren worden technieken gebruikt die de L2-afstand tussen de puntwolk van verschillende sensoren minimaliseren, wat een betere uitlijning van de sensoren mogelijk maakt. Door de sensoren te kalibreren in een gecontroleerde omgeving met herkenbare markeringen, kan de sensorinformatie geoptimaliseerd worden voor real-time verwerking en objectdetectie.

Daarnaast is het belangrijk om te begrijpen dat de kwaliteit van de verzamelde gegevens sterk afhangt van de omgeving waarin ze worden verzameld. Het verzamelen van gegevens onder verschillende weersomstandigheden, zoals zon, sneeuw, mist of regen, is essentieel voor het ontwikkelen van robuuste systemen die in diverse omstandigheden kunnen functioneren. Dit benadrukt het belang van het gebruik van multi-sensorbenaderingen en het testen van autonome voertuigen in een breed scala van scenario’s.

Wat zijn de uitdagingen van online leren voor mobiele robots?

Offline leermethoden voor robots hebben duidelijke beperkingen die niet kunnen worden genegeerd. Ten eerste gaat offline leren vaak gepaard met aanzienlijke menselijke kosten, zoals dataverzameling, annotatie, modeldebugging en -onderhoud. Daarnaast kunnen offline modellen de langetermijn autonome werking van mobiele robots niet volledig ondersteunen. Dit komt doordat robots altijd worden geconfronteerd met situaties die ze nog niet hebben gezien of geleerd, zoals zeldzame gevallen, langstaartproblemen of verschuivingen in het domein. Een voorbeeld hiervan zijn atypische weggebruikers, wiens detectie en opvolging een uitdaging kunnen vormen voor autonome voertuigen. Zelfs een volledig gedefinieerd operationeel ontwerpgebied (ODD) kan niet elke mogelijke situatie voorzien.

In dit kader zijn er twee belangrijke uitdagingen die specifiek betrekking hebben op online leren voor robots (ROL). De eerste uitdaging heeft betrekking op de autonome extractie van monsters uit sensorgegevens. Mobiele robots maken gebruik van verschillende sensoren om hun interne toestand en de omgeving waar te nemen. De gegevens die sensoren genereren, variëren in vorm: van beelden die door camera's worden geproduceerd tot puntwolken die door 3D-lidars worden gegenereerd. Deze gegevens vertegenwoordigen waarnemingen die door de robot worden gedaan en die vervolgens worden geanalyseerd om informatie van belang te extraheren. Bij objectdetectie bijvoorbeeld, moet de robot de locatie en categorie van het object in elke observatie bepalen en vervolgens gegevens extraheren die het object representeren als leermonster. Dit proces is bijzonder uitdagend in complexe en dynamische omgevingen, zoals universitaire kantines of stedelijke wegen. In het geval van 3D-lidar is het nog moeilijker, omdat de gegevens vaak schaars zijn en er geen eenvoudige leerbare kenmerken, zoals kleur of textuur, aanwezig zijn.

De tweede uitdaging is het voorkomen van het fenomeen van "catastrofale vergeten" tijdens langetermijn ROL. Dit probleem doet zich voor wanneer het nieuwe leren de prestaties van eerder geleerde modellen degradeert. Het risico op catastrofale vergeetachtigheid neemt toe naarmate de diversiteit van de leerdata of taken groter wordt. In mobiele robotica betekent dit dat langdurige inzet van robots altijd leidt tot een grotere diversiteit aan leeropdrachten. Dit probleem is al vele jaren een onderwerp van onderzoek binnen machine learning en is een belangrijke focus binnen de deep learning gemeenschap. Ondanks aanzienlijke vooruitgangen in specifieke gebieden, zijn veel benaderingen om catastrofale vergeetachtigheid te overwinnen moeilijk toepasbaar in robotica vanwege de beperkte rekenkracht en geheugen van robots. Daarom is er behoefte aan ontwikkelingsmethoden die specifiek zijn voor mobiele robots, wat de focus is van dit boek.

Binnen het kader van de huidige technologische ontwikkelingen, richt dit boek zich ook op de integratie van deep learning met ROL. Het belangrijkste probleem hierbij is het efficiënt updaten van rekenintensieve deep neural network-modellen aan boord van robots met beperkte rekenkracht, terwijl tegelijkertijd realtime prestaties behouden blijven. Een van de belangrijkste kenmerken van online leren is dat het leren in real-time plaatsvindt, waarbij het model onmiddellijk kan worden toegepast zonder menselijke tussenkomst. Dit maakt het mogelijk om de robot in staat te stellen om nieuwe taken of objecten autonoom te leren terwijl hij in de echte wereld opereert.

Offline leren is vergelijkbaar met offline programmeren bij industriële robotarmen, waarbij het model volledig wordt getraind voordat het naar de robot wordt gestuurd en vervolgens onveranderd blijft gedurende de operatie van de robot. Dit proces omvat de stappen: dataverzameling, annotatie, modelbouw, training, afstemming en uiteindelijk de implementatie van het model. Wanneer het model moet worden bijgewerkt, moeten sommige of alle stappen opnieuw worden doorlopen. In tegenstelling tot offline leren maakt incrementeel leren zowel online als offline mogelijk, met een focus op het verwerken van continue gegevens zonder strikte real-time eisen. Hoewel er menselijke tussenkomst mogelijk is om het leerproces te begeleiden, is het doel om het catastrofale vergeten te verminderen en kennis te behouden.

Om de afhankelijkheid van complete, geannoteerde datasets en menselijke tussenkomst te verminderen, zijn er verschillende benaderingen voorgesteld. Bijvoorbeeld, Shackleton et al. hebben oppervlaktematching gebruikt voor menselijke detectie in combinatie met een Extended Kalman Filter (EKF) om de positie van een mens te voorspellen en de detectie in een daaropvolgende lidar-scan te vergemakkelijken. Teichman et al. introduceerden een semi-supervised leermethode voor multi-object classificatie, waarbij slechts een klein aantal handmatig gelabelde objecten nodig was om de classifier te trainen. Dewan et al. presenteerden een classifier-vrije benadering voor dynamische objectdetectie en -tracking, die vertrouwt op bewegingssignalen, maar deze is niet geschikt voor langzaam bewegende of statische objecten, zoals voetgangers.

Het werk van Yan et al. introduceerde een ROL-framework voor menselijke classificatie in 3D-lidar scans, dat gebruikmaakt van een multi-target tracker om de behoefte aan menselijke annotatie van sensorgegevens te elimineren. Yan et al. breidden dit framework verder uit door het gebruik van een enkel sensor- of modeltype om een ander model te trainen, waarmee de generaliteit en robuustheid van het ROL-framework werd vergroot. Deze benadering werd vervolgens toegepast op autonome voertuigen om wegdeelnemers, zoals auto's, fietsers en voetgangers, te classificeren. Het recentere werk van Okunevich et al. heeft deep learning-modellen geïntegreerd in het ROL-framework, zodat robots zich kunnen aanpassen aan verschillende omgevingen terwijl ze sociale normen volgen tijdens de navigatie.

Een benadering om het probleem van catastrofale vergeetachtigheid te verminderen, bestaat uit het behouden van eerdere kennis door veranderingen aan de modelgewichten te beperken. Dit kan worden bereikt door bijvoorbeeld een geheugenbuffer te gebruiken om gegevens of gradiënten van eerdere trainingen op te slaan, zodat de updates tijdens het huidige leerproces gecontroleerd kunnen worden. Wanneer het niet haalbaar is om informatie van eerdere taken te behouden vanwege privacy- of resourcebeperkingen, kunnen regularisatie-gebaseerde methoden worden ingezet.

Hoe Robots Sociale Navigatievaardigheden Kunnen Verbeteren door Online Leren

Het verbeteren van de sociale navigatievaardigheden van robots is een uitdaging die nauw verband houdt met het ontwikkelen van systemen die in staat zijn om op een sociaal verantwoorde manier door omgevingen met mensen te bewegen. Dit vereist een dynamische benadering waarbij robotgedrag voortdurend wordt aangepast aan de veranderende sociale contexten, zoals de aanwezigheid en gedragingen van mensen in hun omgeving. In dit kader speelt het gebruik van Reinforcement Learning (RL), en in het bijzonder Socially Attentive Reinforcement Learning (SARL), een cruciale rol.

Het navigatiemodule van de robot vormt de basis van dit sociale leerframework. In dit systeem wordt een waarde-gebaseerde RL-methode gebruikt om de optimale navigatiepolitiek te leren, die de cumulatieve beloning maximaliseert. Dit wordt uitgedrukt als een functie die de robot leert om de kortst mogelijke en sociaal verantwoorde route naar een doel te vinden. Het model gebruikt een constante snelheidsbenadering om menselijke bewegingen over korte tijdsintervallen te voorspellen, wat de robot in staat stelt om zich aan te passen aan dynamische omgevingen en te anticiperen op de bewegingen van mensen.

Een belangrijke wijziging in de SARL-aanpak is de ontwerp van de beloningsfunctie. In plaats van de robot enkel te belonen voor het bereiken van een doel, wordt de robot hier gestimuleerd om de minste afwijking van de ideale route te maken, terwijl hij tegelijkertijd sociaal gedrag vertoont. Dit wordt gerealiseerd door de oorspronkelijke binaire beloning te vervangen door een ratio van de geplande versus de daadwerkelijk afgelegde afstand, wat de robot aanmoedigt om efficiënter en directer te navigeren, maar zonder sociale normen te schenden.

De sociale module komt bovenop de navigatiemodule en is bedoeld om het gedrag van de robot aan te passen op basis van sociale normen. Deze module is gebaseerd op online leren, waarbij de robot voortdurend nieuwe sociale contexten leert uit gegevens over menselijke bewegingen. Dit stelt de robot in staat om zijn gedrag dynamisch bij te stellen op basis van nieuwe informatie, bijvoorbeeld door te leren welke acties sociaal acceptabel zijn en welke niet.

Een belangrijk aspect van de sociale module is het gebruik van tracklets, een reeks van de robot’s posities en snelheden over de tijd. Deze tracklets worden gebruikt om te analyseren hoe de robot zich gedraagt in een bepaalde situatie en of dit gedrag sociaal aanvaardbaar is. De classificatie van deze tracklets wordt gedaan met behulp van een sociale waarde functie, die bepaalt of het gedrag van de robot voldoet aan de sociale normen of niet. Het resultaat is een sociale waarde die de robot helpt bij het maken van meer sociaal verantwoorde beslissingen.

Door het integreren van deze sociale module in het leerproces kan de robot zijn acties beter afstemmen op de dynamische eisen van sociale omgevingen. Zo kan de robot zijn navigatiepolitiek verfijnen, rekening houdend met de nabijheid van mensen en de noodzaak om sociaal gepast gedrag te vertonen. De sociale waarde wordt hierbij gewogen tegen andere factoren, zoals de beloning voor het bereiken van het doel en de waarde van de gekozen actie.

Dit maakt het mogelijk om robots in te zetten in diverse sociale situaties, van drukke winkelcentra tot huizen met meerdere bewoners, waarbij het gedrag van de robot in real-time kan worden aangepast op basis van de sociale context. De belangrijkste uitdaging bij het toepassen van deze technologie ligt in het effectief trainen van de robot om sociale normen in te schatten en hierop te reageren, zonder dat de robot daarbij belangrijke navigatiedoelen verliest.

De mogelijkheid om deze sociale leerprocessen online te updaten is essentieel voor langdurige toepassingen van robots in veranderlijke omgevingen. Hierdoor kan de robot zich blijven aanpassen aan nieuwe situaties en zijn gedrag voortdurend verbeteren naarmate er meer gegevens beschikbaar komen. Dit biedt een enorme potentie voor het gebruik van robots in echte, dynamische omgevingen, waar sociale interactie en compliance met normen cruciaal zijn voor het succes van de robot.

Het is ook belangrijk te beseffen dat de sociale aanpassing van de robot niet alleen afhankelijk is van de technische componenten zoals de beloningsfunctie en de sociale waarde, maar ook van de bredere interactie van de robot met mensen. Het is essentieel om een balans te vinden tussen de noodzaak om snel en efficiënt te navigeren en de vereiste om sociaal acceptabel te handelen. Dit betekent dat robotgedrag altijd moet worden geëvalueerd in de context van de mensen met wie het samenwerkt, en dat er ruimte moet zijn voor voortdurende bijsturing en verfijning.

Hoe Parametrische Benchmarking de Prestaties van Robotica-systemen beïnvloedt

In de wereld van robotica is het uitvoeren van experimenten essentieel om de prestaties van systemen te meten en verbeteren. Dit proces vereist herhaalde testen om statistische analyse mogelijk te maken, wat cruciaal is voor het verkrijgen van betrouwbare en reproduceerbare resultaten. Wanneer experimenten meerdere keren worden uitgevoerd, moeten ze onafhankelijk van elkaar zijn, wat betekent dat ze zowel sequentieel als parallel kunnen worden uitgevoerd, afhankelijk van de beschikbare middelen. De verzamelde gegevens worden vervolgens geëvalueerd met behulp van gedefinieerde metrische indicatoren, waarna de evaluatieresultaten van verschillende methoden worden georganiseerd om benchmarkresultaten te creëren die de voordelen en nadelen van de benaderingen karakteriseren.

Het bepalen van de juiste parameters voor benchmarking is essentieel voor het succes van deze metingen. Deze parameters moeten specifiek zijn voor de taak die wordt uitgevoerd, en een zorgvuldige identificatie en definitie ervan zijn van cruciaal belang voor zowel benchmarking als de verdere ontwikkeling en verbetering van methoden. Het concept van de 'Operational Design Domain' (ODD), dat vooral relevant is in de autonome voertuigtechnologie, illustreert dit goed. Het beschrijft alle mogelijke overlappende omstandigheden, gebruikssituaties, beperkingen en scenario's die autonome voertuigen kunnen tegenkomen, zelfs in de meest ongewone gevallen. Het bepalen van de juiste ODD-omstandigheden is echter een uitdaging, aangezien deze variabelen kunnen variëren van lichtomstandigheden en weersomstandigheden tot terrein en wegtype. Het is van groot belang om deze omstandigheden nauwkeurig in kaart te brengen voor een diepgaand begrip van de werkelijke omstandigheden waarin de robots opereren.

Een voorbeeld hiervan is de taak van multi-robot exploratie, waarbij de complexiteit van de systemen wordt beïnvloed door verschillende parameters die de resultaten van experimenten kunnen beïnvloeden. Er zijn drie hoofdgebieden die essentieel zijn voor multi-robot exploratie: de robot zelf, het team van robots, en de omgeving waarin de robots opereren.

Wat betreft de robot zijn er verschillende belangrijke parameters die een rol spelen. Deze omvatten geometrische kenmerken zoals grootte en vorm, fysieke eigenschappen zoals gewicht en materiaal, chemische eigenschappen die invloed kunnen hebben op de gevoeligheid voor sensoren, en mechanische eigenschappen zoals holonomisch of niet-holonomisch gedrag. Kinematische eigenschappen, zoals snelheid en versnelling, zijn eveneens van belang, evenals de sensoren die op de robot zijn geïnstalleerd en de eigenschappen van de verwerkingscapaciteit aan boord, zoals de CPU en RAM.

In termen van het team zijn de belangrijkste parameters onder meer het aantal robots, de aard van het team (homogeen of heterogeen), en de initiële positie van de robots. Deze factoren kunnen de prestaties van het team aanzienlijk beïnvloeden, aangezien de samenwerking tussen robots cruciaal is voor succes. De communicatie tussen de robots, of dit nu expliciet of impliciet is, is ook een belangrijke overweging. Deze communicatie heeft niet alleen betrekking op de bandbreedte en het bereik, maar ook op het type media en de levensduur van de informatie.

De omgeving waarin de robots opereren is eveneens een sleutelcomponent. De omvang van het te verkennen gebied kan van invloed zijn op de moeilijkheidsgraad van de taak. Een groot gebied kan een grotere uitdaging vormen vanwege de capaciteiten van de sensoren, de uithoudingsvermogen van de robots, en de mogelijkheid om fouten te compenseren. Het terrein en de landvorm, evenals de aanwezigheid van obstakels, zijn andere kritieke factoren. Obstakels kunnen variëren van muren die de Wi-Fi-signalen beïnvloeden tot de complexiteit van dynamische veranderingen, zoals de aanwezigheid van voetgangers. Factoren zoals weersomstandigheden en lichtomstandigheden hebben een directe invloed op de prestaties van de sensoren, vooral visuele sensoren.

Bij de detectie van wegdeelnemers, zoals in autonome voertuigen, kunnen de parameters die de prestaties beïnvloeden worden onderverdeeld in drie hoofdcategorieën: robot, object en omgeving. In dit geval zijn de robot en de omgeving minder complex dan bij multi-robot exploratie, omdat de focus ligt op reactieve waarneming van objecten. De belangrijkste robotparameters omvatten de eigenschappen van de sensoren die de robot gebruikt voor waarneming, evenals de verwerkingscapaciteit aan boord, met name GPU’s die van essentieel belang zijn in de huidige technologie.

De objectkenmerken die van invloed kunnen zijn op de prestaties van objectdetectie omvatten geometrische kenmerken zoals de grootte en vorm van het object, fysieke eigenschappen zoals kleur en textuur, en chemische eigenschappen die het oppervlak van het object bepalen. Kinematische eigenschappen, zoals snelheid en versnelling van het object, spelen ook een rol, evenals biologische kenmerken, bijvoorbeeld de typische bewegingen van mensen.

De omgeving waar objectdetectie plaatsvindt, is bepalend voor de prestaties van de robot. Dynamische veranderingen in de omgeving, zoals de occlusie van objecten door andere objecten, kunnen de detectie bemoeilijken. Daarnaast kunnen weersomstandigheden, lichtomstandigheden en zelfs temperatuur de werking van sensoren beïnvloeden. Het vermogen van de robot om objecten van de omgeving te onderscheiden (discriminabiliteit) is een belangrijk aspect van de detectie.

In de taak van menselijke robotnavigatie moeten de robotkenmerken worden gecombineerd met menselijke kenmerken. De interactie tussen de robot en de mens is van belang, met name de sociale acceptatie van de robot. De esthetische aantrekkelijkheid of afstotelijkheid van de robot speelt hierbij een rol, net zoals psychologische factoren zoals het vertrouwen en de acceptatie van de robot door de mens.

De belangrijkste les die uit deze parameters getrokken kan worden, is het cruciale belang van het zorgvuldig vaststellen van de juiste variabelen voor elke taak en het belang van contextspecifieke evaluatie. Door deze parameters te begrijpen en toe te passen, kunnen onderzoekers en ingenieurs de prestaties van robotsystemen in realistische omstandigheden verbeteren. Het vermogen om op een systematische en herhaalbare manier gegevens te verzamelen en te analyseren maakt het mogelijk om methoden te vergelijken, hun sterke en zwakke punten te identificeren en uiteindelijk innovatie in de robottechnologie te bevorderen.