Artificiell intelligens (AI) för rörelseplanering av självkörande skogsmaskiner

https://www.skogforsk.se/kunskap/kunskapsbanken/2021/artificiell-intelligens-for-rorelseplanering-av-sjalvkorande-skogsmaskiner/

En studie har undersökt hur artificiell intelligens (AI) kan hjälpa till att ge ett bättre underlag för rörelseplanering hos självkörande skogsmaskiner genom att dela upp objekt som kameran ser.

Ett examensarbete gjort på Kungliga Tekniska Högskolan har studerat hur semantisk segmentering* av kamerabilder kan ge ett förbättrat underlag för rörelseplanering hos självkörande skogsmaskiner. Det innebär att en dator på egen hand beräknar den effektivaste vägen för fordonets navigering. Tekniken kan tillämpas för att utveckla autonoma skogsmaskiner. Detta examensarbete var en del av ett större forskningsprojekt som syftar till utveckling och automatisering i skogsbruket.

Så fungerar en rörelseplanerare

En rörelseplanerare tar hjälp av olika sensorer som sitter strategiskt utplacerade på skogsmaskinen. Dessa sensorer använder bland annat laser, ljudvågor och kamerabilder för att informera rörelseplaneraren om sin omgivning. På så sätt kan den få en uppfattning om hur underlaget ser ut och vilka närliggande hinder som kan förekomma.

För navigering användes en kombination av lokal objektdetektering för beskrivning av närliggande föremåls geometri tillsammans med en global positionsbeskrivning, som via GNSS kan berätta var någonstans i skogen maskinen befinner sig.

Informationen möjliggör att rörelseplaneraren kan bestämma åt vilket håll den vill köra för att nå sin destination, samt undvika kollision med närliggande hinder. Att endast kunna upptäcka omgivande objekt har visat sig vara otillräcklig för en effektiv navigering, eftersom rörelseplaneraren även måste kunna förstå vad som omger maskinen och på vilket sätt det skulle kunna påverka navigeringen. Om rörelseplaneraren inte vet skillnaden mellan olika objekt så görs långa och onödiga omvägar för till exempel vildvuxet gräs eller jordhögar. Det finns även en omvänd risk i att rörelseplaneraren klassar kritisk terräng som det bästa alternativet (till exempel våtmark eller hänsynsobjekt) eftersom det kan uppfattas som plan mark.

Artificiell intelligens och Neutrala Nätverk som verktyg

I examensarbetet studerades möjligheten att använda artificiell intelligens (AI) och Neurala Nätverk för att semantiskt segmentera kamerabilder från en skogsmiljö och dela upp de objekt som kameran ser i miljöbeskrivande klasser. Dessa klasser kan ges till rörelseplaneraren, som då kan förstå vad den har upptäckt och på så sätt kan göra smartare val när det gäller navigeringen. Vidare var en del av arbetet att använda kunskap från ett befintligt Neuralt Nätverk och justera det till användning i skogsmiljöer. Metoden kallas ”Transfer learning” och är utvecklad för att slippa det tidsomfattande arbetet med att samla mycket stora mängder data för varje ny applikation. I detta arbete användes en mindre mängd träningsdata (hundratals bilder) specifik för skogsvägskörning för att modifiera ett generellt Neuralt Nätverk skapat med en större datamängd (cirka 9 miljoner bilder) för generell bildsegmentering.

Examensarbetet var en fallstudie om hur olika AI-nätverk och miljöer påverkade hur korrekt och snabbt bilder av skogsmiljö blev indelade och klassificerade.

Som mest användes fem miljöklasser: Hinder, Grenverk, Gräs, Himmel och Stig. Nätverket med bäst klassificeringsförmåga lyckades klassificera cirka 80 procent av kamerabildernas pixlar korrekt och gjorde det med en hastighet på cirka 75 bilder per sekund. Nätverkets storlek hade stor påverkan på både klassificeringsförmåga och hastighet. Trenden var att större nätverk ökade klassificeringsförmågan, men på bekostnad av en minskad hastighet. Dock så bröts denna trend efter en viss nätverksstorlek då endast försämringar påvisades vid ytterligare storleksökning. 50 nätverks-lager visade sig vara optimalt för denna studie.

Tvetydiga objekt leder till felklassificering

En utstickande anledning till felklassificeringen var ovanliga klasser med liten förekomst i den insamlade datamängden. Otydliga gränsområden mellan observerade objekt stod också för en stor felmängd. Som en naturlig följd ökade klassificeringsförmågan när man reducerade antalet tillgängliga klassalternativ, då även mängden gränsområden och de ovanliga klasserna reducerades. Dock hade inte antalet tillgängliga klasser någon påverkan på nätverkets hastighet. Även vilka objekt man hade valt att inkludera i miljöklasserna hade stor påverkan på prestandan. Det visade sig vara viktigt att objekten i en klass visuellt liknade varandra. Tvetydiga objekt med olika färger, former och konturer förvirrade nätverket, vilket försämrade resultaten kraftigt. För vidare studier och utveckling av ett Neuralt Nätverk med chans för ökad klassificeringsförmåga så behövs det samlas in en större mängd data tillhörande den specifika skogsmiljön.

Något som är viktigt att tänka på under insamling är att överväga på vilket sätt de detekterade objekten kommer att påverka navigeringen. Eftersom varje tillagd klass minskar prestandan så bör man i så stor utsträckning som möjligt slå ihop objekt som ger samma utfall i rörelseplaneringen, till exempel stubbar och stenar. Klassificeringshastigheten bör spegla hela skogsmaskinens system. Om fordonets hastighet är låg och kraven på beräkningshastigheter inte är så hög så kan det vara värt att överväga ett tyngre nätverk med högre klassificeringsförmåga. Men om det däremot är snabba beräkningshastigheter som eftersträvas så bör man välja mindre nätverk med aningen sämre prestanda.

* Semantisk segmentering innebär att en bild delas in i olika objekt som bilden innehåller, till exempel bilar, bussar, cyklar och trafikanter särskiljs ur bilden.

Nr 84-2021 Publicerad 2021-09-21 13:54

Teknik & maskinarbete

Maskinteknik

Programvaror

Hållbar industri, innovationer och infrastruktur

Läs mer om de globala målen

Kunskapsbanken

Artificiell intelligens (AI) för rörelseplanering av självkörande skogsmaskiner

Så fungerar en rörelseplanerare

Artificiell intelligens och Neutrala Nätverk som verktyg

Tvetydiga objekt leder till felklassificering

Filip Elander