Artificiell intelligens och Neutrala Nätverk som verktyg
I examensarbetet studerades möjligheten att använda artificiell intelligens (AI) och Neurala Nätverk för att semantiskt segmentera kamerabilder från en skogsmiljö och dela upp de objekt som kameran ser i miljöbeskrivande klasser. Dessa klasser kan ges till rörelseplaneraren, som då kan förstå vad den har upptäckt och på så sätt kan göra smartare val när det gäller navigeringen. Vidare var en del av arbetet att använda kunskap från ett befintligt Neuralt Nätverk och justera det till användning i skogsmiljöer. Metoden kallas ”Transfer learning” och är utvecklad för att slippa det tidsomfattande arbetet med att samla mycket stora mängder data för varje ny applikation. I detta arbete användes en mindre mängd träningsdata (hundratals bilder) specifik för skogsvägskörning för att modifiera ett generellt Neuralt Nätverk skapat med en större datamängd (cirka 9 miljoner bilder) för generell bildsegmentering.
Examensarbetet var en fallstudie om hur olika AI-nätverk och miljöer påverkade hur korrekt och snabbt bilder av skogsmiljö blev indelade och klassificerade.
Som mest användes fem miljöklasser: Hinder, Grenverk, Gräs, Himmel och Stig. Nätverket med bäst klassificeringsförmåga lyckades klassificera cirka 80 procent av kamerabildernas pixlar korrekt och gjorde det med en hastighet på cirka 75 bilder per sekund. Nätverkets storlek hade stor påverkan på både klassificeringsförmåga och hastighet. Trenden var att större nätverk ökade klassificeringsförmågan, men på bekostnad av en minskad hastighet. Dock så bröts denna trend efter en viss nätverksstorlek då endast försämringar påvisades vid ytterligare storleksökning. 50 nätverks-lager visade sig vara optimalt för denna studie.
Tvetydiga objekt leder till felklassificering
En utstickande anledning till felklassificeringen var ovanliga klasser med liten förekomst i den insamlade datamängden. Otydliga gränsområden mellan observerade objekt stod också för en stor felmängd. Som en naturlig följd ökade klassificeringsförmågan när man reducerade antalet tillgängliga klassalternativ, då även mängden gränsområden och de ovanliga klasserna reducerades. Dock hade inte antalet tillgängliga klasser någon påverkan på nätverkets hastighet. Även vilka objekt man hade valt att inkludera i miljöklasserna hade stor påverkan på prestandan. Det visade sig vara viktigt att objekten i en klass visuellt liknade varandra. Tvetydiga objekt med olika färger, former och konturer förvirrade nätverket, vilket försämrade resultaten kraftigt. För vidare studier och utveckling av ett Neuralt Nätverk med chans för ökad klassificeringsförmåga så behövs det samlas in en större mängd data tillhörande den specifika skogsmiljön.
Något som är viktigt att tänka på under insamling är att överväga på vilket sätt de detekterade objekten kommer att påverka navigeringen. Eftersom varje tillagd klass minskar prestandan så bör man i så stor utsträckning som möjligt slå ihop objekt som ger samma utfall i rörelseplaneringen, till exempel stubbar och stenar. Klassificeringshastigheten bör spegla hela skogsmaskinens system. Om fordonets hastighet är låg och kraven på beräkningshastigheter inte är så hög så kan det vara värt att överväga ett tyngre nätverk med högre klassificeringsförmåga. Men om det däremot är snabba beräkningshastigheter som eftersträvas så bör man välja mindre nätverk med aningen sämre prestanda.
* Semantisk segmentering innebär att en bild delas in i olika objekt som bilden innehåller, till exempel bilar, bussar, cyklar och trafikanter särskiljs ur bilden.