Onze afstudeerder, Luc van Loo is sinds afgelopen februari bezig geweest met zijn thesis voor de Master Data Science & Society van Tilburg University bij Analyze. Voor het doorontwikkelen van de slimme vergroeningsmonitor voor gemeenten heeft Luc onderzoek gedaan naar het classificeren van verschillende typen groen. Specifiek is gekeken naar het classificeren van bomen tegenover struiken en gras. Voor dit onderzoek heeft hij 3 verschillende machine & deep learning modellen getraind en vergeleken, met als doel te achterhalen welk model het beste gebruikt kan worden.
De onderzoeksvraag luidde dan ook: “Which of the SegFormer, PSPNet, and XGBoost algorithms has the highest performance in classifying the type of urban green spaces in Alkmaar, with and without the height feature in the dataset?”. Een belangrijk aspect van het onderzoek was, naast het bepalen van het optimale model voor deze specifieke taak, in welke mate de hoogte data (LiDAR data) impact had op het resultaat van de modellen.
In het kort concludeerde zijn onderzoek dat het meest simpele model, Extreme Gradient Boosting (XGBoost), de beste resultaten behaalde. Dit was het geval met en zonder de hoogte data. Verrassend was dat de hoogte data maar een minimale impact op de resultaten had.
In het vervolg kunnen we bij Analyze het huidige model verbeteren door meer/betere data toe te voegen en gaan kijken naar een verdere implementatie in de vergroeningsmonitor voor gemeenten.