Confronto tra due algoritmi di machine learning, Random Forest e Support Vector Machine applicati al telerilevamento da drone

Piragnolo, Marco; Vettore, Antonio; Pirotti, Francesco

Questo articolo presenta un confronto tra due tecniche di machine learning che sono implementate nel pacchetto open source R-Cran. I due algoritmi confrontati sono Random Forest (RF) e Support Vector Machine (SVM). L’obbiettivo è di estrarre le classi di uso del suolo, da immagini ad alta risoluzione, ottenute tramite aeromobile a pilotaggio remoto (APR) ad ala fissa ed equipaggiato con un sensore multispettrale. Il sensore registra la riflettanza degli oggetti presenti nell’area di test nelle bande del rosso, del blu, del verde e dell’infrarosso vicino producendo un’immagine (RGBI) che costituisce il data set intero. Le performance di classificazione sono valutate su test set variabili che corrispondono a percentuali dal 2 al 20% del data set intero, e per ogni percentuale le celle sono campionate casualmente. Con questo procedimento si estraggono i test set di training e i test set di validazione che vengono utilizzati per ogni ciclo di campionamento. La varianza del risultato è valutata eseguendo dieci cicli di per ogni test set di training. Il data set di controllo consiste in una classificazione indipendente ottenuta da fotointerpretazione. La validazione è eseguita con tre diversi metodi: (i) K-fold cross-validation, (ii) pixel del test di validazione e (iii) pixel del data set intero. Tramite K-fold cross-validation e test set di validazione i risultati evidenziano che SVM ha performance migliori di RF, mentre con il test set completo, RF ha performance migliori di SVM.