Negli ultimi anni, il campo d’azione della robotica non si limita più alla sola industria, ma si sta espandendo in sempre più aspetti della vita umana. Per operare con successo in questa grande varietà di contesti, la prossima generazione di robot dovrà diventare sempre più autonoma e pronta ad adattarsi a diversi scenari. In tale contesto, le tecniche di Machine Learning e Reinforcement Learning possono fornire degli strumenti importanti per affrontare le sfide che coinvolgono una diffusione su larga scala dei sistemi robotici. Questi metodi data-driven potranno, potenzialmente, dotare i robot dei mezzi per gestire l’incertezza che caratterizza gli ambienti non strutturati nei quali verranno impiegati. A tale riguardo, i Gaussian Process si sono affermati come una tecnica di Machine Learning molto potente e flessibile. Essi possono essere utilizzati per risolvere complessi problemi di regressione, fornendo direttamente una stima dell’incertezza associata alle previsioni. In questa tesi, presentiamo soluzioni basate su Gaussian Process per diversi problemi di modellazione e controllo. In particolare, abbiamo sviluppato un nuovo algoritmo Model-Based Reinforcement Learning, chiamato Monte Carlo Probabilistic Inference for Learning COntrol (MC-PILCO), che può imparare autonomamente come controllare un sistema. L’algoritmo è stato poi modificato in modo tale da essere capace di gestire la presenza di misure parziali dello stato, condizione comune quando si lavora su sistemi meccanici. La tesi prosegue presentando una strategia data-driven per il controllo di robot, che utilizza dei Gaussian Process per stimare la dinamica inversa, utilizzandola poi all’interno di uno schema di controllo basato su feedback linearization. Infine, concludiamo esplorando le possibilità offerte dai Gaussian Process per la modellizzazione di dinamiche ad alta dimensionalità. Dei Gaussian Process sono stati impiegati sia per imparare una mappa che proietta le osservazioni ad alta dimensione in uno spazio latente di dimensione ridotta, che per stimare una funzione di transizione appropriata all’interno di questo spazio latente. Abbiamo chiamato il modello complessivo Controlled Gaussian Process Latent Variable Model (CGPDM), e lo abbiamo utilizzato per modellare la dinamica di un pezzo di tessuto manipolato da un robot. In ciascuno dei problemi studiati, le nostre soluzioni sono state valutate empiricamente usando dati reali e simulati.

Gaussian Processes for Data-Driven Modeling and Control in Robotic Applications

Fabio Amadio
2021

Abstract

Negli ultimi anni, il campo d’azione della robotica non si limita più alla sola industria, ma si sta espandendo in sempre più aspetti della vita umana. Per operare con successo in questa grande varietà di contesti, la prossima generazione di robot dovrà diventare sempre più autonoma e pronta ad adattarsi a diversi scenari. In tale contesto, le tecniche di Machine Learning e Reinforcement Learning possono fornire degli strumenti importanti per affrontare le sfide che coinvolgono una diffusione su larga scala dei sistemi robotici. Questi metodi data-driven potranno, potenzialmente, dotare i robot dei mezzi per gestire l’incertezza che caratterizza gli ambienti non strutturati nei quali verranno impiegati. A tale riguardo, i Gaussian Process si sono affermati come una tecnica di Machine Learning molto potente e flessibile. Essi possono essere utilizzati per risolvere complessi problemi di regressione, fornendo direttamente una stima dell’incertezza associata alle previsioni. In questa tesi, presentiamo soluzioni basate su Gaussian Process per diversi problemi di modellazione e controllo. In particolare, abbiamo sviluppato un nuovo algoritmo Model-Based Reinforcement Learning, chiamato Monte Carlo Probabilistic Inference for Learning COntrol (MC-PILCO), che può imparare autonomamente come controllare un sistema. L’algoritmo è stato poi modificato in modo tale da essere capace di gestire la presenza di misure parziali dello stato, condizione comune quando si lavora su sistemi meccanici. La tesi prosegue presentando una strategia data-driven per il controllo di robot, che utilizza dei Gaussian Process per stimare la dinamica inversa, utilizzandola poi all’interno di uno schema di controllo basato su feedback linearization. Infine, concludiamo esplorando le possibilità offerte dai Gaussian Process per la modellizzazione di dinamiche ad alta dimensionalità. Dei Gaussian Process sono stati impiegati sia per imparare una mappa che proietta le osservazioni ad alta dimensione in uno spazio latente di dimensione ridotta, che per stimare una funzione di transizione appropriata all’interno di questo spazio latente. Abbiamo chiamato il modello complessivo Controlled Gaussian Process Latent Variable Model (CGPDM), e lo abbiamo utilizzato per modellare la dinamica di un pezzo di tessuto manipolato da un robot. In ciascuno dei problemi studiati, le nostre soluzioni sono state valutate empiricamente usando dati reali e simulati.
File in questo prodotto:
File Dimensione Formato  
tesi_definitiva_Fabio_Amadio.pdf

non disponibili

Tipologia: Tesi di dottorato
Licenza: Accesso privato - non pubblico
Dimensione 32.59 MB
Formato Adobe PDF
32.59 MB Adobe PDF Visualizza/Apri   Richiedi una copia
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3408057
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact