Nowadays there is an intensive study on the functionalities and capabilities of the robots in order to achieve the goal of building a human-like autonomous robot. In the robotics field, a lot of research has focused on video analysis but the contribution on the audio robot skills is much weaker. This thesis explores the Audio Source Localization problem (ASL) using only the Directions of Arrival (DOAs) estimated by Acoustic Sensors mounted on Mobile Robots connected in a Network. The use of the acoustic DOAs instead of the analysis of the whole audio signal is an innovative method thought for robotics purposes that introduces a new perspective of the audio-video synergy using video sensors for the robot localization in the environment in order to do the extrinsic audio sensor calibration. It is also proposed a new algorithm for localizing the 2D/3D position of an acoustic source using a Gaussian Probability over DOA approach (GP-DOA). Several simulation tests varying the errors over the DOA estimations and over the positions of the robots and the acoustic sources are done. Real test results using Microsoft Kinects as DOA sensors mounted on mobile robots and Aldebaran's NAO robots within the ROS framework, show that the algorithm is robust, modular and the approach can be easily used for robotics applications.

Al giorno d'oggi vi è uno studio intensivo sulle funzionalità e le capacità dei robot al fine di raggiungere l'obiettivo di costruire un robot autonomo simile all'uomo. Nel campo della robotica, la ricerca si è concentrata sull'analisi video, ma il contributo delle competenze audio dei robot è molto più debole. Questa tesi esplora il problema della Localizzazione di Sorgenti Sonore - Audio Source Localization (ASL) - usando solo le Direzioni di Arrivo - Directions of Arrival (DOAs) - stimate da Sensori Acustici montati su Robot Mobili connessi in rete. L'utilizzo di DOAs acustici al posto dell'analisi dell'intero segnale audio è un metodo innovativo pensato per scopi robotici che introduce una nuova visione della sinergia audio-video usando i sensori video per la localizzazione del robot nell'ambiente per calibrare i parametri estrinseci dei sensori audio. Viene altresì proposto un nuovo algoritmo per localizzare la posizione 2D/3D di una sorgente sonora usando un approccio probabilistico basato su Gaussiane e applicato alle DOA - Gaussian Probability over DOA approach (GP-DOA). Sono stati fatti diversi test in simulazione variando l'errore sulle stime delle DOA e l'errore sulle posizioni dei robot e delle sorgenti acustiche. Test reali usando le Microsoft Kinect come sensori DOA montate su robot mobili e robot Aldebaran NAO all'interno del framework ROS, dimostrano che l'algoritmo è robusto, modulare e che l'approccio può essere facilmente usato per applicazioni robotiche.

Robot Audio Localization using Directions Of Arrival / Levorato, Riccardo. - (2015 Jul 28).

Robot Audio Localization using Directions Of Arrival

Levorato, Riccardo
2015

Abstract

Al giorno d'oggi vi è uno studio intensivo sulle funzionalità e le capacità dei robot al fine di raggiungere l'obiettivo di costruire un robot autonomo simile all'uomo. Nel campo della robotica, la ricerca si è concentrata sull'analisi video, ma il contributo delle competenze audio dei robot è molto più debole. Questa tesi esplora il problema della Localizzazione di Sorgenti Sonore - Audio Source Localization (ASL) - usando solo le Direzioni di Arrivo - Directions of Arrival (DOAs) - stimate da Sensori Acustici montati su Robot Mobili connessi in rete. L'utilizzo di DOAs acustici al posto dell'analisi dell'intero segnale audio è un metodo innovativo pensato per scopi robotici che introduce una nuova visione della sinergia audio-video usando i sensori video per la localizzazione del robot nell'ambiente per calibrare i parametri estrinseci dei sensori audio. Viene altresì proposto un nuovo algoritmo per localizzare la posizione 2D/3D di una sorgente sonora usando un approccio probabilistico basato su Gaussiane e applicato alle DOA - Gaussian Probability over DOA approach (GP-DOA). Sono stati fatti diversi test in simulazione variando l'errore sulle stime delle DOA e l'errore sulle posizioni dei robot e delle sorgenti acustiche. Test reali usando le Microsoft Kinect come sensori DOA montate su robot mobili e robot Aldebaran NAO all'interno del framework ROS, dimostrano che l'algoritmo è robusto, modulare e che l'approccio può essere facilmente usato per applicazioni robotiche.
28-lug-2015
Nowadays there is an intensive study on the functionalities and capabilities of the robots in order to achieve the goal of building a human-like autonomous robot. In the robotics field, a lot of research has focused on video analysis but the contribution on the audio robot skills is much weaker. This thesis explores the Audio Source Localization problem (ASL) using only the Directions of Arrival (DOAs) estimated by Acoustic Sensors mounted on Mobile Robots connected in a Network. The use of the acoustic DOAs instead of the analysis of the whole audio signal is an innovative method thought for robotics purposes that introduces a new perspective of the audio-video synergy using video sensors for the robot localization in the environment in order to do the extrinsic audio sensor calibration. It is also proposed a new algorithm for localizing the 2D/3D position of an acoustic source using a Gaussian Probability over DOA approach (GP-DOA). Several simulation tests varying the errors over the DOA estimations and over the positions of the robots and the acoustic sources are done. Real test results using Microsoft Kinects as DOA sensors mounted on mobile robots and Aldebaran's NAO robots within the ROS framework, show that the algorithm is robust, modular and the approach can be easily used for robotics applications.
Robot Audition, DOA Audio Localization
Robot Audio Localization using Directions Of Arrival / Levorato, Riccardo. - (2015 Jul 28).
File in questo prodotto:
File Dimensione Formato  
riccardo_levorato_tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Non specificato
Dimensione 12.94 MB
Formato Adobe PDF
12.94 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3424713
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact