Industrial Statistics and Machine Learning for Product Innovation

Pegoraro, Luca

The term "industrial statistics" indicates those statistical procedures which are designed to solve industrial problems, with the final objective of achieving perfection in industrial processes and products. If the focus is put on the improvement of the current state of the art, the technique of Design of Experiments (DOE) gains a leading position among the many statistical tools available. Therefore, the role of DOE is central for innovation in industry. Another group of techniques for data analysis that is gaining traction in industry is the one of machine learning (ML). ML is a branch of artificial intelligence which deals with the development of predictive models that are trained on a set of data, and are used for prediction on previously unseen data configurations. The topics of DOE and ML, taken separately, have been thoroughly investigated in the scientific literature, and are also commonly applied (especially DOE) in industry. However, the combination of the two techniques has only been seldom investigated, and some questions remain unanswered. In this thesis the intersections between the two topics are studied, and the results show how in a properly planned and conducted study, the two phases can be integrated and can support one another in the aim of achieving better results, that in turn can produce tangible operational advantages for the product innovation (PI) process. Extensive simulation studies have been performed to compare the different statistical techniques and identify the most promising ones, and case studies applications employing real data from industry and literature have been carried out to test the methodologies in a real scenario. Furthermore, a novel sequential methodology that alternates data collection from experimental designs with refinement of the predictive models has been proposed, that shows advantages with respect to competitors from the literature from the point of view of predictive accuracy, also ensuring a quantification of uncertainty of predictions and a certain interpretability of the predictive models. Furthermore, the proposed method is fully data-driven and highly efficient, thus reducing the expected experimentation cost and duration. Throughout the thesis, great importance is put on the issues of quantification of uncertainty of predictions and interpretation of the behavior of the models, two aspects which are often overlooked in the literature, but are necessary to support robust decision making in PI from the results of the models.

Con il termine "statistica industriale" si indica l'insieme di quegli strumenti statistici volti a risolvere problemi in ambito industriale, con l'obiettivo finale di raggiungere la perfezione dei processi e dei prodotti. Se l'attenzione è rivolta al miglioramento dell'attuale stato dell'arte, la tecnica del Design of Experiments (DOE) guadagna una posizione di primo piano tra i numerosi strumenti statistici disponibili. Pertanto, il ruolo del DOE è centrale per l'innovazione in ambito industriale. Un altro gruppo di tecniche per l'analisi dei dati che sta prendendo piede nel settore è quello del machine learning (ML). Il ML è una branca dell'intelligenza artificiale che si occupa dello sviluppo di modelli predittivi addestrati su un insieme di dati e utilizzati per la previsione su configurazioni inedite. I due argomenti del DOE e ML, presi separatamente, sono stati studiati a fondo nella letteratura scientifica e sono anche comunemente applicati (soprattutto il DOE) nell'industria. Tuttavia, la combinazione delle due tecniche è stata approfondita solo di rado e alcune domande rimangono senza risposta. In questa tesi vengono studiate le intersezioni tra i due temi e i risultati mostrano come in uno studio opportunamente pianificato e condotto, le due fasi possono integrarsi e supportarsi a vicenda al fine di ottenere risultati migliori, che a loro volta possono produrre tangibili vantaggi operativi per il processo di innovazione di prodotto. Nella tesi sono stati condotti estesi studi di simulazione per confrontare le diverse tecniche statistiche ed identificare quelle più promettenti, ed inoltre sono stati sviluppati dei casi studio che utilizzano dati reali provenienti da aziende e dalla letteratura scientifica, al fine di testare le diverse metodologie in uno scenario reale. Inoltre, è stata proposta una nuova metodologia sequenziale che alterna la raccolta dei dati utilizzando disegni sperimentali al raffinamento dei modelli predittivi; la metodologia sviluppata mostra vantaggi rispetto alle tecniche concorrenti dal punto di vista dell'accuratezza predittiva, garantendo allo stesso tempo una quantificazione dell'incertezza delle previsioni e fornendo un certo livello di interpretabilità dei modelli predittivi. Inoltre, il metodo proposto è totalmente guidato dai dati ed è altamente efficiente, riducendo così il costo e la durata prevista della fase sperimentale. In tutta la tesi viene data grande importanza ai temi della quantificazione dell'incertezza delle previsioni e dell'interpretazione del comportamento dei modelli, due aspetti spesso trascurati in letteratura, ma necessari per definire un solido processo decisionale a supporto dell'innovazione prodotto a partire dai risultati dei modelli.

Industrial Statistics and Machine Learning for Product Innovation / Pegoraro, Luca. - (2023 Jan 13).

Industrial Statistics and Machine Learning for Product Innovation

PEGORARO, LUCA

2023

Abstract

The term "industrial statistics" indicates those statistical procedures which are designed to solve industrial problems, with the final objective of achieving perfection in industrial processes and products. If the focus is put on the improvement of the current state of the art, the technique of Design of Experiments (DOE) gains a leading position among the many statistical tools available. Therefore, the role of DOE is central for innovation in industry. Another group of techniques for data analysis that is gaining traction in industry is the one of machine learning (ML). ML is a branch of artificial intelligence which deals with the development of predictive models that are trained on a set of data, and are used for prediction on previously unseen data configurations. The topics of DOE and ML, taken separately, have been thoroughly investigated in the scientific literature, and are also commonly applied (especially DOE) in industry. However, the combination of the two techniques has only been seldom investigated, and some questions remain unanswered. In this thesis the intersections between the two topics are studied, and the results show how in a properly planned and conducted study, the two phases can be integrated and can support one another in the aim of achieving better results, that in turn can produce tangible operational advantages for the product innovation (PI) process. Extensive simulation studies have been performed to compare the different statistical techniques and identify the most promising ones, and case studies applications employing real data from industry and literature have been carried out to test the methodologies in a real scenario. Furthermore, a novel sequential methodology that alternates data collection from experimental designs with refinement of the predictive models has been proposed, that shows advantages with respect to competitors from the literature from the point of view of predictive accuracy, also ensuring a quantification of uncertainty of predictions and a certain interpretability of the predictive models. Furthermore, the proposed method is fully data-driven and highly efficient, thus reducing the expected experimentation cost and duration. Throughout the thesis, great importance is put on the issues of quantification of uncertainty of predictions and interpretation of the behavior of the models, two aspects which are often overlooked in the literature, but are necessary to support robust decision making in PI from the results of the models.

Scheda breve

Scheda completa

Scheda completa (DC)

	Titolo in inglese
	
				Industrial Statistics and Machine Learning for Product Innovation
			
	Anno di discussione
	
				13-gen-2023
			
	Abstract
	
				Con il termine "statistica industriale" si indica l'insieme di quegli strumenti statistici volti a risolvere problemi in ambito industriale, con l'obiettivo finale di raggiungere la perfezione dei processi  e dei prodotti. Se l'attenzione è rivolta al miglioramento dell'attuale stato dell'arte, la tecnica del Design of Experiments (DOE) guadagna una posizione di primo piano tra i numerosi strumenti statistici disponibili. Pertanto, il ruolo del DOE è centrale per l'innovazione in ambito industriale. Un altro gruppo di tecniche per l'analisi dei dati che sta prendendo piede nel settore è quello del machine learning (ML). Il ML è una branca dell'intelligenza artificiale che si occupa dello sviluppo di modelli predittivi addestrati su un insieme di dati e utilizzati per la previsione su configurazioni inedite. I due argomenti del DOE e ML, presi separatamente, sono stati studiati a fondo nella letteratura scientifica e sono anche comunemente applicati (soprattutto il DOE) nell'industria. Tuttavia, la combinazione delle due tecniche è stata approfondita solo di rado e alcune domande rimangono senza risposta. In questa tesi vengono studiate le intersezioni tra i due temi e i risultati mostrano come in uno studio opportunamente pianificato e condotto, le due fasi possono integrarsi e supportarsi a vicenda al fine di ottenere risultati migliori, che a loro volta possono produrre tangibili vantaggi  operativi per il processo di innovazione di prodotto. Nella tesi sono stati condotti estesi studi di simulazione per confrontare le diverse tecniche statistiche ed identificare quelle più promettenti, ed inoltre sono stati sviluppati dei casi studio che utilizzano dati reali provenienti da aziende e dalla letteratura scientifica, al fine di testare le diverse metodologie in uno scenario reale. Inoltre, è stata proposta una nuova metodologia sequenziale che alterna la raccolta dei dati utilizzando disegni sperimentali al raffinamento dei modelli predittivi; la metodologia sviluppata mostra vantaggi rispetto alle tecniche concorrenti dal punto di vista dell'accuratezza predittiva, garantendo allo stesso tempo una quantificazione dell'incertezza delle previsioni e fornendo un certo livello di interpretabilità dei modelli predittivi. Inoltre, il metodo proposto è totalmente guidato dai dati ed è altamente efficiente, riducendo così il costo e la durata prevista della fase sperimentale. In tutta la tesi viene data grande importanza ai temi della quantificazione dell'incertezza delle previsioni e dell'interpretazione del comportamento dei modelli, due aspetti spesso trascurati in letteratura, ma necessari per definire un solido processo decisionale a supporto dell'innovazione prodotto a partire dai risultati dei modelli.
			
	Citazione
	
				Industrial Statistics and Machine Learning for Product Innovation / Pegoraro, Luca. - (2023 Jan 13).
			
	Appare nelle tipologie:
	
				08.01 - Tesi di Dottorato UNIPD (Deposito Legale)

File in questo prodotto:

File	Dimensione	Formato
tesi_definitiva_Luca_Pegoraro.pdf embargo fino al 12/01/2026 Descrizione: tesi_definitiva_Luca_Pegoraro Tipologia: Tesi di dottorato Licenza: Altro Dimensione 5.44 MB Formato Adobe PDF Visualizza/Apri Richiedi una copia	5.44 MB	Adobe PDF	Visualizza/Apri Richiedi una copia