Docente
|
VICHI MAURIZIO
(programma)
OBIETTIVI FORMATIVI
Saper riorganizzare dati multidimensionali con struttura complessa e analizzarli utilizzando metodologie di statistica multivariata con molteplici obiettivi: co-clustering, clustering e riduzione dimensionale, regressione e analisi fattoriale mediante SEM.
Saper prendere decisioni basate su evidenze empiriche dando risposte appropriate alle richieste informative aziendali. Saper estrarre le informazioni rilevanti dai dati di grandi dimensioni (big data).
Programma
Brevi richiami alla statistica multivariata. Le metodologie di classificazione non supervisionata e supervisionata: Classificazione non supervisionata delle unità (cluster analysis), I metodi non gerarchici; K-medie, Pam, K-medie fuzzy; legame singolo, legame medio, legame completo, centroide, metodo di Ward; interpretazione del dendrogramma, metodi di scelta di una partizione; analisi delle componenti principali (PCA); L’analisi Fattoriale; regressione multipla ad effetti fissi o casuali; regressione multivariata multipla.
Approfondimenti: Estensioni del K-medie per dati di dissimilarità; metodi basati sulla verosomiglianza: maximum likelihood clustering, maximum likelihood mixture clustering, EM (modelli gaussiani);
Scelta del numero di cluster e di modelli parsimoniosi mediante criteri informazionali; Valutazione della classificazione mediante campionamento bootstrap; Dendrogrammi parsimoniosi; il Double K-means, estensioni del Double K-means; Analisi in componenti principali disgiunte e non negative; Analisi di fattori disgiunti; Analisi gerarchica di fattori disgiunti per costruire indicatori compositi,
Metodologie di classificazione e riduzione dimensionale congiunte: Classificazione e Analisi in componenti principali disgiunte; il K-medie ridotto, il K-medie fattoriale; Il modello ad equazioni strutturali
Dispense del Corso e algoritmi di matlab
Approfondimenti: G. McLachlan, D. Peel, (2000). Finite Mixture Models, Wiley Series in Probability and Statistics. A. C. Rencher, (2002). Methods of Multivariate Analysis, Wiley Series in Probability and Statistics; 2nd edition; A.D. Gordon (1999). Classification, Chapman & Hall, 2nd edition;
|