DATA MINING E CLASSIFICAZIONE
(obiettivi)
Obiettivi formativi Grazie ai progressi tecnologici, l'acquisizione dei dati è diventata poco costosa e grandi insiemi di dati vengono accumulati, ad esempio, tramite internet, l'e-commerce o i servizi bancari elettronici. Tali dati possono essere memorizzati nei data warehouse e data mart specificamente destinati al supporto delle decisioni aziendali. Il data mining fornisce le tecniche di gestione e analisi per estrarre le informazioni rilevanti da questi archivi e costruire modelli previsivi, fondamentali in settori quali la valutazione del credito, il marketing, la customer relationship management. Il corso prenderà in esame i metodi di preprocessing dei dati e la loro importanza. Verranno introdotti alcuni modelli non-parametrici di classificazione e regressione: Alberi di decisione, neural networks, support vector machine. Saranno illustrati i metodi di ensemble learning (Bagging, Boosting, Stacking, Blended). Sarà anche affrontata l'elaborazione di dati testuali e di immagini.
Conoscenza e capacità di comprensione. Acquisire le basi delle tecniche affrontate nelle applicazioni di data mining. Comprendere come e perchè scegliere fra metodi statistici alternativi o eventualmente come combinare i diversi metodi. Capacità di trattare grosse masse di dati con l'ausilio dell'opportuno software, commerciale e open source.
Capacità di applicare conoscenza e comprensione. Gli studenti sviluppano capacità critiche attraverso l’applicazione di un'ampia gamma di modelli statistici e di machine learning. Sviluppano inoltre il senso critico attraverso il confronto tra soluzioni alternative allo stesso problema ottenute utilizzando logiche di apprendimento diverse tra loro. Imparano ad interpretare criticamente i risultati ottenuti applicando le procedure a insiemi di dati reali.
Autonomia di giudizio. Gli studenti sviluppano capacità critiche attraverso l’applicazione di un'ampia gamma di machine learning e modelli statistici. Sviluppano inoltre il senso critico attraverso il confronto tra soluzioni alternative allo stesso problema ottenute utilizzando logiche di apprendimento diverse tra loro. Imparano ad interpretare criticamente i risultati ottenuti applicando le procedure a insiemi di dati reali.
Abilità comunicativa. Gli studenti, attraverso lo studio e l'esecuzione di esercizi pratici, acquisiscono il linguaggio tecnico-scientifico della disciplina, che deve essere opportunamente utilizzato sia nelle prove scritte intermedie e finali che nelle prove orali. Le abilità comunicative vengono sviluppate anche attraverso attività di gruppo.
Capacità di apprendimento. Gli studenti che superano l’esame hanno appreso un metodo di analisi che consente loro di affrontare, negli insegnamenti successivi di area statistica, lo studio delle proprietà formali delle procedure di data mining in contesti modellistici più complessi.
|