Docente
|
PIRRI ARDIZZONE MARIA FIORA
(programma)
Introduzione al corso. Applicazioni.
Classificazione e regressione. Il problema della dimensionalita' dei dati.
Modelli parametrici e non-parametrici. Overfitting. Selezione di modelli.
K-nearest neighbor. No-free lunch theorem. Prima introduzione dei
progetti. Definizione di esperimento stocastico. Interpretazione
Bayesiana e Frequentista dello spazio dei dati. Spazio degli eventi
Elementi di teoria della misura. Insiemi misurabili. Assiomi della
probabilita'. Indipendenza. Probabilita' condizionata. Teorema di Bayes.
Variabili stocastiche discrete e continue. CDF e PDF
Legge dei grandi numeri. Quantile. Media e varianza. Momenti. Distribuzioni.
Distribuzione binomiale. Distribuzione di bernoulli. Distribuzione
multinomiale. Distribuzione multinoulli. Distribuzione di Poisson.
Distribuzione empirica.
Eventi, regole di conteggio. La regola mn. Permutazioni. Combinazioni.
Esempi, calcoli. Regola moltiplicativa delle intersezioni. Probabilita'
totale.
Polinomi di ordine n, regolarizzazione. La distribuzione Gaussiana.
Distribuzione Gaussiana multivariata. Stima dei parametri. Maximum
Likelihood.
Campionamento.
Algebra: Vettore direzione. Proiezioni. Coordinate omogenee. Autovettori
e autovalori. Matrici ortogonali e ortonormali. Differenziazione.
Moltiplicatori di Lagrange. Jacobiano.. Hessiano.
Convoluzione e filtraggio su matrici n-dimensionali. Introduzione alle reti
convoluzionali.
Riconoscimento di numeri da 0 a 9. Il problema MNIST.
Softmax e come settare i parametri. Dati di apprendimento e dati di test.
La discesa del gradiente. Il momento.
Mini-batch. Teorema dell' universalita' delle reti. Suggerimenti per l'
addestramento. Il dropout. Il maxout. Rateo di apprendimento adattivo.
Ottimizzazione: Adagrad, Adadelta, RMSprop, Ada, Adasecant.
Reti con memoria. Calcolo dell' errore e backpropagation. Esempio di
Mazur step by step.
Sigmoid, tanh e relu. Scegliere i metodi di attivazione.
Panorama sui linguaggi e gli ambienti del deep learning: da Cafe a
PyTorch a Tensorflow. Database pubblici. Opportunita' di lavoro.
Panoramica sulle grandi imprese. Discussione sul progetto. Correzione
del compito a casa.
Apprendimento con ricompensa. Stato. Politiche e comportamento di
agenti. Politiche ottimali e ricompense. La funzione azione-Valore. Q-
learning. Esplorazione e sfruttamento.
Un mondo stocastico. Algoritmi x il Q-learning. Dimostrazione di
convergenza. Rappresentazione delle funzioni Q.
Metodo SARSA. La funzione di valore ottimale.
1) Aurelie Geron Hands on Machine Learning,
2) Nishant Shuckla Machine Learning with tensorflow
|