Docente
|
PIRRI ARDIZZONE MARIA FIORA
(programma)
Prima parte del corso: Sequence Learning
27 febbraio No lezioni
7 marzo, Introduzione ai modelli profondi del corso per Computer Vision: modelli Deep Sequence + Modelli di apprendimento Deep Reinforcement
Carta: Sutskever, Ilya, Oriol Vinyals e Quoc V. Le., "Sequenza per l'apprendimento in sequenza con reti neurali",
Intro 2 TF
14 marzo, 2 ore LSTM + 1 ora di esempio in Tensor Flow.
Paper: Mao, Junhua, Wei Xu, Yi Yang, Jiang Wang, Zhiheng Huang e Alan Yuille: "Sottotitoli con reti neuronali ricorrenti multimodali (m-rnn).
21 marzo, 2 ore LSTM + 1 ora di esempio in Tensor Flow.
Paper: Venugopalan, Subhashini, Marcus Rohrbach, Jeffrey Donahue, Raymond Mooney, Trevor Darrell e Kate Saenko: "Sequenza di sequenza-video in testo".
28 marzo, 2 ore LSTM + 1 ora di esempio in Tensor Flow.
Carta: Luong, Minh-Thang, Quoc V. Le, Ilya Sutskever, Oriol Vinyals e Lukasz Kaiser: "Sequenza multi-task per l'apprendimento in sequenza".
4 aprile, 2 ore LSTM + 1 ora di esempio in Tensor Flow.
Paper: "Ordóñez, Francisco e Daniel Roggen:" Profonde reti neurali ricorrenti e lstm ricorrenti per il riconoscimento di attività indossabili multimodali. "
11 aprile, 2 ore LSTM + Stato dell'arte Seq 2: uno strumento di debug visivo per modelli sequenza-sequenza +: stato dell'arte in azione + riconoscimento attività
18 aprile No lezioni
25 aprile No lezioni
Seconda parte: Apprendimento approfondito
Documenti da: http://web.mit.edu/jnt/www/ndp.html
https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python
2 maggio 2 ore RL + 1 h Teoria degli esercizi https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow
9 maggio 2 h RL + 1 h Esercizio in TF https://github.com/openai/gym
16 maggio 2 ore RL + 1 ora Esercizio in TF
Paper: Mnih, Volodymyr, et al. "Human-level control through deep reinforcement learning." Nature 518.7540 (2015): 529.
23 maggio 2 ore RL + 1 ora Esercizio in TF,
Paper: Van Hasselt, Hado, Arthur Guez, and David Silver. "Deep reinforcement learning with double q-learning." Thirtieth AAAI Conference on Artificial Intelligence. 2016.
30 maggio 2 ore RL + 1 ora Esercizio in TF,
Paper: Wang, Ziyu, et al. "Dueling network architectures for deep reinforcement learning." arXiv preprint arXiv:1511.06581 (2015).
Eugene Charniak Introduction to Deep Learning (The MIT Press)
https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow
https://github.com/openai/gym
|