Docente
|
GIANSANTI ANDREA
(programma)
INTRODUZIONE E MOTIVAZIONE
-Metodo scientifico e struttura di un lavoro scientifico
-Biologia/Fisica.
-Biologia Numerica (Cell biology by the numbers).
-Elementi di logica: proposizioni funzionali, insiemi, eventi.
-Logica sfumata.
-Eventi, esperimenti, incertezza, probabilità.
-Elementi delle probabilità, probabilità condizionate, teorema di Bayes.
-Tre modi di inferenza: Deduzione, induzione, abduzione.
-Decisioni in condizioni di incertezza.
-La scienza prima e dopo l’ inizio dell’era degli elaboratori (fine anni ’70).
-Dati/Modelli/Calcoli/Simulazioni.
-La nascita della biologia computazionale (in silico).
-Biologia e medicina computazionale dei sistemi.
IMPOSTARE GLI STRUMENTI
Elementi di programmazione e analisi dati in Python e R.
Jupyter notebooks.
STATISTICA DESCRITTIVA
-Variabili discrete, continue e categoriche.
-Compressione dei dati: indici statistici di concentrazione (posizione)e dispersione (variabilità).
-medie, mode, mediane.
-Intervalli di variabilità, percentili, intervalli interquartili, grafici a scatole,
varianza e deviazione standard.
-Frequenze, istogrammi.
-Entropia empirica e informazione.
-Incertezza, precisione e sensibilità.
RAGIONAMENTO PROBABILISTICO
-Idea della probabilità e matematica.
-Distribuzioni di probabilità: discrete/continue, momenti.
-Ci sono solo probabilità condizionate: P(H|I)
-Relevance of Bayes’theorem in computational biology.
-le distribuzioni importanti nell’ analisi dei dati.
-Teorema del limite centrale, legge dei grandi numeri.
-Statistiche non automedianti.
STATISTICA INFERENZIALE
-Popolazione/campione.
-Stima
-Apprendimento automatico: apprendimento statistico dai dati.
-Apprendimento automatico inferenziale: criteri del massimo a posteriori, massima verosimiglianza e
massima entropia nel riconoscimento di schemi(patterns).
-Sopra/sotto adattamento (Over/under fitting).
-Barre di errore: deviazione standard, errori standard, intervalli di confidenza.
TEST DI IPOTESI
-principi: ipotesi nulla e ipotesi alternative.
-Errori di tipoI e tipo II.
-Livelli di confidenza, p-value.
- t-test (ipotesi su valori aspettati, campioni appaiati/non appaiati.
- Test del chi-quadrato.
- Test parametrici/non parametrici.
CORRELAZIONE E REGRESSIONE
-Dipendenza statistica (grado di associazione), test di dipendenza statistica.
-Coefficienti di correlazione.
-Regressione lineare.
CLASSIFICAZIONE E AGGRGAZIONE
-Analisi in componenti principali (PCA).
-Classificatori binari.
-Aggregazione di dati (Clustering).
-Statistica del discernimento (ROC curves)
IL PROBLEMA DELLA RIPRODUCIBILITA NELLA SCIENZA CONTEMPORANEA
Michael C. Whitlock and Dolph Schluter - The Analysis of Biological Data-W. H. Freeman and Company (2015).
Bernard Rosner - Fundamentals of Biostatistics-Brooks Cole (2015).
Alberto Boschetti and Luca Massaron-Python_Data_Science-Packt Publishing (2015).
|