Docente
|
Colantoni Alessio
(programma)
L’obiettivo del corso è fornire approfondimenti sui principali metodi computazionali utilizzati nei campi della Bioinformatica e della Biologia Computazionale, con particolare attenzione agli approcci omici come l'analisi dei dati di RNA-Sequencing. Gli studenti acquisiranno familiarità con le basi di R, un ambiente di programmazione per il calcolo statistico e la grafica, e lo useranno per l'analisi dei dati di trascrittomica. Il corso sarà strutturato in 3 moduli principali:
1. INTRODUZIONE A R [20 ore]
Introduzione ai linguaggi di programmazione.
Introduzione all'IDE di Rstudio.
Nozioni di base su R:
- Pacchetti
- Principali tipi e operazioni
- Strutture dati (vettori, matrici, array e frame di dati) e funzioni associate
- Subsetting
- Operazioni di input / output (read.table, write.table ...)
- Strutture di controllo: (if, else, for, while, repeat, break, next, return and apply functions)
- Funzioni.
Introduzione alla statistica con esempi in R:
- Tipi di variabili
- Misure riassuntive (media, variabilità, mediana, quantili ...)
- Introduzione alla funzione di densità di probabilità, con particolare attenzione alla distribuzione Normale
- Test di ipotesi con esempi (test t, test chi-quadrato, test non parametrici ...)
- Analisi di correlazione.
Introduzione alla visualizzazione dei dati con esempi in R
- Grafici a linee e serie temporali
- Rappresentazione di una variabile: istogrammi, grafici di densità, grafici a riquadri, grafici a barre, grafici q-q
- Rappresentazione di due variabili: grafici a dispersione e linee di tendenza.
2. INTRODUZIONE ALL’RNA-Seq [24 ore]
Wet Lab:
- Design sperimentale
- Piattaforme principali (Illumina, Nanopore ...)
- Preparazione della libreria
- Reazione di sequenziamento.
Dry Lab:
- Database genomici (Ensembl, UCSC). Accesso all'annotazione di Ensembl con biomaRt
- Formati di file di dati di sequenziamento
- Read preprocessing (adapter trimming, quality filtering...)
- Allineamento di read
- Formati di file di allineamento, elaborazione e visualizzazione
- Quantificazione dell'espressione genica e di trascritti con strumenti alignment-based e alignment-free
- Analisi dell'espressione genica differenziale con esempi in R
- Splicing alternativo: utilizzo differenziale di esoni e di trascritti con esempi in R
- Analisi di arricchimento funzionale (ORA e GSEA) con esempi in R.
3. STRUMENTI COMPUTAZIONALI PER L'ANALISI DEGLI RNA NON CODIFICANTI [4 ore]
- identificazione de-novo di miRNA, lncRNA e circRNA
- annotazione funzionale di molecole di RNA non codificanti.
Le slide e gli scrip R forniti coprono la maggior parte degli argomenti del corso.
Testi consigliati per l'apprendimento di R:
R Cookbook, 2nd Edition, O'Reilly
R Graphics Cookbook, 2nd Edition, O'Reilly
R for data Science, O'Reilly
|