Modules | Area | Type | Hours | Teacher(s) | |
BIOINFORMATICA | INF/01 | LEZIONI | 32 |
|
Il corso è finalizzato a fornire i principali concetti di Bioinformatica, con particolare riferimento alla bioinformatica per l'analisi di sequenze biologiche. Il corso è di tipo elementare e non richiede specifici prerequisiti, in particolare non di tipo informatico.
- esercizi durante il corso
- simulazione di esami finali
- prove a risposta multipla
Uso dei principali applicativi per ricerche in banche dati, allinamenti di sequenze e problemi affini. Capacità di capire il correlato informatico dei problemi dell'elaborazione di dati biologici.
- esercizi su problemi-tipo
- familiarità con l'uso di strumenti informatici
- capacità di capire i limiti e le corrette modalità d'impiego degli strumenti informatici
- capacità di risolvere autonomamente i problemi-tipo proposti
Nessun prerequisito specifico, a parte una generale formazione in biologia e biologia molecolare e nozioni veramente basilari di statistica
Certamente è molto utile il corso di Biostatistica
- indicato per il corso di Analisi Genetiche e Genomiche
Lezioni frontali con esercitazioni al computer. Per il corrente a.a., dati i problemi che la pandemia causa per l'accesso alle aule informatizzate, viene richiesto agli studenti di portare a lezione il proprio computer portatile o un tablet.
Introduzione
Cenni di teoria dell’informazione e di teoria algoritmica dell’informazione. Informazione, entropia e probabilità. Entropia condizionata. Complessità. Codici e canali. Problemi sulle stringhe. Algoritmi per il confronto e l’allineamento di stringhe.
Parte I: la bioinformatica orientata alle sequenze
Dati biologici e loro manipolazione
Basi di dati di sequenze di macromolecole biologiche. Problemi relativi all’archiviazione e alla ricerca di sequenze di macromolecole. Le banche dati esistenti: struttura dei record e strategie di interrogazione. Concetto di “database annotato”. Algoritmi per sequenze biologiche. Algoritmi per la ricerca di somiglianze tra sequenze. Algoritmi per l’allineamento tra sequenze. BLAST, FASTA.
Analisi comparativa ed evolutiva di sequenze biologiche
Multiallineamento. Costruzione di alberi filogenetici rooted e unrooted. PHYLIP. Problemi relativi alle stime temporali su alberi filogenetici.
Analisi di genomi completi
Ortologie e paralogie. Autosomiglianze. Disegno di primers ottimali per PCR. Risultati dell’analisi statistica di alcuni dei genomi completi noti. Ipotesi delle duplicazioni ancestrali. Database di genomi completi e strumenti di pubblico dominio per l’analisi di genomi completi. Predizione di sequenze trascriventi e non trascriventi. Predizione di ORI, ORF, introni/esoni. Algoritmi per la ricerca e la predizione di TFBS. Predizione di regioni S/MAR. Siti fragili. DNA satellite e correlazioni long-range. Analisi della variazione della complessità lungo sequenze genomiche.
Parte II: bioinformatica & NGS
Introduzione alle tecnologie NGS. Formato dei file Fastq, Bam, Cram, VCF. Assemblaggio de novo. Mapping di sequenze. Annotazione di variante. Stima dell’espressione e dell’espressione differenziale
Parte III: la bioinformatica orientata alle funzioni
Reti di controllo genico e metabolic pathways. Descrizione del flusso informazionale all’interno di una cellula. Ruolo dei sistemi formali. I proteomi. Database di proteomi. Uso dei proteomi nella genetica funzionale.
Parte IV: esercitazioni al computer
La struttura di Internet: ambienti e applicativi su rete. Siti di interesse biologico. Interrogazioni ai database. Uso guidato dei vari software illustrati nel corso. Applicazione pratica di ciascuna nozione teorica illustrata.
Materiale fornito dal docente
Test a risposta multipla, eventualmente integrato di colloquio orale.