Scheda programma d'esame
BIOINFORMATICS
ROBERTO MARANGONI
Academic year2020/21
CourseMOLECULAR AND CELLULAR BIOLOGY
Code178EE
Credits3
PeriodSemester 1
LanguageItalian

ModulesAreaTypeHoursTeacher(s)
BIOINFORMATICAINF/01LEZIONI32
ROBERTO MARANGONI unimap
Obiettivi di apprendimento
Conoscenze

Il corso è finalizzato a fornire i principali concetti di Bioinformatica, con particolare riferimento alla bioinformatica per l'analisi di sequenze biologiche. Il corso è di tipo elementare e non richiede specifici prerequisiti, in particolare non di tipo informatico.

Modalità di verifica delle conoscenze

- esercizi durante il corso

- simulazione di esami finali

- prove a risposta multipla

Capacità

Uso dei principali applicativi per ricerche in banche dati, allinamenti di sequenze e problemi affini. Capacità di capire il correlato informatico dei problemi dell'elaborazione di dati biologici.

Modalità di verifica delle capacità

- esercizi su problemi-tipo 

Comportamenti

- familiarità con l'uso di strumenti informatici

- capacità di capire i limiti e le corrette modalità d'impiego degli strumenti informatici

Modalità di verifica dei comportamenti

- capacità di risolvere autonomamente i problemi-tipo proposti

Prerequisiti (conoscenze iniziali)

Nessun prerequisito specifico, a parte una generale formazione in biologia e biologia molecolare e nozioni veramente basilari di statistica

Corequisiti

Certamente è molto utile il corso di Biostatistica

Prerequisiti per studi successivi

- indicato per il corso di Analisi Genetiche e Genomiche

Indicazioni metodologiche

Lezioni frontali con esercitazioni al computer. Per il corrente a.a., dati i problemi che la pandemia causa per l'accesso alle aule informatizzate, viene richiesto agli studenti di portare a lezione il proprio computer portatile o un tablet.

Programma (contenuti dell'insegnamento)

Introduzione

Cenni di teoria dell’informazione e di teoria algoritmica dell’informazione. Informazione, entropia e probabilità. Entropia condizionata. Complessità. Codici e canali. Problemi sulle stringhe. Algoritmi per il confronto e l’allineamento di stringhe.

 

Parte I: la bioinformatica orientata alle sequenze

 

Dati biologici e loro manipolazione

Basi di dati di sequenze di macromolecole biologiche. Problemi relativi all’archiviazione e alla ricerca di sequenze di macromolecole. Le banche dati esistenti: struttura dei record e strategie di interrogazione. Concetto di “database annotato”. Algoritmi per sequenze biologiche. Algoritmi per la ricerca di somiglianze tra sequenze. Algoritmi per l’allineamento tra sequenze. BLAST, FASTA.

 

Analisi comparativa ed evolutiva di sequenze biologiche

Multiallineamento. Costruzione di alberi filogenetici rooted e unrooted. PHYLIP. Problemi relativi alle stime temporali su alberi filogenetici.

 

Analisi di genomi completi

Ortologie e paralogie. Autosomiglianze. Disegno di primers ottimali per PCR. Risultati dell’analisi statistica di alcuni dei genomi completi noti. Ipotesi delle duplicazioni ancestrali. Database di genomi completi e strumenti di pubblico dominio per l’analisi di genomi completi. Predizione di sequenze trascriventi e non trascriventi. Predizione di ORI, ORF, introni/esoni. Algoritmi per la ricerca e la predizione di TFBS. Predizione di regioni S/MAR. Siti fragili. DNA satellite e correlazioni long-range. Analisi della variazione della complessità lungo sequenze genomiche.

 

Parte II: bioinformatica & NGS

Introduzione alle tecnologie NGS. Formato dei file Fastq, Bam, Cram, VCF. Assemblaggio de novo. Mapping di sequenze. Annotazione di variante. Stima dell’espressione e dell’espressione differenziale

 

Parte III: la bioinformatica orientata alle funzioni

Reti di controllo genico e metabolic pathways. Descrizione del flusso informazionale all’interno di una cellula. Ruolo dei sistemi formali. I proteomi. Database di proteomi. Uso dei proteomi nella genetica funzionale.

 

Parte IV: esercitazioni al computer

La struttura di Internet: ambienti e applicativi su rete. Siti di interesse biologico. Interrogazioni ai database. Uso guidato dei vari software illustrati nel corso. Applicazione pratica di ciascuna nozione teorica illustrata.

Bibliografia e materiale didattico
  • Lesk, “Bioinformatica”, McGraw-Hill.
  • Pascarella e Paiardini, “Bioinformatica”, Zanichelli
  • Helmer-Citterich et al, “Fondamenti di Bioinformatica”, Zanichelli

Materiale fornito dal docente

Modalità d'esame

Test a risposta multipla, eventualmente integrato di colloquio orale.

Updated: 16/09/2020 13:10