Scheda programma d'esame
GENETICS AND GENOMIC ANALYSES
STEFANO LANDI
Academic year2020/21
CourseMOLECULAR AND CELLULAR BIOLOGY
Code176EE
Credits6
PeriodSemester 1
LanguageItalian

ModulesAreaTypeHoursTeacher(s)
ANALISI GENETICHE E GENOMICHEBIO/18LEZIONI48
STEFANO LANDI unimap
ROBERTO MARANGONI unimap
Obiettivi di apprendimento
Learning outcomes
Conoscenze

Il corso di Analisi Genetiche e Genomiche si pone l'obiettivo di formare laureati con una specifica competenza nelle tematiche e nelle metodologie caratterizzanti la Genetica, la Genomica e la Trascrittomica nelle loro applicazioni per la ricerca di base e applicata.

Knowledge

The student who successfully completed the course will have the ability to highlight the molecular methods of analysis for amplification, genotyping, and sequencing of DNA samples. The student will be able to understand how genetic markers can be used to discover novel genes involved in mendelian traits as well as in complex phenotypes.

Modalità di verifica delle conoscenze

La verifica delle conoscenze avviene con esame scritto eventualmente (opzionale) seguito da verifica orale (con spostamento della valutazione di + o - 1 punto)

Assessment criteria of knowledge

The exam is written, upon request it is possible to have a further examination as oral (the evaluation could be refined by + or - 1 point) 

Capacità

Al termine del corso lo studente sarà in grado di imparare  un metodo  per allineare sequenze derivanti dai sequenziatori di nuova generazione (Next Generation Sequencing) e disegnare alcuni test molecolari di analisi del DNA, nonchè di contestualizzare l'utilizzo e l'applicazione di una determinata metodica genomica, genetica e di biologia molecolare, con particolare riferimento al campo della biomedicina. Lo studente apprenderà a usare l'ambiente R e in particolare la suite Bioconductor per l'elaborazione di pipeline di analisi su dati genome-wide.

 

Skills

At the end of the course students will be able to manage the reads form the Next Generation Sequencers and to design molecular testing for DNA analysis and be able to interpret the most recent scientific literature regarding the genetics of Mendelian and complex diseases with particular reference to biomedicine and diagnostic field.

Modalità di verifica delle capacità

La verifica delle capacità acquisite avverrà in sede di esame tramite domande aperte o esercizi mirati

Assessment criteria of skills

Verifying the acquired skills will be in the examination via open or targeted exercises questions

Comportamenti

Al termine del corso lo studente avrà le basi necessarie (da approfondire) per progettare uno studio di indagine genetica e molecolare su malattie mendeliane e complesse .  

Behaviors

At the end of the course students will have the necessary foundation (to be deepen) to design a study of genetic investigation of any type of disease, Mendelian or not.

Modalità di verifica dei comportamenti

I comportamenti acquisiti verranno verificati in sede di esame.

Assessment criteria of behaviors

The acqusition of the behaviors will be verified acquired through targeted exercises at the exam.

Prerequisiti (conoscenze iniziali)

Le conoscenze della genetica di base, biologia molecolare e alcune nozioni di statistica sono essenziali. E' utile, ma non indispensabile, la conoscenza dell'ambiente R.

Prerequisites

Knowledge of basic genetics (the undergraduate program) are essential. Some statistical concepts, such as the chi-square test, analysis of variance and simple linear regression would be preferable.

Indicazioni metodologiche

Le lezioni sono tutte di tipo frontale.

Teaching methods

Delivery: face to face

Learning activities:

  • attending lectures
  • preparation of oral/written report
  • individual study

Attendance: Advised

Teaching methods:

  • Lectures
Programma (contenuti dell'insegnamento)

Questo programma e' provvisorio alla data del 16/09/2020.

Presentazione del corso. Libro di testo consigliato. Definizione di genetica. Definizione di Genomica. Il genoma mitocondriale.

I principi del sequenziamento di nuova generazione (next generation sequencing. Prof. Landi).

Modalita' pratiche con utilizzo del proprio PC per analisi dati NGS con la suite Bioconductor in ambiente R (3 CFU a cura del Prof. Marangoni). 

Prof. Landi:

Approccio generico per studiare sequenze di DNA: ibridazione molecolare e clonaggio del DNA. Tecnica del clonaggio in un sistema cellulare.

La PCR. Principio di funzionamento. Descrizione dei singoli reagenti necessari. Visualizzazione del prodotto di PCR. Elettroforesi su gel d’agarosio. Problema delle contaminazioni. Marcatura dei prodotti di PCR: saggi diretti e indiretti. Aggiunta di code al 5’. Applicazioni della PCR. Il disegno dei primers. La Tm dei primers. Hairpin, self-dimers e Dimer. Primers design tools. Dimostrazioni pratiche.

Varianti comuni della PCR. Multiplex PCR. Vantaggi e applicazioni. Nested PCR. Applicazioni. Semi-nested PCR. La PCR asimmetrica. Il metodo diretto del sequenziamento di DNA (reazione di Sanger). PCR con primers allele-specifici (ASO e ARMS-PCR). La PCR inversa. PCR hotstart. Touch-down PCR. Long range PCR. Whole-genome amplification (WGA). DOP-PCR. Adaptor-ligation PCR. Inter-Alu PCR. Phi29 DNA-polymerase (MDA). Primers mutagenetici. Un esempio di mutagenesi sito-specifica con primers mutagenetici: il “QuickChange Lightning Site-Directed Mutagenesis”.

La quantificazione dell’espressione genica. Il Northern Blot. Valutazione dell’integrità dell’RNA e calcolo della purezza e concentrazione. RT-PCR. Real Time PCR. SYBER e EVA-GREEN. Calcolo della efficienza di reazione. Valutazione della specificità di reazione. Molecular Beacons e Sonde Taqman. Disegno di primers e sonde per real-time PCR. Utilizzo delle giunzioni esone-esone per il posizionamento dei primers in qPCR. Calcolo della quantita’ di espressione con metodo qPCR. Utilizzo di geNorm per la selezione dei geni di riferimento. Quantificazione assoluta e relativa (metodo del Delta-Ct e quantity tranformation; metodo del Delta-Delta-Ct approssimato).

I numeri notevoli dell’RNA. Micro-array per analisi di trascrittomica. Principio di funzionamento. Microarray spottati a cDNA, a oligonucleotidi pre-sintetizzati, o a oligonucleotidi sintetizzati in situ. Sintesi di sonde nell’array Affymetrix (metodo di stampa fotolitografico). Tipi di sonde: a cDNA, 65-mers e 25-mers. Metodo competitivo a due colori. Metodi a singolo colore. Analisi dei dati. Estrazione degli spot. Eliminazione degli spot con SNR inferiore a 3. Sottrazione del Background. Normalizzazione. Selezione dei geni differenzialmente espressi. Clustering analysis. Applicazioni in ricerca e in diagnostica (Mamma Print).

Nanostring: principio di funzionamento e applicazioni in ricerca e in diagnostica

Biopsie tissutali; biopsie liquide e relative applicazioni; Droplet Digital PCR: aspetti tecnici e applicazioni; analisi a single cell level: utilizzo di strumentazioni come FACS sorting e Laser Capture Microdissection. Analisi a single cell level: RNA scope, tecnologia e applicazioni.

Organizzazione del genoma umano. Categorie di RNA non codificanti: rRNA, tRNA, snRNA, snoRNA, RNA TERT, RNA Y, RNasi MRP, miRNA, siRNA, piRNA.

Sequenze altamente ripetute: retrotrasposoni LINE1 e SINE con particolare riferimento alle sequenze Alu. Sequenze intersperse: retrotrasposoni LTR. Trasposoni a DNA e meccanismo di trasposizione. Conseguenze mutageniche della retrotrasposizione. Pseudogeni processati. DNA satellite. DNA satellite come marker di instabilità citogenetica. Minisatelliti della famiglia telomerica. Minisatelliti della famiglia ipervariabile. Metodi di indagine dei minisatelliti. DNA fingerprinting in genetica forense. Microsatelliti. Evoluzione delle sequenze ripetute in tandem (mini e micro satelliti). Slippage-misalignment.

Micro-satellite instability. Metodi di indagine dei microsatelliti. DNA profiling in genetica forense. Micro-insersioni. Micro-delezioni.

 

SNPs. Strategie di studio degli SNPs: distinzione tra tecnologie di discovery e tecnologie di genotyping. Strategia di scansione o discovery: metodi conformazionali ed enzimatici. Metodi conformazionali: spiegazione di SSCP, DGGE, dHPLC, HRM tra i metodi conformazionali. CCM e Sanger sequencing tra i metodi enzimatici. Metodi di genotipizzazione: DOT BLOT; RFLP (SOUTHERN BLOT E PCR); ASO PCR; OLA PCR; PIROSEQUENZIAMENTO; MALDI-TOF; TAQ MAN ALLELIC DISCRIMINATION ASSAY.

Genotipizzazione tramite array: APEX; BEAD ARRAY ILLUMIN (GOLDENGATE ASSAY E INFINIUM ASSAY); GENE CHIP AFFYMETRIX.

CNV (duplicazioni; duplicazioni segmentali; delezioni e inversioni); pseudogeni non processati; cenni sulla whole genome duplication; esempi di duplicazioni obbligatorie: i geni delle globine; meccanisimi di formazione alla base delle CNV: non-allelic homologous recombination,ligazione non omologa delle estremità, cromotripsi; implicazioni fisiologiche delle CNV: esempi di polimorfismi in geni implicati nel metabolismo dei farmaci; concetti di farmacogenetica e farmacogenomica; implicazioni patologiche delle CNV: esempi di CNV rilevate in disturbi neurologici; metodiche di analisi delle CNV: TaqMan assay, Digital Droplet PCR, MLPA, QF-PCR.

Comparative Genomic Hybridization (Classical CGH). BAC array CGH, tiling BAC array CGH. SNP array per CGH. Le inversioni segmentali. Un polimorfismo di inversione in 17q21.31

Dal fenotipo al gene. I tratti mendeliani. Identificazione della regione candidata tramite analisi di linkage. Meiosi informative e non informative. Misurare il “contenuto di informazione di un marcatore genetico” (PIC) tramite calcolo della eterozigosita’. Esempi di alberi geneaologici dove capire la “fase gametica” e la prole “ricombinante” e “parentale”. Calcolo del LOD SCORE (mappatura a due punti). Da un singolo marcatore a piu’ marcatori. Il multipoint LOD score. La prima mappa con densita’ elevate dei marcatori umani (CHLC, CEPH). Il multipoint LOD score. La mappatura per i tratti recessivi sfruttando l’autozigosita’. Segmenti cromosomici con “Identity by Descent” (IBD) diversi dai segmenti cromosomici con “Identity by State” (IBS). Esempio di calcolo di LOD score in figli di secondi cugini. Esempi dalla letteratura di mappature per autozigosita’. Possibilita’ di restringere la regione candidata sfruttando l’ancestore comune (esempio della Nijmegen Breakage Syndrome). Clonaggio posizionale, ordinamento dei contigui di cloni e predizione dei loci genici. L’era post-genomica: uso delle banche dati per l’identificazione dei geni nella regione candidata. Geni della regione candidate da sottoporre a screening di mutazione: prioritizzazione sulla base del pattern di espressione, della funzione, delle informazioni provenienti da geni ortologhi e paralogi. L'importanza dei pazienti con anomalie cromosomiche per identificare un gene-malattia. Mutation screening: sequenziamento degli esoni dei geni prioritizzati nei probandi affetti. Analisi parallela del cDNA. Esempi della fibrosi cistica e dell’emofilia grave (fattore VIII). Verifiche all’ipotesi che le mutazioni riscontrate in un probando siano effettivamente causative della patologia: la corrispondenza del modello genetico con la segregazione della mutazione; mutazioni o polimorfismi? Sequenziamento di probandi di famiglie diverse: tre possibili situazioni (stessa mutazione, stesso gene diversa mutazione, nessuna mutazione). Inferire l’effetto funzionale della mutazione (predizione in silico). Identificazione dei geni-malattie con strategie indipendenti dalla posizione: conoscenza del prodotto proteico e utilizzo di modelli animali. Esempi di patologie il cui gene e’ stato rinvenuto tramite clonaggio posizionale: Distrofia muscolare di Dushenne e Fibrosi Cistica.

Genetica e genomica del cancro. Tratti distintivi di una cellula perchè possa essere definita tumorale. Il cancro come un processo multi-stadio. Il cancro come malattia genetica. Oncogeni e oncosoppressori: esempi di mutazioni a carico di queste categorie geniche. Eterogeneità genetica: intratumorale, intermetastatica, intrametastatica, interpaziente. Differenza tra mutazioni passeggere e mutazioni drivers nel cancro e pathways maggiormente coinvolti. Numero e tipologie di mutazioni più frequentemente riscontrate in varie tipologie tumorali. Terapie: dalle convenzionali alle personalizzate. L’esempio del test KRAS. Immunoterapia e definizione di neoantigeni in funzione del carico mutazionale tipico di una cellula tumorale. Visione genomica del cancro. Il Cancer Genome Project.

Storia del Progetto Genoma Umano; Sequenziamento gerarchico; Sequenziamento shotgun; Tecnologia NGS: workflow generale; Metodologie di sequenziamento utilizzate in NGS: sequencing by synthesis; pyrosequencing; proton sequencing; sequencing by ligation; Descrizione della tecnologia NGS con piattaforma Illumina. Descrizione della tecnologia NGS con piattaforma Ion Torrent. Descrizione della tecnologia NGS con piattaforma 454 Roche. Descrizione della tecnologia NGS con piattaforma Solid. Descrizione della tecnologia NGS con piattaforma Helicos. Tecniche di sequenziamento di terza generazione: SMRT (Pacific Bioscience) e Oxoford Nanopore.                        Analisi bioinformatica dei dati NGS: base calling; allinemaento; variant calling; filtering e annotation. Vantaggi e Svantaggi dell'NGS. Applicazioni dell'NGS in genomica, trascrittomica. epigenomica e matagenomica.                                                                                                                      Exome sequencing e whole genome sequencing: workflow operativo, analisi bioinformatica ed esempi in letteratura con particolare riferimento alle malattie genetiche rare. RNA sequencing: workflow operativo, analisi bioinformatica e relative applicazioni dell'RNA-seq nell'analisi di espressione genica differenziale, identificazioni di varianti di splicing, identificazioni di trascitti di fusione e analisi allele specifica. Esempi in letteratura. NGS e cancro: pannelli di geni utilizzati in diagnostica. Metagenomica: workflow operativo ed esempi pratici.

 

prof. Marangoni: i 3 crediti sono focalizzati sulle metodiche bioinformatiche di analisi ed elaborazione dei dati di NGS. Lo strumento fondamentale è rappresentato dalla suite Bioconductor che permette di implementare la quasi totalità delle pipeline normalmente impiegate per l'analisi di dati molecolari. I principali punti che verranno coperti sono:
- Introduzione all'ambiente R (elementi fondamentali del linguaggio, tipi di variabili, costrutti)

- L'ambiente "tidy R": caratteristiche e usabilità per le applicazioni bioinformatiche

- La suite Bioconductor: istallazione e caratteristiche fondamentali

- Acquisizione di dati NGS

- Un esempio di workflow di mappatura e genotipizzazione

- Esempi di workflow per analisi di dati NGS genome-wide

Syllabus

Presentation of the course. Recommended textbook. Definition of genetics. Definition of genomics. The mitochondrial genome.

The technical principles of the next generation sequencing (NGS, Prof. Landi).

Practical course of allignment of DNA reads of a small genome, carried out with your own PC (Prof. Marangoni).

Prof. Landi: Generic approach to study DNA sequences: molecular hybridization and DNA cloning. Cloning technique in a cellular system.

PCR. Principle of operation. Description of the individual reagents needed. Display of PCR product. Electrophoresis on agarose gel. Contamination problem. Marking of PCR products: direct and indirect tests. Adding queues to the 5 '. PCR applications. The design of the primers. The Tm of primers. Hairpin, self-dimers and Dimer. Primers design tools. Practical demonstrations.

Common variants of PCR. Multiplex PCR. Advantages and applications. Nested PCR. Applications. Semi-nested PCR. Asymmetric PCR. The direct method of DNA sequencing (Sanger reaction). PCR with allele-specific primers (ASO and ARMS-PCR). The inverse PCR. PCR hotstart. Touch-down PCR. Long range PCR. Whole-genome amplification (WGA). DOP-PCR. Adapter-ligation PCR. Inter-Alu PCR. Phi29 DNA-polymerase (MDA). Mutagenetic primers. An example of site-specific mutagenesis with mutagenetic primers: the "QuickChange Lightning Site-Directed Mutagenesis".

The quantification of gene expression. Northern Blot. Assessment of RNA integrity and calculation of purity and concentration. RT-PCR. Real Time PCR. SYBER and EVA-GREEN. Calculation of the reaction efficiency. Assessment of the specificity of reaction. Molecular Beacons and Sonde Taqman. Design of primers and probes for real-time PCR. Use of exon-exon junctions for the positioning of primers in qPCR. Calculation of the quantity of expression with the qPCR method. Use of geNorm for the selection of the reference genes. Absolute and relative quantification (Delta-Ct method and quantity tranformation; approximate Delta-Delta-Ct method).

The remarkable numbers of RNA. Micro-array for transcriptomic analysis. Principle of operation. Microarray spotted with cDNA, with pre-synthesized oligonucleotides, or with in situ synthesized oligonucleotides. Synthesis of probes in the Affymetrix array (photolithographic printing method). Types of probes: cDNA, 65-mers and 25-mers. Competitive two-color method. Single color methods. Data analysis. Spot extraction. Elimination of spots with SNR lower than 3. Background subtraction. Normalization. Selection of differentially expressed genes. Clustering analysis. Applications in research and diagnostics (Mamma Print).

Nanostring: operating principle and applications in research and diagnostics

Tissue biopsies; liquid biopsies and their applications; Digital PCR Droplet: technical aspects and applications; single cell level analysis: use of instruments such as FACS sorting and Laser Capture Microdissection. Single cell level analysis: RNA scope, technology and applications.

Organization of the human genome. Non-coding RNA categories: rRNA, tRNA, snRNA, snoRNA, RNA TERT, RNA Y, RNase MRP, miRNA, siRNA, piRNA.

Highly repeated sequences: LINE1 and SINE retrotransposons with particular reference to Alu sequences. Interspersed sequences: LTR retrotransposons. DNA transposons and transposition mechanism. Mutagenic consequences of retrotransposition. Processed pseudogens. Satellite DNA. Satellite DNA as a marker of cytogenetic instability. Minisatellites of the telomeric family. Minisatellites of the hypervariable family. Investigation methods of minisatellites. DNA fingerprinting in forensic genetics. Microsatellite. Evolution of repeated sequences in tandem (mini and micro satellites). Slippage-misalignment.

Micro-satellite instability. Investigation methods of microsatellites. DNA profiling in forensic genetics. Micro-others auctions. Micro-deletions.

SNPs. SNPs study strategies: distinction between discovery technologies and genotyping technologies. Scanning or discovery strategy: conformational and enzymatic methods. Conformational methods: explanation of SSCP, DGGE, dHPLC, HRM among the conformational methods. CCM and Sanger sequencing between enzymatic methods. Genotyping methods: DOT BLOT; RFLP (SOUTHERN BLOT AND PCR); ASO PCR; OLA PCR; pyrosequencing; MALDI-TOF; TAQ MAN ALLELIC DISCRIMINATION ASSAY.

Arenot genotyping: APEX; BEAD ARRAY ILLUMIN (GOLDENGATE ASSAY AND INFINIUM ASSAY); GENE CHIP AFFYMETRIX.

CNV (duplications; segmental duplications; deletions and inversions); unprocessed pseudogenes; notes on whole genome duplication; examples of mandatory duplications: the globine genes; formation mechanisms at the basis of CNVs: non-allelic homologous recombination, non-homologous ligation of the extremities, cromotripsis; physiological implications of CNVs: examples of polymorphisms in genes implicated in drug metabolism; concepts of pharmacogenetics and pharmacogenomics; pathological implications of CNV: examples of CNV detected in neurological disorders; CNV analysis methods: TaqMan assay, Digital Droplet PCR, MLPA, QF-PCR.

Comparative Genomic Hybridization (Classical CGH). CGH BAC array, CGH BAC array tiling. SNP array for CGH. Segmental inversions. An inversion polymorphism in 17q21.31

From phenotype to gene. Mendelian traits. Identification of the candidate region through linkage analysis. Informative and non-informative meiosis. Measure the "information content of a genetic marker" (PIC) by calculating heterozygosity. Examples of geneaological trees where to understand the "gametic phase" and the "recombinant" and "parental" offspring. Calculation of the LOD SCORE (two-point mapping). From a single marker to multiple markers. The multipoint LOD score. The first map with high densities of human markers (CHLC, CEPH). The multipoint LOD score. Mapping for recessive traits by taking advantage of autozygosity. Chromosomal segments with "Identity by Descent" (IBD) other than chromosomal segments with "Identity by State" (IBS). Example of calculation of LOD score in children of second cousins. Examples from the literature of mappings for autozygosity. Possibility to restrict the candidate region by exploiting the common ancestor (example of the Nijmegen Breakage Syndrome). Positional cloning, ordering of contiguous clones and prediction of gene loci. The post-genomic era: use of databases to identify genes in the candidate region. Genes from the candidate region to be subjected to mutation screening: prioritization based on expression patterns, function, information from orthologic and paralogic genes. The importance of patients with chromosomal abnormalities to identify a disease gene. Mutation screening: sequencing of the exons of the prioritized genes in the affected probands. Parallel analysis of the cDNA. Examples of cystic fibrosis and severe hemophilia (factor VIII). Checks on the hypothesis that the mutations found in a proband are actually causative of the pathology: the correspondence of the genetic model with the segregation of the mutation; mutations or polymorphisms? Sequencing of probands from different families: three possible situations (same mutation, same gene different mutation, no mutation). Inferring the functional effect of the mutation (in silico prediction). Identification of disease genes with position independent strategies: knowledge of the protein product and use of animal models. Examples of pathologies whose gene was found through positional cloning: Dushenne muscular dystrophy and Cystic Fibrosis.

Genetics and genomics of cancer. Distinctive features of a cell so that it can be defined as a tumor. Cancer as a multi-stage process. Cancer as a genetic disease. Oncogenes and tumor suppressors: examples of mutations affecting these gene categories. Genetic heterogeneity: intratumoral, intermetastatic, intrametastatic, interpatient. Difference between transient mutations and driver mutations in cancer and pathways most involved. Number and types of mutations most frequently found in various tumor types. Therapies: from conventional to personalized. The example of the KRAS test. Immunotherapy and definition of neoantigens as a function of the mutational load typical of a cancer cell. Genomic view of cancer. The Cancer Genome Project.

History of the Human Genome Project; Hierarchical sequencing; Shotgun sequencing; NGS technology: general workflow; Sequencing methodologies used in NGS: sequencing by synthesis; pyrosequencing; proton sequencing; sequencing by ligation; Description of NGS technology with Illumina platform. Description of NGS technology with Ion Torrent platform. Description of NGS technology with Roche 454 platform. Description of NGS technology with Solid platform. Description of NGS technology with Helicos platform. Third generation sequencing techniques: SMRT (Pacific Bioscience) and Oxoford Nanopore. Bioinformatic analysis of NGS data: base calling; allinemaento; variant calling; filtering and annotation. Advantages and Disadvantages of the NGS. Applications of NGS in genomics, transcriptomics. epigenomics and matagenomics. Exome sequencing and whole genome sequencing: operational workflow, bioinformatics analysis and examples in literature with particular reference to rare genetic diseases. RNA sequencing: operational workflow, bioinformatics analysis and related applications of RNA-seq in the analysis of differential gene expression, identification of splicing variants, identification of fusion transcripts and specific allele analysis. Examples in literature. NGS and cancer: panels of genes used in diagnostics. Metagenomics: operational workflow and practical examples.

 

3 CFU will follow by Prof. Roberto Marangoni on the processing of the NGS output.

Bibliografia e materiale didattico

1) Libri di testo consigliati:

"Genetica molecolare umana ", by Tom Strachan & Andrew P. Read (Zanichelli)

Powepoint forniti dai docenti

 

Bibliography

"Genetica molecolare umana ", by Tom Strachan & Andrew P. Read (Zanichelli)

Modalità d'esame

Prova d'esame orale, preceduta da 20 minuti dedicati allo svolgimento di esercizi scritti.

Assessment methods

20 minutes written exercises plus 3 oral questions

Altri riferimenti web

cercare su e-learning e Moodle

Additional web pages

Look at

e-learning

Moodle

Updated: 16/09/2020 10:41