View syllabus
DATA ANALYSIS
MARCO ROMITO
Academic year2023/24
CourseMATHEMATICS
Code699AA
Credits6
PeriodSemester 2
LanguageItalian

ModulesAreaTypeHoursTeacher(s)
ANALISI DEI DATIMAT/06LEZIONI42
AIKATERINI PAPAGIANNOULI unimap
MARCO ROMITO unimap
Obiettivi di apprendimento
Learning outcomes
Conoscenze

Al termine del corso lo studente avrà acquisito conoscenze di metodi di ``statistical learning'', nelle parti di previsione, inferenza, e implementazione.

Knowledge

Students are expected to acquire knowledge of statistical learning, in view of prediction, inference and implementation.

Modalità di verifica delle conoscenze

Lo studente sarà valutato riguardo la sua abilità di valutare il modello statistico più opportuno per affrontare un problema di ``statistical learning'', e di tradurlo in una soluzione algoritmica.

Assessment criteria of knowledge

The student will be assessed on his/her demonstrated ability to evaluate the best statistical model to predict based on data, and to provide an algorithmic solution.

Capacità

Al termine del corso lo studente

  • sarà in grado di formulare il modello statistico più opportuno per l'analisi quantitativa di dati,
  • saprà implementare l'analisi formulata per mezzo di un software statistico,
  • sarà in grado di trarre conclusioni e formulare previsioni sul problema esaminato.
Skills

At the end of the course the student

  • will be able to formulate a suitable statistical model for the quantitative analysis of data,
  • will be able to implement the model through a statistical software,
  • will be able to formulate conclusions and predictions backed by the data.
Modalità di verifica delle capacità

Le capacità saranno valutate sulla base di una attività di analisi dei dati da svolgere autonomamente. I criteri di giudizio saranno: autonomia nell'uso degli strumenti appresi durante il corso, capacità di ampliare il proprio bagaglio di conoscenze e creatività nel combinare strumenti appresi e nuove conoscenze.

Assessment criteria of skills

Skills will be assessed on the basis of a data analysis activity that will be carried out independently. Assessment criteria will be: autonomy in the use of the tools learnt during the course, ability to expand one's knowledge and creativity in combining them.

Comportamenti

Lo studente maturerà una spiccata sensibilità nella gestione dell'analisi quantitativa di tabelle di dati mediante metodi statistici avanzati di apprendimento automatico.

Behaviors

The student will acquire a keen sense of handling the quantitative analysis of data tables using advanced statistical machine-learning methods.

Modalità di verifica dei comportamenti

Durante le sessioni di esame lo studente sarà esaminato sulle fasi di analisi statistica di una tabella di dati, dal riconoscimento del modello più efficace alla sua implementazione e previsione.

Assessment criteria of behaviors

During the exams, the student will be assessed over her/his attitude from the formulation of a statistical model to its implementation and prediction.

Prerequisiti (conoscenze iniziali)

Ci si aspetta che lo studente conosca i concetti e le idee di base della probabilità e della statistica, e di alcuni argomenti di base riguardanti l'analisi dei dati (regressione multivariata, analisi delle componenti principali, metodi autoregressivi per serie storiche). Ci si aspetta inoltre una conoscenza di base di R o python.

L'insegnamento Statistica Superiore non è necessario ma consigliato, ed è certamente da svolgere prima o alla peggio in parallelo.

Prerequisites

The student is required to know and master basic concepts and ideas of probability and statistics, and a basic introduction to data analysis methods (linear regression, principal components analysis, autoregressive methods for time series). The student is also required to have a basic knowledge of R or python.

The course Advanced Statistics is not necessary but recommended, and should certainly be taken first or at the very worst in parallel.

Indicazioni metodologiche

Il corso prevede lezioni frontali per la parte teorica. La parte implementativa è svolta parzialmente durante il corso, parzialmente come lavoro autonomo dello studente, attraverso lo svolgimento di progetti focalizzati via via su differenti argomenti scelti tra i contenuti del corso da svolgere eventualmente in piccoli gruppi.

Teaching methods

The course is delivered face-to-face. The practical part is developed partly during the course, and partly as homework. Homework is done, possibly, in small working group on problems originated from the content of the course.

Programma (contenuti dell'insegnamento)

Introduzione al ``statistical learning'', apprendimento supervisionato e non supervisionato. Modelli di apprendimento, classi di predittori, apprendimento probabilmente approssimativamente corretto (PAC). Dimensione di Vapnik-Chervonenkis. Esame di alcuni semplici esempi (regressione lineare, varianti non lineari, k-nearest-heighbour). Metodi di valutazione dei modelli (cross-validation, bootstrap, criteri di informazione). Problemi di classificazione mediante regressione logistica, analisi discriminante, support vector machines. Metodi basati su alberi e foreste. Discesa gradiente stocastica e reti neurali. Alcuni problemi di apprendimento non supervisionato.

Syllabus

Introduction to statistical learning, supervised and unsupervised learning. Learning models, prediction classes, probably approximately correct (PAC) models- Vapnik-Chervonenkis dimension. Analysis of some simple examples (linear regression, non-linear variants, k-nearest-neighbour). Assessment of models (cross-validation, bootstrap, information criteria). Classification problems through logistic regression, discriminant analysis, support vector machines. Tree based methods and forests. Stochastic gradient descent and neural networks. Some problems in unsupervised learning.

Bibliografia e materiale didattico

S. Ben-David, S. Shalev-Shwartz: Understanding Machine Learning: From Theory To Algorithms
F. Bach: Learning Theory from First Principles
T. Hastie, R. Tibshirani, J. Friedman: The elements of Statistical Learning
J. Gareth, D. Witten, T. Hastie, R. Tibshirani: An introduction to statistical learning

Bibliography

S. Ben-David, S. Shalev-Shwartz: Understanding Machine Learning: From Theory To Algorithms
F. Bach: Learning Theory from First Principles
T. Hastie, R. Tibshirani, J. Friedman: The elements of Statistical Learning
J. Gareth, D. Witten, T. Hastie, R. Tibshirani: An introduction to statistical learning

Indicazioni per non frequentanti

La frequenza del corso è fortemente consigliata.

Non-attending students info

Course attendance is highly recommended.

Modalità d'esame

La prova d'esame consiste in una prova orale.
Gli studenti frequentanti in alternativa potranno cimentarsi nella realizzazione di un progetto personale di analisi dei dati su un problema fornito dal docente.

Assessment methods

Students will be assessed through an oral exam.  Alternatively, attending students could opt to prepare a  personal project on data analysis over a problem provided by the teacher..

Altri riferimenti web

Il materiale del corso sarà reso disponibile sulla pagina e-learning del corso

Additional web pages

Course material will be made available on the e-learning page of the course

Updated: 22/08/2023 14:19