CdSMATEMATICA
Codice699AA
CFU6
PeriodoPrimo semestre
LinguaItaliano
Moduli | Settore/i | Tipo | Ore | Docente/i | |
ANALISI DEI DATI | MAT/06 | LEZIONI | 42 |
|
Al termine del corso lo studente avrà acquisito conoscenze di metodi di ``statistical learning'', sia nella parte di previsione che di inferenza.
Students are expected to acquire knowledge of statistical learning, both in view of prediction and of inference.
Lo studente sarà valutato riguardo la sua abilità di valutare il modello statistico più opportuno per affrontare un problema di ``statistical learning'', e di tradurlo in una soluzione algoritmica.
The student will be assessed on his/her demonstrated ability to evaluate the best statistical model to predict based on data, and to provide an algorithmic solution.
Al termine del corso lo studente
- sarà in grado di formulare il modello statistico più opportuno per l'analisi quantitativa di dati,
- saprà implementare l'analisi formulata per mezzo di un software statistico,
- sarà in grado di trarre conclusioni e formulare previsioni sul problema esaminato.
At the end of the course the student
- will be able to formulate a suitable statistical model for the quantitative analysis of data,
- will be able to implement the model through a statistical software,
- will be able to formulate conclusions and predictions backed by the data.
Il soggetto delle prove d'esame sarà l'analisi e implementazione di modelli statistici.
Analysis of a statistical model and its implementation through a statistical software will be the subject of the final exam.
Il corso permetterà di gestire l'analisi quantitativa di tabelle di dati mediante metodi statistici.
After the course, the student will be able to manage the quantitative analysis of datasets through statistical methods.
Durante le sessioni di esame lo studente sarà verificate sulle fasi di analisi statistica di una tabella di dati, dal riconoscimento del modello più efficace alla sua implementazione e previsione.
During the exams, the student will be assessed over her/his attitude from the formulation of a statistical model to its implementation and prediction.
Ci si aspetta che lo studente conosca i concetti e le idee di base della probabilità e della statistica, e di alcuni argomenti di base riguardanti l'analisi dei dati (regressione multivariata, analisi delle componenti principali, metodi autoregressivi per serie storiche). Ci si aspetta inoltre una conoscenza di base di R o python.
The student is required to know and master basic concepts and ideas of probability and statistics, and a basic introduction to data analysis methods (linear regression, principal components analysis, autoregressive methods for time series). The student is also required to have a basic knowledge of R or python.
Il corso prevede lezioni frontali per la parte teorica. La parte implementativa è svolta parzialmente durante il corso, parzialmente come lavoro autonomo dello studente, attraverso lo svolgimento di progetti focalizzati via via su differenti argomenti scelti tra i contenuti del corso da svolgere in piccoli gruppi.
The course is delivered face-to-face. The practical part is developed partly during the course, and partly as homework. Homework is done in small working group on problems originated from the content of the course.
Introduzione al ``statistical learning''. Esame di alcuni semplici esempi (regressione lineare, varianti non lineari, k-nearest-heighbour). Metodi di valutazione dei modelli (cross-validation, bootstrap, criteri di informazione). Problemi di classificazione mediante regressione logistica, analisi discriminante, support vector machines. Cenni su reti neurali. Metodi basati su alberi e foreste. Alcuni problemi di ``unsupervised learning''.
Introduction to statistical learning. Analysis of some simple examples (linear regression, non-linear variants, k-nearest-neighbour). Assessment of models (cross-validation, bootstrap, information criteria). Classification problems through logistic regression, discriminant analysis, support vector machines. Tree based methods and forests. Short introduction to neural networks. Some problems in unsupervised learning.
J. Gareth, D. Witten, T. Hastie, R. Tibshirani, An introduction to statistical learning
J. Gareth, D. Witten, T. Hastie, R. Tibshirani, An introduction to statistical learning
La frequenza del corso è fortemente consigliata.
Course attendance is highly recommended.
La prova d'esame consiste nel realizzare un progetto personale di analisi dei dati e di dare dettaglio della sua realizzazione in una relazione.
The exams consists in a personal project on data analysis and prepare a report on the analysis.