Il corso è suddiviso in due moduli.
DATA MINING: FONDAMENTI
I formidabili progressi della potenza di calcolo, della capacità di acquisizione e memorizzazione dei dati e di connettività hanno creato quantità di dati senza precedenti. Il data mining, ovvero la scienza dell’estrazione di conoscenza da tali masse di dati, si è quindi affermato come ramo interdisciplinare dell’informatica.
Le tecniche di data mining sono state applicate a molti problemi in ambito industriale, scientifico e sociale, e si ritiene che avranno un impatto sempre più profondo sulla società. L’obiettivo del corso è quello di fornire un’introduzione ai concetti di base del data mining e del processo di estrazione della conoscenza, con approfondimenti sui modelli analitici e gli algoritmi più diffusi.
DATA MINING: ASPETTI AVANZATI E APPLICAZIONI
La seconda parte del corso completa le conoscenze del primo modulo con una rassegna delle tecniche avanzate per il mining per dati tabulari e tecniche avanzate di mining per nuove forme di dati. Le tecniche avanzate di classificazione sono relative a reti neurali, SVM, metodi ensemble. Nuovi problemi affrontati sono outlier detection, transactional clustering, time series forecasting e sequential pattern mining. Inoltre vengono analizzati problemi relativi alla privacy, explainability e fairness.
DATA MINING: FOUNDATIONS
The formidable advances in computing power, data acquisition, data storage and connectivity have created unprecedented amounts of data. Data mining, i.e., the science of extracting knowledge from these masses of data, has therefore been affirmed as an interdisciplinary branch of computer science.
Data mining techniques have been applied to many industrial, scientific, and social problems, and are believed to have an ever deeper impact on society. The course objective is to provide an introduction to the basic concepts of data mining and the process of extracting knowledge, with insights into analytical models and the most common algorithms.
DATA MINING: ADVANCED ASPECTS AND APPLICATIONS
The second part of the course completes the knowledge of the first module with:
Per la verifica delle conoscenze acquisite nel corso gli studenti dovranno sostenere una prova scritta che coprirà tutti gli argomenti trattati a lezione. Inoltre sarà chiesto agli studenti di organizzarsi in gruppi di tre unità per collaborare alla realizzazionee un progetto che ha l'obiettivo di analizzare un dataset con i diversi metodi di mining presentati a lezione.
Infine, lo studente dovrà anche sostenere una prova orale sugli argomenti trattati nei due moduli.
- In the written exam, the student must demonstrate his/her knowledge of the course topics simulating the data mining algorithms.
- In the oral exam the student must demonstrate the knowledge of the theory and must discuss the project report with a group presentation.
Al termine dei due moduli lo studente sarà in grado di:
At the end of the course the student will be able to
Lo studente potrà maturare abilità nel lavoro di gruppo. Inoltre potrà acquisire e/o sviluppare opportune sensibilità nelle scelte progettuali e di impostazione del processo analitico. Infine, lo studente potrà imparare come intepretare i risultati analitici e come visualizzarli in modo opportuno.
The student can master skills in team work. It will also acquire and / or develop appropriate sensitivity in the choices for the design and set-up of an analytical process. Finally, the student will learn how to interpret analytical results and how to visualize them properly.
In fase di esame saranno valutate le scelte progettuali effettuate dal gruppo di studenti e la capacità di elaborazione dei dati con strumenti di analytica e di mining. Inoltre, saranno valutate l’accuratezza e la precisione applicata dal gruppo nello svolgere le attività progettuale.
During the exam, the project choices made by the student group and the ability to process the data with analytical and mining tools will be evaluated. In addition, the accuracy and precision applied by the group in the design activities will be evaluated.
Delivery: face to face
Learning activities:
Attendance: Advised
Teaching methods:
DATA MINING: ASPETTI AVANZATI E APPLICAZIONI
DATA MINING: advanced aspects and applications
BOOKS
SOFTWARE
BOOKS
SOFTWARE
Le esercitazioni svolte in aula e le slides possono essere scaricati dal sito web del corso: http://didawiki.di.unipi.it/doku.php/dm/start
Exercises and slides may be downloaded from the web site: http://didawiki.di.unipi.it/doku.php/dm/start
L'esame consiste in una prova scritta sugli argomenti trattati a lezione(sostituita nel periodo Covid-19 dalla prova orale) , un progetto svolto in gruppi di tre unità e una prova orale che prevede la discussione del progetto e la verifica dell'acquisizione delle nozioni teoriche
The exam consists of a written test on the topics discussed in the classes, a project carried out in groups of three people and an oral test that involves the discussion of the project and the verification of the acquisition of theoretical notions