Scheda programma d'esame
DATA MINING: ADVANCED TOPICS AND APPLICATIONS
(Data mining: advanced topics and applications)
DINO PEDRESCHI
Anno accademico2018/19
CdSINFORMATICA UMANISTICA
Codice675AA
CFU6
PeriodoSecondo semestre
LinguaInglese

ModuliSettore/iTipoOreDocente/i
DATA MINING: ADVANCED TOPICS AND APPLICATIONSINF/01LEZIONI0
DINO PEDRESCHI unimap
Obiettivi di apprendimento
Learning outcomes
Conoscenze

Il corso presenta allo studente: 

  • una rassegna delle tecniche avanzate per il mining delle nuove forme di dati;
  • una rassegna delle principali aree applicative e di casi di studio paradigmatici.
Knowledge

The course presents to students:

  • A review of advanced techniques for the mining of new forms of data;
  • A review of the main application areas and case studies.
Modalità di verifica delle conoscenze

Per la verifica delle conoscenze acquisite nel corso gli studenti dovranno sostenere una prova scritta che coprirà tutti gli argomenti trattati a lezione.  Inoltre sarà chiesto agli studenti di realizzare un progetto che ha l'obiettivo di analizzare un dataset con i diversi metodi di mining presentati a lezione.

Infine, lo studente dovrà anche sostenere una prova orale sugli argomenti trattati.

Assessment criteria of knowledge

- In the written exam, the student must demonstrate his/her knowledge of the course topics simulating the data mining algorithms.

- In the oral exam the student must demonstrate the knowledge of the theory and must discuss the project report.

Capacità

Al termine del corso lo studente sarà in grado di:

  • progettare un KDD process
  • applicare le diverse tecniche di mining sulla base delle domande analitiche a cui rispondere
  • usare strumenti di mining e librerie python
  • simulare il funzionamento di ogni algoritmo di mining presentato a lezione
Skills

At the end of the course the student will be able to 

  • design a KDD process
  • apply the diffenrt data mining techniques onthe basis of the analytical question to be answered
  • use data mining tools and python libraries 
  • simulate how the data mining algorithms work
Modalità di verifica delle capacità
  • Lo studente durante lo scritto dovrà svolgere degli esercizi che richiedono la simulazione degli algoritmi di mining
  • Lo studente dovrà realizzare e presentare un progetto che richide di analizzare un dataset con i diversi metodi di mining presentati a lezione
  • Lo studente alla fine svolgerà un esame orale per la verifica delle conoscenze teoriche
Assessment criteria of skills

 

  • The student during the written exam will have to perform exercises that require simulation of the mining algorithms
  • The student will have to realize and present a project aiming to analyze a dataset with the different mining methods presented in the classes
  • At the end of the course, the student will perform an oral examination to verify the knowledge of the theory
Comportamenti

Lo studente potrà acquisire e/o sviluppare opportune sensibilità nelle scelte progettuali e di impostazione del processo analitico. Infine, lo studente potrà imparare come intepretare i risultati analitici e come visualizzarli in modo opportuno.

Behaviors

 

The student will also acquire and / or develop appropriate sensitivity in the choices for the design and set-up of an analytical process. Finally, the student will learn how to interpret analytical results and how to visualize them properly.

Modalità di verifica dei comportamenti

In fase di esame saranno valutate le scelte progettuali e la capacità di elaborazione dei dati con strumenti di analytica e di mining. Inoltre, saranno valutate l’accuratezza e la precisione applicata dal gruppo nello svolgere le attività progettuale.

Assessment criteria of behaviors

 

During the exam, the project choices and the ability to process the data with analytical and mining tools will be evaluated. In addition, the accuracy and precision applied by the group in the design activities will be evaluated.

Indicazioni metodologiche

 

  • Il corso si basa su lezioni frontali, con ausilio di slide, ed esercitazioni sia sulla simulazione degli algoritmi che sull'uso di Knime e Python per l'analisi e il mining dei dati (uso del PC personale) 
  • Tutto il materiale didattico verrà caricato sulla pagina del corso presente sul portale Didawiki.
  • Lo studente potrà comunicare con il docente nelle ore di ricevimento e durante le esercitazioni
Teaching methods

Delivery: face to face

Learning activities:

  • attending lectures
  • preparation of oral/written report
  • individual study
  • Laboratory work

Attendance: Advised

Teaching methods:

  • Lectures
  • Task-based learning/problem-based learning/inquiry-based learning
  • project work
Programma (contenuti dell'insegnamento)

 

  • Mining di serie temporali e dati spazio-temporali
  • Mining di dati sequenziali, mining di grandi grafi e reti
  • Tecniche avanzate di classificazione, clustering e outlier detection
  • Linguaggi, standard e architetture dei sistemi di data mining
  • Impatto sociale del data mining
  • Data mining e protezione della privacy
  • Applicazioni: Grande distribuzione, Marketing, CRM, Industria delle telecomunicazioni, Analisi finanziaria, analisi di rischio, Rilevamento di frodi, Pubblica amministrazione e sanità, Mobilità e trasporti
Syllabus

 

  • Mining of time series and spatio-temporal data
  • Mining of sequential data and graphs
  • Advanced techniques for classification, clustering and outlier detection
  • Language, standard and architectures of data mining systems
  • Social impact of data mining
  • Data mining and privacy protection
  • Case studies in socio-economic domains (marketing and CRM, mobility and transport, public health, etc.) 

 

 

 

Bibliografia e materiale didattico

BOOKS

  • Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining. Addison Wesley, ISBN 0-321-32136-7, 2006
  • Berthold, M.R., Borgelt, C., Höppner, F., Klawonn, F. GUIDE TO INTELLIGENT DATA ANALYSIS. Springer Verlag, 1st Edition., 2010. ISBN 978-1-84882-259-7

SOFTWARE

Bibliography

BOOKS

  • Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining. Addison Wesley, ISBN 0-321-32136-7, 2006
  • Berthold, M.R., Borgelt, C., Höppner, F., Klawonn, F. GUIDE TO INTELLIGENT DATA ANALYSIS. Springer Verlag, 1st Edition., 2010. ISBN 978-1-84882-259-7

SOFTWARE

Indicazioni per non frequentanti

Le esercitazioni svolte in aula e le slides possono essere scaricati dal sito web del corso: http://didawiki.di.unipi.it/doku.php/dm/start

Non-attending students info

Exercises and slides may be downloaded from the web site: http://didawiki.di.unipi.it/doku.php/dm/start

Modalità d'esame

L'esame consiste in una prova scritta sugli argomenti trattati a lezione, un progetto e una prova orale che prevede la discussione del progetto e la verifica dell'acquisizione delle nozioni teoriche  

 

Assessment methods


The exam consists of a written test on the topics discussed in the classes, a project and an oral test that involves the discussion of the project and the verification of the acquisition of theoretical notions

Ultimo aggiornamento 01/11/2018 12:01