Lo studente che completerà con successo il corso avrà una solida conoscenza dei principali aspetti progettuali di una classe di database, i Data Warehouse, che permettono di analizzare i processi di business al fine di supportare decisioni informate su come migliorarli. Lo studente acquisirà la conoscenza sui metodi di progettazione concettuale, logica e fisica, sul linguaggio di interrogazione SQL Analitico, sulle tecniche di ottimizzazione dell'esecuzione delle query (viste materializzate, riscritture, anticipazioni) di interrogazione dei Data Warehouse.
Lo studente apprenderà i principali software di Business Intelligence (BI); per la progettazione e lo sviluppo di datawarehouses, cubi OLAP, e report; e per l'applicazione di modelli predittivi di data mining. Lo studente sarà capace di valutare con indipendenza e autonomia i diversi tipi di software di BI con riferimento ai requisiti di uno specifico task di analisi.
The student who successfully completes the course will be able to demonstrate advanced knowledge of the main issues related to the use of specific databases, the Data Warehouses, organized to create the right models for measurable key business processes, to support informed decisions about how to improve them. The student will acquire knowledge of the fundamental concepts about a conceptual model for designing data warehouses used to analyze key business processes that are measurable and worthy of improvements, the logical data model to implement them, the analytic SQL for producing interesting reports to evaluate the performance of the modeled key processes in order to improve them. Lastly, the student will be aware of how to use a specialized DBMS in the right way to develop a best performing business intelligence application.
The student will have knowledge about and will be able to apply the main software technologies of Business Intelligence (BI) for accessing data; for designing and developing datawarehouses, OLAP data cubes, and reports; and for extracting and applying predictive data mining models. The student will be able to assess, with independence and autonomy, the current and future software technologies for BI with regard to the requirements of a specific data analysis task.
La valutazione delle conoscenze teoriche avviene per mezzo di una prova scritta e orale, mentre le conoscenze progettuali nell'uso di tool e metodologie di BI per il problem solving verranno valutate attraverso un progetto con discussione orale. Nella prova scritta gli studenti dovranno dimostrare la conoscenza acquisita attarverso domande ed esercizi. Nella prova orale dovranno essere in grado di discutere criticamente gli argomenti del corso con capacità di espressione, appropriatezza terminologica e con formalità di ragionamento.
The assessment of the theoretical part of the course consists of a written test and an oral test, while the knowledge of the tools for BI and of problem solving will be assessed through a lab project followed by an discussion. In the written exam, the student must demonstrate and apply the knowledge of the course's contents to solve problems. During the oral exam the student must be able to demonstrate knowledge of the course contents and be able to discuss the topics thoughtfully and with propriety of expression.
Gli studenti saranno valutati sulla comprensione dei contenuti del corso, sull'uso della terminologia, sulla formalità del ragionamento, in particolare nell'applicare i metodi progettuali e il linguaggio SQL in contesti applicativi. Gli studenti saranno in grado di usare tool e linguaggi per la progettazione di datawarehouses, per il popolamento tramite flussi di ETL, per la progettazione e l'interrogazione di cubi OLAP, per la definizione di report e dashboards utili a supportare decisioni. Essi saranno capaci di applicare strumenti di data mining per l'estrazione di modelli da dati, con particolare riferimento a modelli predittivi.
The student will be able to design Data Warehouses, to query them using analytic SQL queries, and to optimize query execution using indexes and materialized views. The student will be able to use software languages and tools for the design of datawarehouses, for their population through ETL flows, for the design and the query of OLAP data cubes, for the design of reports and dashboards in support of decision making. The student will be also able to apply data mining tools to extract models from data, with special reference to predictive models.
La prova scritta includerà esercizi di progettazione di Data Warehouse, di sviluppo query in SQL analitico, di ottimizzazione delle query analitiche. Il progetto permetterà di verificare le capacità di sviluppo usando software specialistico.
The written exam will include design exercises, SQL query writing, and optimization analysis exercises. The lab project will test the ability of developing solutions using specialized software components.
Gli studenti saranno in grado di approcciare in modo critico lo sviluppo di progettualità complesse che richiedono capacità di interpretare e validare i requisiti dell'utente, nonchè di valutare con autonomia e indipendenza scelte tecnoogiche nello soluzione di problemi di supporto alla decisione.
The student will be able to critically approach complex design processes which require interpreting user requirements. The student will be able to assess with autonomy and indepence the tools and the technologies more appropriate to the problem at hand.
La prova scritta includerà esercizi di progettazione a partire da requisiti utente espressi in linguaggio naturale. Il progetto lascerà spazio a scelte progettuali da motivare criticamente.
The written exam will include design exercises with user requirements in natural language format. The lab project will be open to technological design choices that the student will have to motivate critically.
I prerequisiti su Datawarehousing sono soddisfatti da insegnamenti di Basi di Dati offerti in corsi di laurea di primo livello (algebra relazionale, SQL, architettura dei DBMS) o nel corso 'Databases' presente nell'offerta didattica. I prerequisiti su Data mining sono soddisfatti dall'omonimo corso obbligatorio al primo anno dell'offerta didattica.
The prerequisites on Datawarehousing are typically covered in a Bachelor level course in Databases, including the following topics: relational algebra, SQL, DBMS architectures. The study program includes a 'Databases' course for those which need to cover those topics. The prerequisites on Data Mining are taught in the mandatory course of 'Data mining' offered at the first year of the study program.
Modalità di erogazione: in presenza
Attività di apprendimento:
Frequenza: fortemente consigliata, ma non obbligatoria
Metodologie di insegnamento:
Teaching methods: face to face lectures and exercises on case studies
Learning activities:
Attendance: strongly advised, but not mandatory
Il corso introduce gli approcci principali metodologici e tecnologici per la progettazione ed implementazione di sistemi per il supporto alle decisioni basati sulla Business Intelligence (datawarehousing, data mining ,data science). Il primo modulo copre aspetti quali la progettazione concettuale e logica dei Data Warehouse con casi di studio di complessità crescente, il linguaggio SQL Analitico, le tecniche di ottimizzazione delle query (indici, ottimizzazione delle star join, viste materializzate e riscrittura delle query). Il secondo modulo presenta sistemi e tecnologie di Business Intelligence per l'accesso i dati (file formats, RDBMS standards), per la realizzazione e l'analisi di datawarehouses (ETL, OLAP), per reportistica, e per l'estrazione di conoscenza dai data. Il focus è su tools, sistemi e metodologie di problem solving, con casi di studio e problemi applicativi.
The course presents the main methodological and technological approaches to the design and implementation of decision support systems based on Business Intelligence (datawarehousing, data mining, data science). The first module covers themes such as conceptual and logical Data Warehouses design, data analysis using analytic SQL, algorithms for selecting materialized views, data warehouse systems technology (indexes, star query optimization, physical design, query rewrite methods to use materialized views). The second module presents technologies and systems for data access, for building and analyzing data warehouses, for reporting, and for knowledge discovery in databases. The focus of the module is on the use of tools and on the analysis of application problems by means of non-trivial samples and case studies.
Non vi sono condizioni specifiche per i non frequentanti.
There is no specific rule for non-attending students.
L'esame consiste di una prova scritta ed una prova orale sugli argomenti del primo modulo (50% del voto) ed un progetto con discussione sugli argomenti del secondo modulo (50% del voto).
La prova scritta dura 2 ore ed include domande a risposta aperta ed esercizi (sia sulla progettazione di Data Warehouse che sul linguaggio SQL Analitico). Ciascuna domanda o esercizio contribuisce con un punteggio al totale di 30 punti. Esempi di testi scritti e soluzioni sono pubblicate sulla pagina web del corso. Gli studenti che ottengono almeno 18/30 sono ammessi alla prova orale. La prova orale consiste di domande aperte sugli argomenti del corso.
The exam consists of a written part and an oral part on the topics of the first module (50% of the final grade), and a lab project with discussion on the topics of the second module (50% of the final grade).
The written part lasts 2 hours and it consists of open questions, small exercises, and a Data Warehous design problem. Each question is assigned a grade, summing up to 30 points. Examples with solutions are provided at the course home page. Students are admitted to the oral part if they receive a grade of at least 18 points. Oral consists of critical discussion of the written part and of open questions and problem solving on the topics of the course.