CdSFISICA
Codice360BB
CFU9
PeriodoPrimo semestre
LinguaItaliano
Alla fine del corso lo studente avra' acquisito dimestichezza con i seguenti strumenti per il calcolo scientifico e l'analisi dati:
- comandi avanzati shell unix per automazione di operazioni
- linguaggio python e principali moduli di sistema
- librerie python per calcolo scientifico
- strumenti per la gestione e documentazione del software
- tecniche e librerie per calcolo parallelo e su GPU
- conoscenze dei concetti fondamentali in machine learning e per sviluppo di reti neurali
- reti feed-forward, reti convolutive e reti ricorsive
- reti generative (GAN e autoencoders) e graph networks
- strumenti specifici per applicazioni in fisica delle particelle e/o fisica medica (*)
(*) non disponibile per la versione da 6 CFU del corso
By the end of the course the student will know the following tools for scientific computing and data analysis
- advanced shell commands for automation of operations
- python language and main system modules
- python scientific libraries
- tools for authoring, versioning and documentation of the software
- tecnhiques and libraries for parallel computing and computing on GPU
- fundamental tools and definitions in machine learning
- feedforward networks, CNN, recurrent networks
- generative networks (GAN and autoencoders), graph networks
- specific tools for particles physics or medical physics (*)
(*) not available in the 6 credits version of the course
Sara' effettuata una verifica delle conoscenze acquisite attraverso domande specifiche in sede di esame orale partendo da un progetto di calcolo scientifico realizzato e presentato dagli studenti
Specific knowledge will be verified in the oral exams with questions starting from the project realized and presented by the students.
Al termine del corso lo studente sapra':
- Automatizzare le operazioni di calcolo nelle analisi dati
- Scrivere programmi per calcolo scientifico in linguaggio python
- Sviluppare software in ambienti altamente collaborativi
- Scrivere programmi che sfruttino architetture di calcolo parallelo
- Progettare reti neurali per analisi dati
- Sviluppare reti neurali per calcolo scientifico
- Sviluppare progetti di analisi di dati di fisica delle particelle o di fisica medica (*)
(*) non disponibile per la versione da 6 CFU del corso
At the end of the course the student will have the following skills:
- Automate computing operations in data analysis
- Write python programs for scientific applications
- Develop software in collaborative environment
- Write programs exploiting parallel computing architectures
- Design neural networks for data analysis
- Develop neural networks for scientific computing
- Develop analysis projects in the context of particle physics or medical physics (*)
(*) not available in the 6 credits version of the course
Le capacita' saranno verificate richiedendo allo studente lo sviluppo di un progetto di software per analisi dati e/o l'analisi di un set di dati attraverso le tecniche apprese nel corso.
The skills will be verified requiring the students to develop a software project for data analysis and/or to perform the analysis of some specific datasets with the techinques learned
Il corso ha una parte interamente dedicata alle best practice nello sviluppo di codice specialmente in un'ottica di collaborazioni scientifiche. Il corso insegnera' come documentare e condividere gli strumenti di calcolo scientifico sviluppati.
The lectures include a part dedicated to best practice in code development with focus on scientific collaboration. A topic in the course is about documenting and sharing the scientific tools developed.
La verifica delle capacita' acquisite sara' fatta sia richiedendo l'utilizzo degli strumenti di collaborazione per la presentazione degli elaborati, sia verificando l'attenziene nella parte di documentazione dei progetti presentati.
Students will be required to collaborate in the development of some of the tools and the level of documentation in the presented project will be checked as an estimator of the collaborative attitude.
E' necessaria la conoscenza minima di funzionamento di un computer.
Sarebbe inoltre consigliabile possedere conoscenze, anche rudimentali, di programmazione in altri linguaggi (es. C)
Basic knowledge of computers.
Minimal knowledge of some programming language (e.g. C) would be an added benefit.
Il corso sara' composto da lezioni frontali teoriche e da lezioni frontali in cui si affronta un problema mostrando come esercizio lo sviluppo di un particolare algoritmo, la realizzazione di un programma o l'analisi di un set di dati con una particolare tecnica. Inoltre saranno fatte esercitazioni in cui gli studenti dovranno sviluppare sul proprio computer alcuni gli esercizi proposti.
Automazione delle operazioni (shell), Version control, introduzione al python, algoritmi e complessita, contenitori python, algoritmi standard, iteratori, funzioni lambda, classi e oggetti, overload, scipy/numpy e gestione array, matplotlib, tecniche classiche di ML, issue tracking e ambienti collaborativi, unit test, gestione delle memoria e profiling. Performance CPU/GPU, I/O verso varie periferiche e latenza, evoluzione dell'hardware per calcolo scientifico, programmazione su GPU, vettorizzazione, reti neurali, CNN, RNN, keras e tensorflow, metodi di training, autoencoders, GANs, GraphNetworks. Introduzione al C++, STL, C++11 and C++14, ROOT toolkit, PyROOT, Medical data processing and feature extraction, handling standard-format medical data (DICOM), data anonymization, visualization, Deriving features form images, Image segmentation,Data quality control pipelines, outlier removal, dimensionality reduction, Data analysis and classification, figures of merit, cross-validation, permutation test, Machine-learning and deep-learning tools for segmentation and classification (specific platforms for medical data),Data augmentation, transfer learning, retrieving localization information
Autotion of shell operations, Version control, introduction to python, algorithms and complexity, python containers, standard algorithms, iterators, lambda functions, classes and objects, overload, scipy/numpy and data array, matplotlib, classical ML, issue tracking and collaborative environments, unit test, memory handling and profiling. Performance CPU/GPU, I/O and latency, evolution of scientific computing hardware, GPU coding, vectorization, neural networks, CNN, RNN, keras and tensorflow, training methods, autoencoders, GANs, GraphNetworks. Introduction to C++, STL, C++11 and C++14, ROOT toolkit, PyROOT, Medical data processing and feature extraction, handling standard-format medical data (DICOM), data anonymization, visualization, Deriving features form images, Image segmentation,Data quality control pipelines, outlier removal, dimensionality reduction, Data analysis and classification, figures of merit, cross-validation, permutation test, Machine-learning and deep-learning tools for segmentation and classification (specific platforms for medical data),Data augmentation, transfer learning, retrieving localization information
https://www.deeplearningbook.org/
https://www.learncpp.com/cpp-tutorial/introduction-to-cplusplus/
The Hundred-Page Machine Learning Book, A.Burkov
Graph Representation Learning, William L. Hamilton
https://www.deeplearningbook.org/
https://www.learncpp.com/cpp-tutorial/introduction-to-cplusplus/
The Hundred-Page Machine Learning Book, A.Burkov
Graph Representation Learning, William L. Hamilton
Presentazione di un elaborato su un progetto concordato con i docenti ed esame orale di discussione dell'elaborato e verifica della conoscenza teorica degli strumenti utilizzati nel progetto, nonche' delle scelte operate nella realizzazione del progetto
Presentation of a written text on a project agreed upon with the teachers and oral examination discussing the project and verifying the theoretical knowledge of the tools used in the project, as well as the choices made in the implementation of the project