Modules | Area | Type | Hours | Teacher(s) | |
INTRODUCTION TO MACHINE LEARNING IN GEOPHYSICS | GEO/11 | LEZIONI | 24 |
|
Un gran numero di applicazioni che solo pochi anni fa sarebbero state considerate impossibili da eseguire senza alcun tipo di interazione umana sono ora eseguite in modo autonomo da macchine sempre più potenti e da algoritmi sofisticati. Alimentati da un'enorme quantità di dati, gli algoritmi di Machine Learning possono imparare, senza essere esplicitamente programmati, a risolvere compiti complessi come il riconoscimento vocale, facciale e di oggetti o a giocare e persino sconfiggere i migliori giocatori di Go.
La conoscenza delle tecniche di Machine Learning sta diventando essenziale in tutti i campi scientifici dove vengono raccolti grandi quantità di dati, inclusa la geofisica.
I dataset geofisici stanno infatti crescendo in dimensioni e varietà a un ritmo eccezionalmente veloce, questo trend mette in evidenza la necessità di nuove tecniche di elaborazione e assimilazione dei dati in grado di sfruttare le informazioni derivanti da queste grandi quantità di dati disponibili. In questo contesto, le tecniche di Machine Learning hanno il potenziale di portare al prossimo livello lo stato dell'arte delle tecniche di elaborazione dei dati geofisici.
Questo è un corso introduttivo di Machine Learning. Lo scopo di questo corso è fornire una panoramica generale sui principali metodi di Machine Learning per l'elaborazione dei dati geofisici, geologici e ambientali.
A large number of applications that only a few years ago would have been considered impossible to be performed without any sort of human interaction are now autonomously executed by increasingly more powerful machines and sophisticated algorithms. Fed by an enormous quantity of available data, machine learning algorithms can learn, without being explicitly programmed, to solve complex tasks such as speech, face, and object recognition or to play and even defeat the best human players at the ancient game of Go.
Machine-learning is becoming an essential skill in many data-intensive scientific fields, including Geophysics.
Geophysical datasets are growing in size and variety at an exceptionally fast rate, highlighting the need for new data processing and assimilation techniques that are able to exploit the information deriving from this data explosion. In this framework, Machine-learning techniques have the potential to push forward the state of the art of geophysical data processing techniques.
This is an introductory-level course of Machine Learning. The aim of this course is to provide an overview of the main machine learning methods and their application to geophysical, geological and environmental data.
Al termine di ogni argomento principale del corso è prevista una sessione di live coding su uno specifico problema geofisico. La sessione di coding viene svolta dal docente con l'interazione aperta degli studenti frequentanti. Questo permette di monitorare il progresso complessivo dell'apprendimento di ogni studente.
At the end of the each main topic of the course it is expected to perform a live coding session on a specific geophysical problem. The coding session is performed by the lecturer with the open interaction of the students attending the course, allowing to monitor the overall learning progress of each student.
Al termine del corso lo studente sarà in grado di utilizzare le tecniche di base di Machine Learning e di applicarle a dataset strutturati. Lo studente imparerà ad identificare la metododologia più adatto per l'analisi di un particolare dataset e a valutare le prestazioni dei modelli utilizzati. Al termine del corso lo studente avrà anche ricevuto una panoramica generale sulle principali librerie di Machine Learning (SciKit-Learn, Tensorflow e Keras)
After the course the student will be able to use basic machine learning techniques and appy them to structured datasets. The student will learn to identify which ML method is more suitable than others for the analysis of a particular datasets and to evaluate the performance of the used models. After the course the student will also have an overview of the main Machine Learning libraries (SciKit-Learn, Tensorflow and Keras)
Verranno svolte lezioni di live coding finalizzate all'analisi dei dati mediante tecniche di Machine Learning utilizzando codici scritti in Python
Live coding lessons aimed at analyzing data using Machine Learning techniques will be carried out using codes written in Python
Gli studenti saranno consapevoli dei vantaggi e degli svantaggi derivanti dell'utilizzo di tecniche di Machine Learning per estrarre informazioni da grandi set di dati geofisici.
The students will be aware of the pros and cons of using machine learning and artificial intelligence techniques to extract information from massive geophysical datasets.
Durante le esercitazioni, incentrate sulla soluzione di specifici problemi geofisici, verrà valutata la capacità degli studenti di identificare i pro e i contro di un particolare approccio.
During practical sessions, focused on the solution of specific geophysical problems, the ability of the students to identify the pros and cons of a particular approach will be evaluated.
Si consiglia di avere conoscenze di base di calcolo differenziale, algebra lineare e statistica. La conoscenza di un linguaggio di programmazione ad alto livello (Matlab o Python), sebbene non richiesta per la comprensione degli argomenti trattati all'interno di questo corso, è suggerita per le esercitazioni e per seguire al meglio le sessioni di live coding.
Basic knowledge of calculus, linear algebra and statistics (suggested).
Knowledge of Python, although not required for the comprehension of the topics covered within this course, is suggested for the practicals and to better follow the live coding sessions.
Introduzione
Introzione al corso e concetti base di Machine Learning
Metodi di ottimizzazione
Concetti base sull'ottimizzazione
Metodi globali e locali
Supervised Learning
Regression (Linear and Non-linear regression).
Classification (Logistic Regression, K-NearestNeighbors and Support Vector Machines).
Unsupervised Learning
Clustering (k-means, Hierarchical Clustering, DB-Scan).
Data Reduction (Linear Autoencoder e PCA)
Introduzione al Deep Learning
Neural Networks (Basics, Activation function, Back-propagation, Training and Optimization).
Introduzione alle Convolutional Neural Networks
Esempi di applicazione in ambito geofisico
Introduction
Overview of the course and general machine learning concepts
Optimization
Basic concepts on optimization
Global and local methods
Supervised Learning
Regression (Linear and Non-linear regression).
Classification (Logistic Regression, K-NearestNeighbors and Support Vector Machines).
Unsupervised Learning
Clustering (k-means, Hierarchical Clustering, DB-Scan).
Data Reduction (Linear Autoencoder and PCA)
Introduction to Deep Learning
Neural Networks (Basics, Activation function, Back-propagation, Training and Optimization).
Introduction to Convolutional Neural Networks
Examples for different geophysical applications
Watt, Borhani and Katsaggelos; Machine Learning Refined; Cambridge University Press
James, Witten, Hastie and Tibshirani; Introduction to Statistical Learning; Springer
Watt, Borhani and Katsaggelos; Machine Learning Refined; Cambridge University Press
James, Witten, Hastie and Tibshirani; Introduction to Statistical Learning; Springer
Una prova scritta con domande che coprono aspetti sia pratici che teorici sul ML seguita da un esame orale. La prova orale consiste in un colloquio tra il candidato e il docente e si focalizzerà sui risultati della prova scritta.
A written test with questions covering both practical and theoretical aspects of ML followed by an oral exam. The oral test consists of an interview between the candidate and the lecturer and it will be focused on the results of the written test.