Scheda programma d'esame
INTRODUCTION TO MACHINE LEARNING IN GEOPHYSICS
FRANCESCO GRIGOLI
Anno accademico2022/23
CdSGEOFISICA DI ESPLORAZIONE E APPLICATA
Codice1074I
CFU3
PeriodoPrimo semestre
LinguaInglese

ModuliSettore/iTipoOreDocente/i
INTRODUCTION TO MACHINE LEARNING IN GEOPHYSICSING-INF/05LEZIONI24
FRANCESCO GRIGOLI unimap
Obiettivi di apprendimento
Learning outcomes
Conoscenze

Un gran numero di applicazioni che solo pochi anni fa sarebbero state considerate impossibili da eseguire senza alcun tipo di interazione umana sono ora eseguite in modo autonomo da macchine sempre più potenti e da algoritmi sofisticati. Alimentati da un'enorme quantità di dati, gli algoritmi di Machine Learning possono imparare, senza essere esplicitamente programmati, a risolvere compiti complessi come il riconoscimento vocale, facciale e di oggetti o a giocare e persino sconfiggere i migliori giocatori di Go.

La conoscenza delle tecniche di Machine Learning sta diventando essenziale in tutti i campi scientifici dove vengono raccolti grandi quantità di dati, inclusa la geofisica.

I dataset geofisici stanno infatti crescendo in dimensioni e varietà a un ritmo eccezionalmente veloce, questo trend mette in evidenza la necessità di nuove tecniche di elaborazione e assimilazione dei dati in grado di sfruttare le informazioni derivanti da queste grandi quantità di dati disponibili. In questo contesto, le tecniche di Machine Learning hanno il potenziale di portare al prossimo livello lo stato dell'arte delle tecniche di elaborazione dei dati geofisici.

Questo è un corso introduttivo di Machine Learning. Lo scopo di questo corso è fornire una panoramica generale sui principali metodi di Machine Learning per l'elaborazione dei dati geofisici, geologici e ambientali.

Knowledge

A large number of applications that only a few years ago would have been considered impossible to be performed without any sort of human interaction are now autonomously executed by increasingly more powerful machines and sophisticated algorithms. Fed by an enormous quantity of available data, machine learning algorithms can learn, without being explicitly programmed, to solve complex tasks such as speech, face, and object recognition or to play and even defeat the best human players at the ancient game of Go.

Machine-learning is becoming an essential skill in many data-intensive scientific fields, including Geophysics.

Geophysical datasets are growing in size and variety at an exceptionally fast rate, highlighting the need for new data processing and assimilation techniques that are able to exploit the information deriving from this data explosion. In this framework, Machine-learning techniques have the potential to push forward the state of the art of geophysical data processing techniques.

This is an introductory-level course of Machine Learning. The aim of this course is to provide an overview of the main machine learning methods and their application to geophysical, geological and environmental data.

Modalità di verifica delle conoscenze

Al termine di ogni argomento principale del corso è prevista una sessione di live coding su uno specifico problema geofisico. La sessione di coding viene svolta dal docente con l'interazione aperta degli studenti frequentanti. Questo permette di monitorare il progresso complessivo dell'apprendimento di ogni studente.

Assessment criteria of knowledge

At the end of the each main topic of the course it is expected to perform a live coding session on a specific geophysical problem. The coding session is performed by the lecturer with the open interaction of the students attending the course, allowing to monitor the overall learning progress of each student.

Capacità

Al termine del corso lo studente sarà in grado di utilizzare le tecniche di base di Machine Learning e di applicarle a dataset strutturati. Lo studente imparerà ad identificare la metododologia più adatto per l'analisi di un particolare dataset e a valutare le prestazioni dei modelli utilizzati. Al termine del corso lo studente avrà anche ricevuto una panoramica generale sulle principali librerie di Machine Learning (SciKit-Learn, Tensorflow e Keras)

Skills

After the course the student will be able to use basic machine learning techniques and appy them to structured datasets. The student will learn to identify which ML method is more suitable than others for the analysis of a particular datasets and to evaluate the performance of the used models. After the course the student will also have an overview of the main Machine Learning libraries (SciKit-Learn, Tensorflow and Keras)

Modalità di verifica delle capacità

Verranno svolte lezioni di live coding finalizzate all'analisi dei dati mediante tecniche di Machine Learning utilizzando codici scritti in Python

Assessment criteria of skills

Live coding lessons aimed at analyzing data using Machine Learning techniques will be carried out using codes written in Python

Comportamenti

Gli studenti saranno consapevoli dei vantaggi e degli svantaggi derivanti dell'utilizzo di tecniche di Machine Learning per estrarre informazioni da grandi set di dati geofisici.

Behaviors

The students will be aware of the pros and cons of using machine learning and artificial intelligence techniques to extract information from massive geophysical datasets.

Modalità di verifica dei comportamenti

Durante le esercitazioni, incentrate sulla soluzione di specifici problemi geofisici, verrà valutata la capacità degli studenti di identificare i pro e i contro di un particolare approccio.

Assessment criteria of behaviors

During practical sessions, focused on the solution of specific geophysical problems, the ability of the students to identify the pros and cons of a particular approach will be evaluated. 

Prerequisiti (conoscenze iniziali)

Si consiglia di avere conoscenze di base di calcolo differenziale, algebra lineare e statistica. La conoscenza di un linguaggio di programmazione ad alto livello (Matlab o Python), sebbene non richiesta per la comprensione degli argomenti trattati all'interno di questo corso, è suggerita per le esercitazioni e per seguire al meglio le sessioni di live coding.  

Prerequisites

Basic knowledge of calculus, linear algebra and statistics (suggested).

Knowledge of Python, although not required for the comprehension of the topics covered within this course, is suggested for the practicals and to better follow the live coding sessions.

Programma (contenuti dell'insegnamento)

Introduzione

Introzione al corso e concetti base di Machine Learning 

 

Metodi di ottimizzazione

Concetti base sull'ottimizzazione

Metodi globali e locali

 

Supervised Learning

Regression (Linear and Non-linear regression).

Classification (Logistic Regression, K-NearestNeighbors and Support Vector Machines).

 

Unsupervised Learning

Clustering (k-means, Hierarchical Clustering, DB-Scan).

Data Reduction (Linear Autoencoder e PCA)

 

Introduzione al Deep Learning

Neural Networks (Basics, Activation function, Back-propagation, Training and Optimization).

Introduzione alle Convolutional Neural Networks

 

Esempi di applicazione in ambito geofisico

Syllabus

Introduction

Overview of the course and general machine learning concepts

 

Optimization

Basic concepts on optimization

Global and local methods

 

Supervised Learning

Regression (Linear and Non-linear regression).

Classification (Logistic Regression, K-NearestNeighbors and Support Vector Machines).

 

Unsupervised Learning

Clustering (k-means, Hierarchical Clustering, DB-Scan).

Data Reduction (Linear Autoencoder and PCA) 

 

Introduction to Deep Learning

Neural Networks (Basics, Activation function, Back-propagation, Training and Optimization).

Introduction to Convolutional Neural Networks

 

Examples for different geophysical applications

Bibliografia e materiale didattico

Watt, Borhani and Katsaggelos; Machine Learning Refined; Cambridge University Press

James, Witten, Hastie and Tibshirani; Introduction to Statistical Learning; Springer

Bibliography

Watt, Borhani and Katsaggelos; Machine Learning Refined; Cambridge University Press

James, Witten, Hastie and Tibshirani; Introduction to Statistical Learning; Springer

Modalità d'esame

Una prova scritta con domande che coprono aspetti sia pratici che teorici sul ML seguita da un esame orale. La prova orale consiste in un colloquio tra il candidato e il docente e si focalizzerà sui risultati della prova scritta.

Assessment methods

A written test with questions covering both practical and theoretical aspects of ML followed by an oral exam. The oral test consists of an interview between the candidate and the lecturer and it will be focused on the results of the written test.

Ultimo aggiornamento 07/08/2022 23:17