Il corso si propone di introdurre lo studente a settori chiave della Linguistica Computazionale caratterizzati da un forte impatto applicativo. In particolare, si articola attorno a due macro-temi: 1) metodi e strumenti di annotazione linguistica multi-livello del testo per l’estrazione di conoscenza linguistica da corpora testuali e 2) modelli di classificazione del testo basati su caratteristiche linguistiche esplicite e rappresentazioni distribuite delle parole. Entrambe le tematiche sono affrontate da una duplice prospettiva, teorica e applicativa.
Svolgimento a scelta tra due progetti; relazione scritta sui risultati del progetto scelto, da presentare in fase di iscrizione all'esame orale; esame orale in cui verranno discussi i risultati del progetto e verificata la conoscenza dei temi trattati durante il corso.
Al termine del corso lo studente saprà a) utilizzare in modo critico e consapevole strumenti di annotazione linguistica automatica e di estrazione di conoscenza linguistica, b) sviluppare modelli di classificazione automatica del testo, c) identificare le problematiche legate al trattamento di varietà non-standard della lingua e ipotizzare possibili soluzioni.
Nozioni di base di linguistica computazionale, di linguistica generale e di linguistica italiana. E' fortemente consigliato aver frequentato e sostenuto l'esame di Linguistica Computazionale I.
Durante il corso si alterneranno lezioni frontali, con l'ausilio di slides powerpoint che vengono messe a disposizione degli studenti, ed esercitazioni di laboratorio, sia individuali sia di gruppo (svolte con PC delle aule informatiche e/o PC personali), in cui gli studenti sono invitati a confrontarsi con l’applicazione di strumenti software di annotazione linguistica del testo e di estrazione di conoscenza disponibili come demo online, nonché con lo sviluppo di modelli di classificazione automatica del testo. Gli studenti saranno inoltre chiamati ad analizzare criticamente i risultati di annotazione e classificazione ottenuti in relazione a diverse varietà d’uso della lingua.
I contenuti del programma potranno subire variazioni e/o integrazioni, che verranno comunicate durante la prima lezione del corso.
I contenuti del corso sono suddivisi in due macro-temi, per ciascuno dei quali segue una lista dei principali argomenti trattati:
L'elenco dei testi d'esame è disponibile alla pagina Moodle del corso. Gli studenti non frequentanti sono pregati di contattare i docenti per concordare il programma d'esame.
Dato il carattere estremamente applicativo del corso, la frequenza è fortemente richiesta. Qualora lo studente fosse impossibilitato a frequentare, si prega di contattare i docenti per concordare il programma d'esame.
Le modalità d'esame verranno comunicate durante la prima lezione del corso.