CdSDATA SCIENCE AND BUSINESS INFORMATICS
Codice635AA
CFU6
PeriodoPrimo semestre
LinguaInglese
Moduli | Settore/i | Tipo | Ore | Docente/i | |
TEXT ANALYTICS | INF/01 | LEZIONI | 48 |
|
Apprendimento di tecniche, algoritmi e modelli fondamentali utilizzati nell'elaborazione del linguaggio naturale. Comprensione delle architetture delle tipiche applicazioni di analisi del testo e delle librerie per la loro realizzazione. Competenza nella progettazione, implementazione e valutazione di applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.
Learning fundamental techniques, algorithms and models used in natural language processing. Understanding of the architectures of typical text analytics applications and of libraries for building them. Expertise in design, implementation and evaluation of applications that exploit analysis, interpretation and transformation of texts.
Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.
Students will apply the concepts and methods presented during the course in the development of a project.
Capacità di progettare, implementare e valutare applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.
Ability to design, implement and evaluate applications that exploit analysis, interpretation and transformation of texts.
Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.
Students will apply the concepts and methods presented during the course in the development of a project.
Gli studenti saranno in grado di analizzare un problema di elaborazione del testo, selezionare i metodi corretti per risolverlo e implementare una soluzione funzionante.
Students will be able to analyze a text processing problem, select the correct methods to solve it, and implement a working solution.
Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.
Students will apply the concepts and methods presented during the course in the development of a project.
Prerequisiti utili:
- Coding (python)
- Teoria della probabilità
- Teoria dell'informazione
Useful prerequisites:
- Coding (python)
- Probability theory
- Information theory
- Disciplinary background: Natural Language Processing, Information Retrieval and Machine Learning
- Mathematical background: Probability, Statistics and Algebra
- Linguistic essentials: words, lemmas, morphology, PoS, syntax
- Basic text processing: regular expression, tokenisation
- Data collection: twitter API, scraping
- Basic modelling: collocations, language models
- Introduction to Machine Learning: theory and practical tips
- Libraries and tools: NLTK, Spacy, Keras, pytorch
- Classification/Clustering
- Sentiment Analysis/Opinion Mining
- Information Extraction/Relation Extraction/Entity Linking
- Transfer learning
- Quantification
- Disciplinary background: Natural Language Processing, Information Retrieval and Machine Learning
- Mathematical background: Probability, Statistics and Algebra
- Linguistic essentials: words, lemmas, morphology, PoS, syntax
- Basic text processing: regular expression, tokenisation
- Data collection: twitter API, scraping
- Basic modelling: collocations, language models
- Introduction to Machine Learning: theory and practical tips
- Libraries and tools: NLTK, Spacy, Keras, pytorch
- Classification/Clustering
- Sentiment Analysis/Opinion Mining
- Information Extraction/Relation Extraction/Entity Linking
- Transfer learning
- Quantification
- C. Manning, H. Schutze. Foundations of Statistical Natural Language Processing. MIT Press, 2000.
- D. Jurafsky, J.H. Martin, Speech and Language Processing. 2nd edition, Prentice-Hall, 2008.
- S. Bird, E. Klein, E. Loper. Natural Language Processing with Python.
- C. Manning, H. Schutze. Foundations of Statistical Natural Language Processing. MIT Press, 2000.
- D. Jurafsky, J.H. Martin, Speech and Language Processing. 2nd edition, Prentice-Hall, 2008.
- S. Bird, E. Klein, E. Loper. Natural Language Processing with Python.
Gli studenti non frequentanti devono contattare il docente per concordare il progetto d'esame.
Non-attending students must contact the teacher in order to agree on the project.
L'esame consisterà in un progetto da concordare con l'insegnante e una prova orale. Il risultato del progetto sarà del codice e una relazione sull'attività (4-10 pagine è l'intervallo di lunghezza tipico).
L'esame orale consisterà nella presentazione e discussione del progetto.
Exam will consist in a project to be agreed with the teacher and an oral exam.
The outcome of the project will be some code and a report of the activity (4-10 pages is the typical length range).
Oral exam will consist in the presentation and discussion of the project.