View syllabus
TEXT ANALYTICS
ANDREA ESULI
Academic year2020/21
CourseDATA SCIENCE AND BUSINESS INFORMATICS
Code635AA
Credits6
PeriodSemester 1
LanguageEnglish

ModulesAreaTypeHoursTeacher(s)
TEXT ANALYTICSINF/01LEZIONI48
ANDREA ESULI unimap
Obiettivi di apprendimento
Learning outcomes
Conoscenze

Apprendimento di tecniche, algoritmi e modelli fondamentali utilizzati nell'elaborazione del linguaggio naturale. Comprensione delle architetture delle tipiche applicazioni di analisi del testo e delle librerie per la loro realizzazione. Competenza nella progettazione, implementazione e valutazione di applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.

Knowledge

Learning fundamental techniques, algorithms and models used in natural language processing. Understanding of the architectures of typical text analytics applications and of libraries for building them. Expertise in design, implementation and evaluation of applications that exploit analysis, interpretation and transformation of texts.

Modalità di verifica delle conoscenze

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Assessment criteria of knowledge

Students will apply the concepts and methods presented during the course in the development of a project.

Capacità

Capacità di progettare, implementare e valutare applicazioni che sfruttano l'analisi, l'interpretazione e la trasformazione dei testi.

Skills

Ability to design, implement and evaluate applications that exploit analysis, interpretation and transformation of texts.

Modalità di verifica delle capacità

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Assessment criteria of skills

Students will apply the concepts and methods presented during the course in the development of a project.

Comportamenti

Gli studenti saranno in grado di analizzare un problema di elaborazione del testo, selezionare i metodi corretti per risolverlo e implementare una soluzione funzionante.

Behaviors

Students will be able to analyze a text processing problem, select the correct methods to solve it, and implement a working solution.

Modalità di verifica dei comportamenti

Gli studenti applicheranno i concetti e i metodi presentati durante il corso nello sviluppo di un progetto.

Assessment criteria of behaviors

Students will apply the concepts and methods presented during the course in the development of a project.

Prerequisiti (conoscenze iniziali)

Prerequisiti utili:

  • Coding (python)
  • Teoria della probabilità
  • Teoria dell'informazione
Prerequisites

Useful prerequisites:

  • Coding (python)
  • Probability theory
  • Information theory
Programma (contenuti dell'insegnamento)
  1. Disciplinary background: Natural Language Processing, Information Retrieval and Machine Learning
  2. Mathematical background: Probability, Statistics and Algebra
  3. Linguistic essentials: words, lemmas, morphology, PoS, syntax
  4. Basic text processing: regular expression, tokenisation
  5. Data collection: twitter API, scraping
  6. Basic modelling: collocations, language models
  7. Introduction to Machine Learning: theory and practical tips
  8. Libraries and tools: NLTK, Spacy, Keras, pytorch
  9. Classification/Clustering
  10. Sentiment Analysis/Opinion Mining
  11. Information Extraction/Relation Extraction/Entity Linking
  12. Transfer learning
  13. Quantification
Syllabus
  1. Disciplinary background: Natural Language Processing, Information Retrieval and Machine Learning
  2. Mathematical background: Probability, Statistics and Algebra
  3. Linguistic essentials: words, lemmas, morphology, PoS, syntax
  4. Basic text processing: regular expression, tokenisation
  5. Data collection: twitter API, scraping
  6. Basic modelling: collocations, language models
  7. Introduction to Machine Learning: theory and practical tips
  8. Libraries and tools: NLTK, Spacy, Keras, pytorch
  9. Classification/Clustering
  10. Sentiment Analysis/Opinion Mining
  11. Information Extraction/Relation Extraction/Entity Linking
  12. Transfer learning
  13. Quantification
Bibliografia e materiale didattico
  1. C. Manning, H. Schutze. Foundations of Statistical Natural Language Processing. MIT Press, 2000.
  2. D. Jurafsky, J.H. Martin, Speech and Language Processing. 2nd edition, Prentice-Hall, 2008.
  3. S. Bird, E. Klein, E. Loper. Natural Language Processing with Python.
Bibliography
  1. C. Manning, H. Schutze. Foundations of Statistical Natural Language Processing. MIT Press, 2000.
  2. D. Jurafsky, J.H. Martin, Speech and Language Processing. 2nd edition, Prentice-Hall, 2008.
  3. S. Bird, E. Klein, E. Loper. Natural Language Processing with Python.
Indicazioni per non frequentanti

Gli studenti non frequentanti devono contattare il docente per concordare il progetto d'esame.

Non-attending students info

Non-attending students must contact the teacher in order to agree on the project.

Modalità d'esame

L'esame consisterà in un progetto da concordare con l'insegnante e una prova orale. Il risultato del progetto sarà del codice e una relazione sull'attività (4-10 pagine è l'intervallo di lunghezza tipico).
L'esame orale consisterà nella presentazione e discussione del progetto.

Assessment methods

Exam will consist in a project to be agreed with the teacher and an oral exam.
The outcome of the project will be some code and a report of the activity (4-10 pages is the typical length range).
Oral exam will consist in the presentation and discussion of the project.

Updated: 05/08/2020 17:50