Academic year2023/24
PeriodSemester 2

Obiettivi di apprendimento
Learning outcomes

Lo studente acquisirà competenze in merito ai concetti di base dell’informatica, con particolare riferimento alle diverse tipologie di dati e agli strumenti e metodologie per il loro trattamento. Particolare attenzione verrà inoltre riservata al trattamento digitale dei documenti testuali, oggetto privilegiato degli studi umanistici. Verranno prese in questo contesto in considerazione le tematiche relative all’annotazione digitale dei testi e al loro utilizzo in contesti reali. 


The student will acquire skills in the basic concepts of computer science, with particular reference to the different types of data and the tools and methodologies for processing them. Particular attention will also be paid to the digital processing of textual documents, a privileged subject in humanistic studies. In this context, topics relating to the digital annotation of texts and their use in real contexts will be taken into consideration.

Modalità di verifica delle conoscenze

L’accertamento delle conoscenze verrà effettuato attraverso:

  • La realizzazione di un progetto, da concordare con il docente o scelto tra una serie di progetti proposti a lezione, attinente ai temi trattati durante le lezioni teoriche e pratiche
  • Prova orale, in cui verrà discusso il progetto realizzato e verificate le conoscenze del programma di esame
Assessment criteria of knowledge

The assessment of knowledge will be carried out through:

  • The realization of a project, to be agreed with the teacher or chosen from a series of projects proposed during lectures, relevant to the topics covered during the theoretical and practical lectures
  • Oral exam, in which the project will be discussed and knowledge of the examination program will be verified

Lo studente saprà riconoscere le diverse tipologie di dati digitali e applicare i corretti metodi di rappresentazione e analisi degli stessi. In particolar modo, saprà applicare le corrette metodologie e procedure di annotazione digitale dei testi tramite l’utilizzo di strumenti adeguati. Acquisirà inoltre competenze di base nel contesto dell’analisi computazionale dei testi.


The student will be able to recognise the different types of digital data and apply the correct methods of representing and analysing them. In particular, he/she will be able to apply the correct methods and procedures for the digital annotation of texts using appropriate tools. He/she will also acquire basic skills in the context of the computational analysis of texts.

Modalità di verifica delle capacità

Le capacità verranno valutate tramite la realizzazione di un progetto inerente le tematiche del corso. Una serie di possibili schemi di progetto in linea con le tematiche del corso verranno presentati durante le lezioni frontali. Gli studenti potranno scegliere uno tra gli schemi di progetto e concordare con il docente il suo adattamento in base agli interessi dello studente e rimanendo in linea con le tematiche del corso.

Assessment criteria of skills

Skills will be assessed through the realisation of a project relating to the course topics. A number of possible project schemes in line with the course topics will be presented during the lectures. Students will be able to choose one of the project schemes and agree with the lecturer on its adaptation according to the student's interests and in line with the course topics.


Lo studente potrà acquisire e sviluppare sensibilità alle problematiche legate ai contenuti, in particolar modo testuali, in formato digitale e alla loro analisi computazionale.


The student will be able to acquire and develop knowledge on issues related to content, especially text, in digital format and its computational analysis.

Modalità di verifica dei comportamenti

I comportamenti saranno valutati:

  • tramite lo svolgimento del progetto d’esame
  • durante le lezioni pratiche, in particolare riguardo all’accuratezza e precisione delle attività svolte
Assessment criteria of behaviors

Behaviors will be assessed: 

  • through the development of the exam project
  • during practical classes, particularly with regard to the accuracy and precision of the activities performed
Prerequisiti (conoscenze iniziali)

Nessun prerequisito specifico, ad eccezione di una minima familiarità con strumenti informatici.


No specific prerequisites except minimal familiarity with computer tools.

Indicazioni metodologiche

Lezioni frontali

Le lezioni frontali teoriche saranno intervallate con lezioni frontali pratiche. Durante le lezioni pratiche verrà mostrata l’applicazione pratica, tramite strumenti di libero accesso online, dei concetti teorici oggetto del corso.

Teaching methods

Lessons face-to-face

Theoretical lectures will be interspersed with practical face-to-face classes. During the practical lectures, the practical application, through free online access tools, of the theoretical concepts covered in the course will be shown.

Programma (contenuti dell'insegnamento)

Il corso ha lo scopo di presentare agli studenti una panoramica sugli strumenti digitali e sulla teoria e metodologie per il trattamento dell’informazione tramite sistemi informatici, con particolare riferimento ai dati testuali, partendo dai concetti base dell’informatica fino agli odierni sistemi di Intelligenza Artificiale.

Lezioni teoriche

  • Introduzione e concetti base dell’Informatica
    • Architettura e componenti del computer
    • Codifica dell’informazione
    • Network e multimedialità
  • Digitalizzazione dell’informazione e trattamento dei dati testuali
    • Introduzione alla codifica digitale dei testi
    • Linguaggi di markup
    • Linguaggio XML
    • Linguaggio JSON
    • Tipologie di annotazione del testo
    • Biblioteche digitali
  • Basi di dati
    • Introduzione ai database relazionali
    • Algebra relazionale e SQL
  • Fondamenti di analisi computazionale
    • Introduzione al trattamento automatico dei testi e del linguaggio
    • Panoramica dei compiti di analisi linguistica e loro scopo
    • Language Models e strumenti di annotazione/analisi automatica
  • Data Visualization
    • Introduzione e best practices
  • Concetti avanzati
    • Storia ed evoluzione del web
    • Cenni di Intelligenza Artificiale

Lezioni pratiche

  • Strumenti e toolkit per l’annotazione testuale
  • Strumenti e toolkit per l’analisi linguistica
  • Cenni pratici di strumenti AI-driven per il testo

The course aims to present students with an overview of digital tools and the theory and methodologies for processing information through computer systems, with particular reference to text data, starting from the basic concepts of computer science up to today's Artificial Intelligence systems.


Theoretical Lectures

  • Introduction and Computer Science basics
    • Computer architectures and compontents
    • Information encoding
    • Network and multimedia
  • Information digitalisation and processing of textual data
    • Introduction to digital encoding of texts
    • Markup Languages
    • The XML language
    • The JSON Language
    • Text annotation types
    • Digital libraries
  • Databases
    • Introduction to relational databases
    • Relational algebra and SQL
  • Fundamentals of computational analysis
    • Introduction to natural language and text processing
    • Overview of linguistic analysis tasks and their purpose
    • Language Models and automatic annotation tools
  • Data Visualization
    • Intoduction and best practices
  • Advanced concepts
    • History and evolution of the Internet
    • Hints at Artificial Intelligence

Practical lessons

  • Tools and toolkits for textual annotation
  • Tools and toolkits for linguistic analysis
  • Practical overview of AI-driven tools for text
Bibliografia e materiale didattico

Le slide delle lezioni ricoprono in larga parte i concetti richiesti. Verranno rese disponibili online dirante il corso.

In aggiunta alle slide, le letture obbligatorie sono le seguenti:

  • A. Lenci, S. Montemagni, V. Pirrelli, Testo e computer. Elementi di linguistica computazionale, Carocci, 2005. Capitoli II, VI, VIII

Lecture slides largely cover the required concepts. They will be made available online dirante the course.

In addition to the slides, the mandatory readings are as follows:

  • A. Lenci, S. Montemagni, V. Pirrelli, Text and computers. Elements of computational linguistics, Carocci, 2005. Chapters II, VI, VIII
Indicazioni per non frequentanti

Gli studenti non frequentanti non possono sviluppare il progetto. L’esame per gli studenti non frequentanti verterà su una prova orale in cui verranno verificate le conoscenze riguardanti 

  • il materiale didattico obbligatorio
  • Materiale aggiuntivo a scelta indicato sulla pagina del corso
Non-attending students info

Non-attending students cannot do the project. The examination for non-attending students will consist of an oral test in which will be assessed their knowledge regarding

  • mandatory readings
  • Additional material among a set of choices indicated on the course page
Modalità d'esame

L’esame consisterà in:

  • Sviluppo di un progetto scelto tra quelli proposti a lezione, attinente alle tematiche trattate durante le lezioni.
  • Prova orale in cui verrà discusso il progetto, ed eventualmente verificate le conoscenze di base riguardanti il programma d'esame
Assessment methods

The exam will consist of:

  • Development of a project chosen from those proposed in class, relevant to the topics covered during the lectures.
  • Oral examination in which the project will be discussed, and, if necessary, basic knowledge regarding the examination program will be checked
