Bibliografia essenziale del corso, che potrà subire variazioni e/o integrazioni sulla base del progetto che verrà definito per l’esame finale
Annotazione linguistica del testo: letture generali
- Nivre, J. (2005) Two Notions of Parsing. In Arppe, A., Carlson, L., Lindén, K., Piitulainen, J., Suominen, M., Vainio, M., Westerlund, H. and Yli-Jyrä, A. (eds.) Inquiries into Words, Constraints and Contexts. Festschrift in the Honour of Kimmo Koskenniemi on his 60th Birthday. CSLI Publications, 106-115.
- Nivre, J. (2006) Two Strategies for Text Parsing. In Suominen, M., Arppe, A., Airola, A., Heinämäki, O., Miestamo, M., Määttä, U., Niemi, J., Pitkänen, K. K. and Sinnemäki, K. (eds.) A Man of Measure: Festschrift in Honour of Fred Karlsson on his 60th Birthday. Turku: The Linguistic Association of Finland.
- Marie-Catherine de Marneffe and Christopher Potts, 2017, Developing Linguistic Theories Using Annotated Corpora, in Nancy Ide and James Pustejovsky (eds.) Handbook of Linguistic Annotation, Springer, pp. 411-438.
- Alessandro Lenci, Simonetta Montemagni, Vito Pirrelli 2005, Testo e computer, Carocci, Roma – Capitolo 8 Annotazione linguistica del testo
Lettura opzionale sull'inter-annotator agreement
- Artstein, R. (2017). Inter-annotator Agreement. In: Ide, N. & Pustejovsky, J. (eds.), Handbook of Linguistic Annotation. Springer, Dordrecht, pp. 297–314
Annotazione morfosintattica
- Venturi G. (2009). Rassegna comparativa degli schemi di annotazione morfosintattica per la lingua italiana, Technical report TRIPLE - RTT/1, February 2009.
- Slav Petrov, Dipanjan Das, and Ryan McDonald. 2012. A universal part-of-speech tagset. In Proceedings of LREC 2012.
- Kevin Gimpel, Nathan Schneider, Brendan O'Connor, Dipanjan Das, Daniel Mills, Jacob Eisenstein, Michael Heilman, Dani Yogatama, Jeffrey Flanigan, and Noah A. Smith. 2011. Part-of-Speech Tagging for Twitter: Annotation, Features, and Experiments. In Proceedings of ACL 2011. Markus Dickinson and Marwa Ragheb (2009). Dependency Annotation for Learner Corpora. Proceedings of the Eighth Workshop on Treebanks and Linguistic Theories (TLT-8). Milan, Italy.
- Christopher D. Manning. 2011. Part-of-Speech Tagging from 97% to 100%: Is It Time for Some Linguistics? In Alexander Gelbukh (ed.), Computational Linguistics and Intelligent Text Processing, 12th International Conference, CICLing 2011, Proceedings, Part I. Lecture Notes in Computer Science 6608, pp. 171--189. Springer.
Annotazione sintattica
- Joakim Nivre. 2015. Towards a Universal Grammar for Natural Language Processing. In A. Gelbukh (Ed.), Proceedings of CICLing 2015, Part I, LNCS 9041, pp. 3–16, Springer International Publishing Switzerland.
- Marie-Catherine de Marneffe and Joakim Nivre. 2019. Dependency Grammar. In Annual review of linguistics, 5:197, pp. 197-218.
- Sito Universal Dependencies (UD) project
- Bosco C., Montemagni S., Simi M. (2013). Converting Italian Treebanks: Towards an Italian Stanford Dependency Treebank. In Proceedings of the 7th Linguistic Annotation Workshop & Interoperability with Discourse (LAW VII & ID at ACL-2013), Sofia, Bulgaria, August 8-9, pp. 61-69.
- Dell’Orletta F., Venturi G. (2016) “ULISSE: una strategia di adattamento al dominio per l’annotazione sintattica automatica“. In E. M. Ponti e M. Baudassi (a cura di) “Computer parler soigner: tra linguistica e intelligenza artificiale”, Atti del convegno 15-17 dicembre 2014, Pavia University Press, pp. 55-79.
- Enhanced dependencies in UD v2
- Sebastian Schuster and Christopher D. Manning (2016) "Enhanced English Universal Dependencies: An Improved Representation for Natural Language Understanding Tasks". In Proceedings of LREC 2016
Monitoraggio linguistico e sue applicazioni
- Montemagni S. (2013) “Tecnologie linguistico-computazionali e monitoraggio della lingua italiana“. In Studi Italiani di Linguistica Teorica e Applicata (SILTA) Anno XLII, Numero 1, pp. 145-172,
Due articoli a scelta tra i seguenti:
- Dell’Orletta F., Montemagni S., Venturi G. (2013), “Linguistic Profiling of Texts Across Textual Genre and Readability Level. An Exploratory Study on Italian Fictional Prose“. In Proceedings of the Recent Advances in Natural Language Processing Conference (RANLP-2013), 7-11 September, Hissar, Bulgaria, pp. 189-197
- Dell’Orletta F., Montemagni S. e Venturi G. (2016) “Esplorazioni computazionali nello spazio dell’interlingua: verso una nuova metodologia di indagine“. In R. Bombi e V. Orioles (a cura di), Atti del XLVIII Congresso Internazionale di Studi della Società di Linguistica Italiana (SLI 2014), 25-27 settembre Udine.
- Barbagli A., Lucisano P., Dell’Orletta F., Montemagni S., Venturi G. (2015) “Il ruolo delle tecnologie del linguaggio nel monitoraggio dell’evoluzione delle abilità di scrittura: primi risultati“. In Italian Journal of Computational Linguistics (IJCoL), vol. 1, n. 1, pp. 99-117.
- "Computational Assessment of Text Readability: A Survey of Current and Future Research", Kevyn Collins-Thompson, Recent Advances in Automatic Readability Assessment and Text Simplification. Special issue of the International Journal of Applied Linguistics, 2014, 165:2, John Benjamins Publishing Company
Letture integrative per studenti non frequentanti
- Capitoli scelti da Nancy Ide and James Pustejovsky (eds.) Handbook of Linguistic Annotation, Springer.