Il presente lavoro presenta "It-CMC", un tagset di parti del discorso (PoS) che punta a rappresentare un compromesso tra sostenibilità computazionale e precisione in termini di analisi linguistica. It-CMC nasce da un dataset di dati linguistici italiani provenienti dalla Comunicazione Mediata dal Computer (CMC) e le sezioni di questo lavoro portano avanti un paragone sistematico con l'attuale tagset del corpus "La Repubblica". In seguito a una prima fase di monitoraggio della performance d TreeTagger, il tagset è attualmente al centro di un flusso di lavoro che ha lo scopo di creare un file di parametri di RFTagger.

Towards It-CMC: A Fine-Grained POS Tagset for Italian Linguistic Analysis

RUSSO, CLAUDIO
2016-01-01

Abstract

Il presente lavoro presenta "It-CMC", un tagset di parti del discorso (PoS) che punta a rappresentare un compromesso tra sostenibilità computazionale e precisione in termini di analisi linguistica. It-CMC nasce da un dataset di dati linguistici italiani provenienti dalla Comunicazione Mediata dal Computer (CMC) e le sezioni di questo lavoro portano avanti un paragone sistematico con l'attuale tagset del corpus "La Repubblica". In seguito a una prima fase di monitoraggio della performance d TreeTagger, il tagset è attualmente al centro di un flusso di lavoro che ha lo scopo di creare un file di parametri di RFTagger.
2016
19th International Conference Text Speech and Dialogue 2016
Brno, Czech Rep.
12-16 September 2016
Text, Speech, and Dialogue
Springer International Publishing
9924
62
73
978-3-319-45509-9
978-3-319-45510-5
978-3-319-45509-9
978-3-319-45510-5
http://link.springer.com/chapter/10.1007%2F978-3-319-45510-5_8
PoS-tagging, Etichettatura Morfosintattica, Fine-grained PoS tagset, Corpora di Italiano, Corpus di Italiano, Analisi Linguistica
Russo, Claudio
File in questo prodotto:
File Dimensione Formato  
TSD_It-CMC.pdf

Accesso riservato

Tipo di file: PREPRINT (PRIMA BOZZA)
Dimensione 186.74 kB
Formato Adobe PDF
186.74 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/1620281
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 0
  • ???jsp.display-item.citation.isi??? 0
social impact