Il presente lavoro presenta "It-CMC", un tagset di parti del discorso (PoS) che punta a rappresentare un compromesso tra sostenibilità computazionale e precisione in termini di analisi linguistica. It-CMC nasce da un dataset di dati linguistici italiani provenienti dalla Comunicazione Mediata dal Computer (CMC) e le sezioni di questo lavoro portano avanti un paragone sistematico con l'attuale tagset del corpus "La Repubblica". In seguito a una prima fase di monitoraggio della performance d TreeTagger, il tagset è attualmente al centro di un flusso di lavoro che ha lo scopo di creare un file di parametri di RFTagger.

Towards It-CMC: A Fine-Grained POS Tagset for Italian Linguistic Analysis

RUSSO, CLAUDIO
2016-01-01

Abstract

Il presente lavoro presenta "It-CMC", un tagset di parti del discorso (PoS) che punta a rappresentare un compromesso tra sostenibilità computazionale e precisione in termini di analisi linguistica. It-CMC nasce da un dataset di dati linguistici italiani provenienti dalla Comunicazione Mediata dal Computer (CMC) e le sezioni di questo lavoro portano avanti un paragone sistematico con l'attuale tagset del corpus "La Repubblica". In seguito a una prima fase di monitoraggio della performance d TreeTagger, il tagset è attualmente al centro di un flusso di lavoro che ha lo scopo di creare un file di parametri di RFTagger.
2016
Inglese
contributo
1 - Conferenza
19th International Conference Text Speech and Dialogue 2016
Brno, Czech Rep.
12-16 September 2016
Internazionale
Petr Sojka, Aleš Horák, Ivan Kopeček, Karel Pala
Text, Speech, and Dialogue
Comitato scientifico
Springer International Publishing
Heidelberg
GERMANIA
9924
62
73
12
978-3-319-45509-9
978-3-319-45510-5
978-3-319-45509-9
978-3-319-45510-5
http://link.springer.com/chapter/10.1007%2F978-3-319-45510-5_8
PoS-tagging, Etichettatura Morfosintattica, Fine-grained PoS tagset, Corpora di Italiano, Corpus di Italiano, Analisi Linguistica
no
2 – prodotto con deroga d’ufficio (SOLO se editore non consente/non ha risposto)
1
info:eu-repo/semantics/conferenceObject
04-CONTRIBUTO IN ATTI DI CONVEGNO::04A-Conference paper in volume
Russo, Claudio
273
reserved
File in questo prodotto:
File Dimensione Formato  
TSD_It-CMC.pdf

Accesso riservato

Tipo di file: PREPRINT (PRIMA BOZZA)
Dimensione 186.74 kB
Formato Adobe PDF
186.74 kB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/1620281
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 0
  • ???jsp.display-item.citation.isi??? 0
social impact