Il contributo segnala come utile risorsa linguistica i post dei gruppi di discussione del protocollo Usenet. In seguito all'analisi della struttura dei dati e dei metadati inerenti le varie gerarchie, si argomenta la rilevanza della presenza di testo citato (utile a ricostruire gli scambi dialogici fra gli utenti) e gli ostacoli da superare per un'agevole estrazione dei dati linguistici.

Extracting linguistic data from Usenet Newsgroups: troubles and challenges

RUSSO, CLAUDIO
2014-01-01

Abstract

Il contributo segnala come utile risorsa linguistica i post dei gruppi di discussione del protocollo Usenet. In seguito all'analisi della struttura dei dati e dei metadati inerenti le varie gerarchie, si argomenta la rilevanza della presenza di testo citato (utile a ricostruire gli scambi dialogici fra gli utenti) e gli ostacoli da superare per un'agevole estrazione dei dati linguistici.
2014
Kontrastivnye issledovanija i prikladnaja lingvistika
Minsk
29-30 ottobre 2014
Kontrastivnye issledovanija i prikladnaja lingvistika - Materialy Meždunarodnoj naučnoj konferencii
Minskij Gosudarstvennij Lingvističeskij Universitet
2
39
42
978-985-460-669-9
978-985-460-658-3
Linguistica Contrastiva, Linguistica dei Corpora, Usenet Newsgroup, corpus, corpora, risorsa, linguistica, Comunicazione Mediata dalla Rete, Comunicazione Mediata dal Computer, Italiano, Linguistica Computazionale
Claudio Russo
File in questo prodotto:
File Dimensione Formato  
Claudio_Russo_Extracting_data_NUNC.pdf

Accesso aperto

Tipo di file: POSTPRINT (VERSIONE FINALE DELL’AUTORE)
Dimensione 98 kB
Formato Adobe PDF
98 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/1557909
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact