SOMMARIO. 0. Premessa. 1. Lo specifico formato elettronico richiesto. 1.1 La natura “ibrida” del corpus. 1.2 I corpora preistorici. 1.3 La tokenizzazione: token e type. 1.4 Il markup. 1.5 I corpora futuribili: Web as a corpus? 2. Gli elementi delle definizioni tradizionali. 2.1 Natura linguistica. 2.2 Autenticità. 2.3 Rappresentatività. 2.4 Finitezza. 2.5 Ordinatezza finalizzata. 2.6 Standard. 2.7 Grandi dimensioni. 2.8 Formato elettronico. 2.9 Metadata ed annotazioni. 3. Rassegna di definizioni rappresentative. 3.1 Le definizioni dei linguisti. 3.2 Le definizioni dei dizionari. 4 Conclusioni e definizione.

Cosa è un corpus? Per una definizione più rigorosa di corpus, token, markup

BARBERA, Emanuele Ferdinando;CORINO, Elisa;ONESTI, Cristina
2007-01-01

Abstract

SOMMARIO. 0. Premessa. 1. Lo specifico formato elettronico richiesto. 1.1 La natura “ibrida” del corpus. 1.2 I corpora preistorici. 1.3 La tokenizzazione: token e type. 1.4 Il markup. 1.5 I corpora futuribili: Web as a corpus? 2. Gli elementi delle definizioni tradizionali. 2.1 Natura linguistica. 2.2 Autenticità. 2.3 Rappresentatività. 2.4 Finitezza. 2.5 Ordinatezza finalizzata. 2.6 Standard. 2.7 Grandi dimensioni. 2.8 Formato elettronico. 2.9 Metadata ed annotazioni. 3. Rassegna di definizioni rappresentative. 3.1 Le definizioni dei linguisti. 3.2 Le definizioni dei dizionari. 4 Conclusioni e definizione.
2007
Corpora e linguistica in rete
GUERRA
5
88
9788855700412
E. BARBERA; E. CORINO; C. ONESTI
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/104048
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact