SOMMARIO. 0. Premessa. 1. Lo specifico formato elettronico richiesto. 1.1 La natura “ibrida” del corpus. 1.2 I corpora preistorici. 1.3 La tokenizzazione: token e type. 1.4 Il markup. 1.5 I corpora futuribili: Web as a corpus? 2. Gli elementi delle definizioni tradizionali. 2.1 Natura linguistica. 2.2 Autenticità. 2.3 Rappresentatività. 2.4 Finitezza. 2.5 Ordinatezza finalizzata. 2.6 Standard. 2.7 Grandi dimensioni. 2.8 Formato elettronico. 2.9 Metadata ed annotazioni. 3. Rassegna di definizioni rappresentative. 3.1 Le definizioni dei linguisti. 3.2 Le definizioni dei dizionari. 4 Conclusioni e definizione.
Cosa è un corpus? Per una definizione più rigorosa di corpus, token, markup
BARBERA, Emanuele Ferdinando;CORINO, Elisa;ONESTI, Cristina
2007-01-01
Abstract
SOMMARIO. 0. Premessa. 1. Lo specifico formato elettronico richiesto. 1.1 La natura “ibrida” del corpus. 1.2 I corpora preistorici. 1.3 La tokenizzazione: token e type. 1.4 Il markup. 1.5 I corpora futuribili: Web as a corpus? 2. Gli elementi delle definizioni tradizionali. 2.1 Natura linguistica. 2.2 Autenticità. 2.3 Rappresentatività. 2.4 Finitezza. 2.5 Ordinatezza finalizzata. 2.6 Standard. 2.7 Grandi dimensioni. 2.8 Formato elettronico. 2.9 Metadata ed annotazioni. 3. Rassegna di definizioni rappresentative. 3.1 Le definizioni dei linguisti. 3.2 Le definizioni dei dizionari. 4 Conclusioni e definizione.File in questo prodotto:
Non ci sono file associati a questo prodotto.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.