Il contributo presenta sinteticamente gli esiti del pluriennale lavoro di ricerca presso l’Università di Torino per la creazione di corpora di lingua scritta liberamente interrogabili in rete, nati dal desiderio di analizzare l’italiano, e successivamente altre lingue, nella varietà dei testi – dall’italiano del Duecento alla lingua “digitata” dei gruppi di discussione online, dall’italiano accademico all’italiano di apprendenti non nativi, fino alla lingua che caratterizza l’universo del discorso legale in Italia – varietà di lingua che hanno imposto un significativo sforzo di riflessione (meta)linguistica e computazionale per la messa a punto e la standardizzazione di adeguate strategie di annotazione dei dati. Se ne forniscono qui i dati descrittivi principali, rimandando alla demo per alcune schermate e queries esemplificative.

Corpora.unito.it

Barbera Manuel
;
Elisa Corino
;
Marello Carla
;
Onesti Cristina
2022-01-01

Abstract

Il contributo presenta sinteticamente gli esiti del pluriennale lavoro di ricerca presso l’Università di Torino per la creazione di corpora di lingua scritta liberamente interrogabili in rete, nati dal desiderio di analizzare l’italiano, e successivamente altre lingue, nella varietà dei testi – dall’italiano del Duecento alla lingua “digitata” dei gruppi di discussione online, dall’italiano accademico all’italiano di apprendenti non nativi, fino alla lingua che caratterizza l’universo del discorso legale in Italia – varietà di lingua che hanno imposto un significativo sforzo di riflessione (meta)linguistica e computazionale per la messa a punto e la standardizzazione di adeguate strategie di annotazione dei dati. Se ne forniscono qui i dati descrittivi principali, rimandando alla demo per alcune schermate e queries esemplificative.
2022
Atti del LIV Congresso della Società di Linguistica Italiana (Università di Firenze, 8-10 settembre 2021)
Officina 21
1
8
978-88-97657-56-9
https://www.societadilinguisticaitaliana.net/pubblicazioni/atti-dei-congressi-sli/atti-del-liv-congresso-sli-online-2021/
Corpus linguistics, corpora, newsgroup, varietà di lingua, CQP, lingua scritta
Barbera Manuel, Elisa Corino, Marello Carla, Onesti Cristina
File in questo prodotto:
File Dimensione Formato  
013_BarberaEtAlii_Atti_LIV_Congresso_SLI.pdf

Accesso aperto

Tipo di file: PDF EDITORIALE
Dimensione 174.86 kB
Formato Adobe PDF
174.86 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/1888926
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact