Il tema del contributo verte sulle possibilità di impiego nella glottodidattica del corpus parallelo It-Sr-NER sviluppato nel 2022 dall’infrastruttura europea CLARIN nel contesto del progetto “Bridging gaps”. Il suo valore risiede nell’annotazione per il Named Entity Recognition (NER), con particolare attenzione alla classe dei toponimi (inclusi i pluralia tantum) e dei nomi propri di persona. Il progetto è stato realizzato in collaborazione da un team di esperti provenienti dall’Università di Torino e dalla Società per le Risorse e le Tecnologie Linguistiche (JeRTeh) di Belgrado. Si tratta del primo corpus parallelo per questa combinazione linguistica, comprendente 10.000 frasi estrapolate dalle opere delle letterature serba e italiana, sia classiche che moderne. Le frasi sono state allineate per agevolare l’esplorazione dei dati e la traduzione delle singole parole nel contesto. L’importanza dei corpora paralleli nelle ricerche linguistiche è ormai nota (Doval e Sánchez, 2019), anche se si rileva una carenza di queste risorse per le lingue meno diffuse. Nel contributo verranno esposte le potenziali applicazioni glottodidattiche del corpus in questione nella didattica del serbo come lingua straniera: a livello iniziale, per l’apprendimento della ricca morfologia della lingua serba e, a livello intermedio e avanzato, per la ricerca dei lexical gaps, ossia delle parole che non hanno un traducente in una delle lingue esaminate. L’obiettivo è dimostrare che questa tipologia di corpora può costituire un’alternativa valida agli strumenti tradizionali e digitali di apprendimento, nonché un mezzo esclusivo per alcune tipologie di ricerca.
IT-SR-NER: IL CORPUS PARALLELO SERBO-ITALIANO PER L’APPRENDIMENTO DEL SERBO COME LINGUA STRANIERA
Olja Perisic;
2025-01-01
Abstract
Il tema del contributo verte sulle possibilità di impiego nella glottodidattica del corpus parallelo It-Sr-NER sviluppato nel 2022 dall’infrastruttura europea CLARIN nel contesto del progetto “Bridging gaps”. Il suo valore risiede nell’annotazione per il Named Entity Recognition (NER), con particolare attenzione alla classe dei toponimi (inclusi i pluralia tantum) e dei nomi propri di persona. Il progetto è stato realizzato in collaborazione da un team di esperti provenienti dall’Università di Torino e dalla Società per le Risorse e le Tecnologie Linguistiche (JeRTeh) di Belgrado. Si tratta del primo corpus parallelo per questa combinazione linguistica, comprendente 10.000 frasi estrapolate dalle opere delle letterature serba e italiana, sia classiche che moderne. Le frasi sono state allineate per agevolare l’esplorazione dei dati e la traduzione delle singole parole nel contesto. L’importanza dei corpora paralleli nelle ricerche linguistiche è ormai nota (Doval e Sánchez, 2019), anche se si rileva una carenza di queste risorse per le lingue meno diffuse. Nel contributo verranno esposte le potenziali applicazioni glottodidattiche del corpus in questione nella didattica del serbo come lingua straniera: a livello iniziale, per l’apprendimento della ricca morfologia della lingua serba e, a livello intermedio e avanzato, per la ricerca dei lexical gaps, ossia delle parole che non hanno un traducente in una delle lingue esaminate. L’obiettivo è dimostrare che questa tipologia di corpora può costituire un’alternativa valida agli strumenti tradizionali e digitali di apprendimento, nonché un mezzo esclusivo per alcune tipologie di ricerca.| File | Dimensione | Formato | |
|---|---|---|---|
|
Filolog_Perisic_2025.pdf
Accesso aperto
Tipo di file:
PDF EDITORIALE
Dimensione
924.38 kB
Formato
Adobe PDF
|
924.38 kB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.



