La consultazione di testi diplomatici costituisce uno strumento di lavoro insostituibile per gli storici e gli archivisti. La loro disponibilità online offre il massimo della flessibilità e della diffusione, permettendo allo studioso di accedere a questo materiale prezioso senza barriere spaziali o temporali: alcuni progetti, come The Electronic Sawyer (http://www.esawyer.org.uk/) e l’attività della École Nationale des Chartes (http://www.enc.sorbonne.fr), mostrano come sia possibile offrire testi di alta qualità scientifica sul web usando una codifica XML delle fonti. La loro creazione, tuttavia, richiede risorse non indifferenti: è possibile digitalizzare e mettere online questo materiale, per le proprie ricerche e per il beneficio della comunità accademica, in maniera (relativamente) semplice ed efficace? Inoltre una pubblicazione sul web è incompleta se non consente un’agevole consultazione e il data mining delle risorse offerte: come facilitare l’accesso e la ricerca all’interno dei testi? Questo intervento si propone di mostrare come, grazie all’uso di software open source, il singolo studioso o un piccolo team di ricercatori possa digitalizzare un corpus di documenti usando il formato TEI (http://www.tei-c.org/), pubblicarlo sul web e inserire nell’interfaccia un motore di ricerca come eXist (http://exist-db.org/) o XTF (http://xtf.cdlib.org/) per effettuare ricerche complesse.

Codifica, pubblicazione e interrogazione sul web di corpora diplomatici per mezzo di strumenti open source

ROSSELLI DEL TURCO, Roberto
2014-01-01

Abstract

La consultazione di testi diplomatici costituisce uno strumento di lavoro insostituibile per gli storici e gli archivisti. La loro disponibilità online offre il massimo della flessibilità e della diffusione, permettendo allo studioso di accedere a questo materiale prezioso senza barriere spaziali o temporali: alcuni progetti, come The Electronic Sawyer (http://www.esawyer.org.uk/) e l’attività della École Nationale des Chartes (http://www.enc.sorbonne.fr), mostrano come sia possibile offrire testi di alta qualità scientifica sul web usando una codifica XML delle fonti. La loro creazione, tuttavia, richiede risorse non indifferenti: è possibile digitalizzare e mettere online questo materiale, per le proprie ricerche e per il beneficio della comunità accademica, in maniera (relativamente) semplice ed efficace? Inoltre una pubblicazione sul web è incompleta se non consente un’agevole consultazione e il data mining delle risorse offerte: come facilitare l’accesso e la ricerca all’interno dei testi? Questo intervento si propone di mostrare come, grazie all’uso di software open source, il singolo studioso o un piccolo team di ricercatori possa digitalizzare un corpus di documenti usando il formato TEI (http://www.tei-c.org/), pubblicarlo sul web e inserire nell’interfaccia un motore di ricerca come eXist (http://exist-db.org/) o XTF (http://xtf.cdlib.org/) per effettuare ricerche complesse.
2014
Digital Diplomatics 2011. Tools for the Digital Diplomatist - An International Conference
Università degli Studi di Napoli Federico II – Sala del Palazzo degli Uffici, via Giulio Cesare Cortese 29, Napoli (IT)
29 settembre - 1 ottobre 2011
Beiheft 14
31
60
http://www.cei.lmu.de/digdipl11/
archivi; codifica di testi; XML; applicazioni XML; database XML
Francesca Capochiani; Chiara Leoni; Roberto Rosselli Del Turco
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/2318/147019
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact