Abstract

Paolo Monella, Forme del testo digitale

[English abstract] This article reflects on the modelization of texts of our cultural heritage in the current very early phase of Digital Philology by asking the question: what "form" are we forcing upon our texts? I explore three ways in which our textual models reflect our cultural and technological bias: first, the OHCO hierarchical model behind TEI XML; second, the sequential alphabetical model based on Western print, lying behind Unicode. A third aspect has been less explored in the scholarly discussion: citation protocols such as CITE/CTS are based on specific digital corpora. For example, the canonic corpora for classical Greek and Latin texts are TLG and PHI 5.3. Each of those corpora freezes author identification, authorship attribution, text boundaries, paragraph and line numbering in a specific canonic form. A dilemma arises: on the one side, interoperability requires that CTS URIs are based on a fixed textual canon, which hinders scholarly modifications of that canon; on the other side, the principles of philology suggest that URIs point to specific versions of texts, which in its turn cripples the interoperability potential of the protocol. [Italian abstract] L'articolo costituisce una riflessione sulla modellizzazione dei testi appartenenti alla nostra tradizione culturale in questa fase aurorale della Filologia Digitale e parte dalla domanda: che "forma" stiamo dando ai nostri testi? Vengono asplorati tre aspetti per cui i nostri modelli testuali riflettono i nostri presupposti culturali e tecnologici: in primo luogo, il modello gerarchico OHCO che sta alla base di TEI XML; in secondo luogo, il modello sequenziale alfabetico basato sulla stampa delle lingue occidentali, che sta alla base di Unicode. Un terzo aspetto, poi, è il meno esplorato nella ricerca: protocolli per la citazione testuale come CITE/CTS sono basati su corpora specifici. Per esempio, i corpora canonici per i testi greci e latini classici sono il TLG e il PHI 5.3. Ciascuno di questi corpora fissa in una forma canonica l'identificazione degli autori, l'attribuzione delle opere, la delimitazione dei testi, la numerazione di porzioni testuali come paragrafi e versi. Ne scaturisce un dilemma: da una parte, l'interoperabilità richiede che gli URI CTS siano basati su un canone testuale fisso, il che tende ad ostacolare le modifiche al canone da parte dei filologi; d'altra parte, i principi della filologia suggeriscono che gli URI puntino a versioni specifiche dei testi, il che però riduce il potenziale di interoperabilità del protocollo.

Paolo Monella Curriculum
DH bibliography
Paolo Monella home page