Editar el Siglo de Oro
en la era digital
Procesamiento del lenguaje natural y fijación del texto.
S A-T
E F
()
Editar el Siglo de Oro
en la era digital
Studia Aurea Monográfica
9
Studia Aurea Monográfica, coeditada
por la Universitat Autònoma de Barcelona
y la Universitat de Girona,
es una colección auspiciada por
Studia Aurea. Revista de Literatura Española y
Teoría Literaria del Renacimiento y Siglo de Oro
Studia Aurea se fundó, en 2007,
con el propósito de ofrecer un instrumento
de intercambio científico y de colaboración
a los investigadores, y de propiciar
una aproximación supradisciplinar
a los estudios literarios.
Desde 2010, Studia Aurea Monografica,
dirigida por Eugenia Fosalba y María José Vega,
publica volúmenes dedicados a analizar,
desde diversas perspectivas críticas,
los temas y problemas capitales
de la investigación más reciente
sobre las letras altomodernas.
Editar el Siglo de Oro
en la era digital
Susanna Allés-Torrent
Eugenia Fosalba
(eds)
Este volumen se publica con la ayuda
del Proyecto de Investigación
Garcilaso en Italia, estancia en Nápoles (2016-2019),
con referencia FFI2015-65093-P del Ministerio
de Economía, Industria y Competitividad.
Comité científico
Sònia Boadas
(Universitat Autònoma de Barcelona)
Claudia Corfiati
(Università degli Studi di Bari)
Rodney Lokaj
(Università Kore di Enna)
María Morrás
(Universitat Pompeu Fabra)
ISBN (pdf ) 978-84-128138-3-8
Índice
Prefacio, Eugenia Fosalba .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .
9
Introducción, Susanna Allés-Torrent .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. ..
11
Anna Bognolo & Stefano Bazzaco
Editar libros de caballerías en la era digital: la Biblioteca Digital
del Proyecto Mambrino . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .
19
Jesús Tronch Pérez
Editar en TEI teatro clásico español e inglés en los proyectos
ARTELOPE y EMOTHE .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .
49
Ramón Valdés Gázquez
Por la dignidad del texto. El teatro del Siglo de Oro y de Lope de Vega
en la red. Principios ecdóticos y de Humanidades Digitales . .. .. .. .. .. .
71
Mercedes Blanco y Aude Plagnard
Editar una obra y los testimonios de su recepción. El caso de Góngora . .
109
Eugenia Fosalba y Susanna Allés-Torrent
La edición crítica digital de la obra poética de Garcilaso de la Vega .. .
143
Helena Bermúdez Sabel, Clara Isabel Martínez Cantón
y Pablo Ruiz Fabo
Procesamiento del lenguaje natural y fijación del texto. Experiencias
en torno a la constitución de un corpus diacrónico de sonetos .. .. .. .. .. .
161
Borja Navarro Colorado
Edición digital enriquecida: un modelo de anotación multinivel
para poesía del Siglo de Oro . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .
175
Editar el Siglo de Oro en la era digital
Prefacio
Creo que es de justicia reconocer aquí el enorme esfuerzo que Susanna AllésTorrent ha vertido en el proyecto Pronapoli, desde la tarde afortunada en que
nos reunimos en un elegante bar de copas de Enrique Granados, y encaramadas en nuestros respectivos taburetes, apoyó sobre la mesa su libreta de papel
reciclado y con un bolígrafo de tinta azul turquesa empezó a poner orden en
mis tan entusiastas como deshilvanadas ideas. Muy buenas cabezas han contribuido a lo que hoy es el proyecto Pronapoli pero puedo asegurar que solo aquel
día nuestra plataforma digital, que hoy obtiene un impacto arrollador en las
redes, empezó a tomar verdadera forma. Lo mismo está sucediendo con Soledad amena, la edición crítica y digital que estamos llevando a cabo ahora, en la
que Susanna Allés-Torrent está de nuevo plenamente implicada: no nos faltaban ideas sobre cómo convertir una erudita edición digital en una herramienta
de lectura que acercara con un solo clic la obra de Garcilaso a todos los hogares
del mundo, perfectamente integrada en el contexto cosmopolita del que surgió, pero valía la pena compartir nuestras dudas con otros grandes profesionales de las Humanidades Digitales del resto de Europa, para resolverlas de la
mejor manera posible y dejar testimonio en estas páginas del interesantísimo
debate que surgió, a propósito de estas inquietudes, un soleado día de junio de
2023, en el Aula Francesc Eiximenis de la Universitat de Girona.
Eugenia Fosalba
Barcelona, 31 de enero de 2024
Editar el Siglo de Oro en la era digital
Introducción
Susanna Allés-Torrent
La dimensión digital que hace años tomó tierra en el campo de las Humanidades ha ido transformando todas las disciplinas científicas. Esta transformación se
ha percibido de manera dispar, para algunos demasiado lentamente —si se piensa en esos primeros programas de concordancias de décadas atrás—, para otros
demasiado de repente sin entender todavía las implicaciones intelectuales de la
labor digital. La filología y los estudios literarios han sido, desde los años cuarenta del siglo pasado, disciplinas pioneras en la adopción digital, especialmente
desde el punto de vista de las herramientas, los métodos y la práctica, así como
la reflexión y su teorización han llegado posteriormente. En el caso de los estudios medievales y del Siglo de Oro peninsulares, hace ya más de dos décadas que
vienen surgiendo de manera exponencial proyectos digitales que, si bien nacieron en su momento de necesidades reales y urgentes para llevar a cabo nuevas
investigaciones (piénsese en las muchas bases de datos sobre fuentes primarias),
han empezado paulatinamente a concebir su metodología científica y sus resultados a partir de lo que las Humanidades Digitales aportan. En el caso de la
crítica textual, y más generalmente de la edición de textos, piedra de toque en
los estudios hispánicos peninsulares, la transformación digital está todavía en
curso. De hecho, pocos casos son tan paradigmáticos como el de la crítica textual, metodología científica para el establecimiento de textos fiables, que debe
ahora adaptarse o, quizás mejor dicho, reinventarse a partir de unos principios
que habían sido claramente establecidos para su práctica analógica (con escuelas
diferentes y manuales canónicos) hacia una práctica digital. Así, en los últimos
años, no solo ha habido contribuciones muy significativas sobre edición digital,
sino que han ido surgiendo proyectos editoriales que han aceptado el reto de
producir nuevos objetos científicos, una nueva manera de concebir y presentar
el texto, que se aleja del texto impreso, el modelo que hemos consumido durante seis siglos. De la misma manera que la imprenta supuso una revolución en
múltiples niveles (producción, distribución, lectura, acceso, etc.), ahora, cuando
hablamos de edición filológica digital (o edición académica digital, siguiendo la
traducción inglesa), nos adentramos en realidad en tierra de nadie, como decía
Editar el Siglo de Oro en la era digital
12
Susanna Allés-Torrent
Plutarco, a propósito de la descripción de las geografías desconocidas, “lo de
más allá, dunas áridas y plagadas de fieras”.
Este interés por la transformación en la edición de los textos del Siglo de
Oro es el que ha guiado la publicación de un nuevo volumen que pudiera convertirse en una pieza más para el engranaje teórico sobre crítica textual y prácticas digitales. Por ello, parecía oportuno ofrecer un escenario en el que se pudieran discutir temas relevantes: los modelos de representación de datos
procedentes del análisis filológico y de la compleja fenomenología que conllevan
las fuentes primarias con las que trabajamos y su conversión a un formato digital; el modelado de datos y el uso de ciertas metodologías en la codificación
textual con ciertos estándares como XML-TEI, o los modelos de presentación
de datos y los retos en el diseño de las interfaces. Convenía asimismo abrir la
discusión sobre el potencial de los datos textuales codificados para su procesamiento digital y la obtención de visualizaciones, o la adopción de técnicas de
lenguaje de procesamiento natural. Incluso, nos interesaba profundizar en cuestiones como los flujos de trabajo editorial, las plataformas de edición, las infraestructuras adoptadas, o los retos de colaboración, la preparación técnica del equipo, la falta de financiación y las consiguientes estrategias adoptadas. Todos estos
temas, deseábamos que fueran acompañados de las experiencias reales en diferentes proyectos sobre textos del Siglo de Oro.
Presentamos en este monográfico un conjunto de siete contribuciones que
representan una aportación tanto desde el punto de vista de la edición y los estudios del Siglo de Oro como el de las metodologías digitales aplicadas a los textos
de dicha época. Más concretamente, podemos establecer tres grupos de experiencias similares, aunque los temas se entrecruzan y solapan irremediablemente. Por
un lado, las bibliotecas digitales; por el otro, las ediciones de autor concebidas con
toda su extensión de archivo digital, y, en fin, técnicas de procesamiento y anotación textual encaminadas al establecimiento y fijación del texto literario.
Así pues, todas las contribuciones giran en torno a materias dispares como
los libros de caballerías, el soneto siglodorista, la obra y recepción de Góngora,
las comedias Lope de Vega o la obra poética de Garcilaso de la Vega. Debemos
señalar que las contribuciones no se centran únicamente en el proyecto en curso,
sino que pretenden ser una aportación científica al campo de la crítica textual y
a las tecnologías del texto, en general, desde el punto de vista digital y en el
marco de las Humanidades Digitales. Todas ellas van más allá de la mera descripción de los proyectos en los que se alberga su investigación. Cada uno de los
autores se ha esforzado por ofrecer una contextualización general en el seno de
las Humanidades Digitales, en términos de práctica y teoría, y aspiran a su aportación en tanto que los métodos de trabajo sean extensibles a otras experiencias.
En el caso de las bibliotecas digitales, Anna Bognolo (Università di Verona)
y Stefano Bazzaco (Università di Verona) presentan los contenidos y objetivos
del Proyecto Mambrino, así como los desafíos encontrados para la creación de la
Biblioteca Digital de ediciones digitales. Desde hace ya algunos años, ambos
Editar el Siglo de Oro en la era digital
13
Introducción
autores, juntamente con un amplio equipo, investigan los derroteros por los
cuales los libros de caballería, siguiendo la senda del Amadís de Gaula, viajaron
desde España y se recibieron en Italia a lo largo de los siglos xvi y xvii. Un fenómeno que no solo incluye traducciones e impresos de textos españoles en las
prensas italianas, sino también obras de nueva factura y continuaciones de originales. Esta serie de textos, que hasta la fecha ha recibido poca atención y no ha
sido editada, ha empezado a poblar la Biblioteca digital del Proyecto Mambrino.
En cuanto al tipo de edición, se adopta como premisa la fidelidad al ejemplar
más completo y correcto de cada edición príncipe (descartan, por tanto, el establecimiento de un texto crítico con variantes procedentes de la tradición textual). Proponen, así, un modelo editorial que se encaja en su ya creada plataforma concebida como un archivo digital que contiene variedad de recursos (una
base de datos dedicada a un censo de obras, otras destinadas a personajes, lugares
y motivos caballerescos). Las ediciones propuestas presentan un diseño tripartito: la reproducción digital de la edición príncipe, el texto editado y presentado
de una manera clara y diáfana, y un tercer apartado con los resúmenes de los
diferentes capítulos concebidos como apoyo a la lectura. En estos últimos, aparecen los enlaces a los diferentes personajes y lugares que, a su vez, constituyen
índices de la obra. La infraestructura web utilizada ha sido TEI Publisher, una de
las plataformas de codificación y publicación más utilizadas en los últimos años.
En la base de su presentación web se halla un trabajo minucioso de codificación
en XML-TEI que es la que ha permitido establecer las diferentes secciones y
cuestiones de identificación semántica apenas mencionadas. El capítulo, además, aporta discusiones relevantes sobre algunos de los retos de codificación
textual para los textos de esta época. También es interesante subrayar que, para
el proceso editorial, el equipo ha adoptado métodos de transcripción automatizada, concretamente a través de la plataforma Transkribus, con resultados satisfactorios. Así también, entre sus retos a corto plazo aparecen cuestiones centrales
en torno a la interoperabilidad entre repositorios institucionales y de consulta
para que las ediciones puedan ser recogidas por los catálogos de las bibliotecas
(como el protocolo de distribución OAI-PMH), así como sobre la identificación de los recursos digitales (necesidad de la asignación de ISBN y DOIs).
A continuación, Jesús Tronch Pérez (Universitat de València) pone el énfasis en la idea de los textos como datos, su tratamiento electrónico y codificación
en XML-TEI a partir del trabajo realizado en el marco de los proyectos de la
Biblioteca Digital de ARTELOPE, que difunde las comedias de Lope de Vega
(un total por ahora de 334 títulos), y EMOTHE, que ofrece ediciones modernizadas de obras teatrales europeas (italianas, francesas, españolas, portuguesas e
inglesas) compuestas entre 1500 y 1700. Tronch estructura su trabajo a partir de
la metodología de la crítica textual digital: captura (de dónde proceden y cómo se
han transformado digitalmente los textos), estructuración según las guías directrices de la TEI y, en fin, su publicación en línea. Todo ello sin olvidar, a modo
de espina dorsal, el flujo de trabajo compartido con otros colaboradores y que en
Editar el Siglo de Oro en la era digital
14
Susanna Allés-Torrent
ciertos aspectos ha debido adaptarse a los programas adoptados en los albores del
proyecto (por ejemplo, el uso de FileMaker). Para llevar a cabo el marcado de los
textos, como decimos, tanto ARTELOPE como EMOTHE han utilizado el
lenguaje XML siguiendo las directrices de la TEI. En su contribución, se ejemplifica una casuística heterogénea procedente de textos dramáticos y se proponen
soluciones de codificación para, por ejemplo, recuperar con fines estadísticos
antropónimos, topónimos, referencias mitológicas, oficios, citas literarias, latinismos, elementos escenográficos, vestuario, entre muchos otros. Otro de los
aspectos que Tronch trae a colación es el papel del editor digital y la terminología
utilizada para referirse a esta nueva figura. Tras barajar diferentes términos a
partir del inglés (encoder, digital editor, encoding architect, etc.), repropone el
término “editor” pues, aunque su labor sea diferente a la del que establece propiamente el texto crítico, este continúa teniendo un componente intelectual crítico, lejos de acciones mecánicas, que le obligan a hacer juicios interpretativos y
tomar decisiones editoriales, sin el cual no le habría sido posible la “codificación
crítica” del texto. A este propósito, y más allá de las detecciones de posibles errores en el texto fijado, son especialmente esclarecedores algunos ejemplos de codificación que ponen en evidencia su dimensión hermenéutica, como por ejemplo
la labor interpretativa del editor digital a la hora de explicitar y marcar la identificación de los personajes o las didascalías, una tarea que el ordenador no detectaría de forma autónoma. En definitiva, Tronch pone sobre la mesa no solo el
papel de esta nueva figura editorial y académica, sino que ahonda en una cuestión crucial en el nuevo debate sobre la epistemología de la crítica textual digital.
Una discusión cuyas ramificaciones, en el fondo, tocan de cerca el papel del humanista digital, el crédito y la evaluación científica de la labor digital.
Por su lado, la contribución de Ramón Valdés (Universitat Autònoma de
Barcelona) representa un balance crítico, desde una perspectiva diacrónica, sobre la cantidad y la calidad de los textos del teatro del Siglo de Oro en la red. En
el centro de su reflexión se encuentra la idea de la “dignidad del texto” que
surge de la constatación de la existencia de textos en línea establecidos sin rigor
crítico que generan y perpetúan una tradición textual deficiente, utilizada después por los mismos investigadores en sus estudios. Ciertamente, Valdés reconoce la utilidad de la existencia de estos textos en abierto y, para el caso de Lope,
aplaude iniciativas como las de ARTELOPE, pues es solo la cantidad la que
permite adoptar técnicas digitales para estudios como los de estilística o atribución de autoría, por poner un ejemplo. Pero aún así, insiste, con mucha razón,
en el imperativo de producir y publicar textos en digital con el mismo rigor filológico que la misma crítica textual ha establecido desde hace décadas en su
formato analógico. Desde el equipo de PROLOPE, reconocen que quizás el
caso de Lope de Vega sea uno de los más dramáticos. A lo largo de dos décadas,
PROLOPE ha ya publicado unas doscientas cincuenta ediciones críticas en papel (en Milenio y Gredos), y, si bien adoptaron el reto de ponerlas en línea y en
abierto hace algunos años, cuestiones de tiempo, economía y la complejidad de
Editar el Siglo de Oro en la era digital
15
Introducción
transformar las copias digitalizadas en texto electrónico han impedido hacerlo
posible con la rapidez o agilidad deseadas. Además, ya sean las digitalizaciones o
incluso los archivos nativamente digitales, la densa formalización de la distribución de la página de estas ediciones dificulta su trasvase digital. Piénsese en toda
la información allí contenida: prólogo, estudio, anotación, aparato crítico y variantes lingüísticas, notas onomásticas, listas de erratas, índices, etc. Transformar estas ediciones críticas en ediciones críticas digitales es tarea hartamente
ambiciosa por una infinidad de motivos. Aún así, este es el objetivo de la Biblioteca digital PROLOPE, que contempla publicar en abierto el corpus completo
de las ediciones críticas de las comedias con cada una de sus secciones. De momento, la Biblioteca se lanzará con tres títulos: El bautismo del Príncipe de Marruecos, Servir a señor discreto y Los ramilletes de Madrid. Como Valdés explica,
esta tarea resulta altamente laboriosa y, por ello, y como estrategia (quizás) rápida y efectiva, el equipo se halla en vías de exploración ante la posibilidad de crear
un repositorio de los textos críticos de Lope en un formato de texto plano, para
al menos ofrecer una alternativa y remediar el uso de los textos en línea deficientes y no fiables. Este capítulo constituye una aportación altamente erudita, informativa y crítica al terreno de la edición digital, que toma en consideración un
amplio abanico de ejemplos y deja los cimientos para la creación de ediciones
digitales críticas según los métodos fijados por la crítica textual.
Un segundo grupo de contribuciones centran su atención en la edición
crítica de o en torno a un único autor. Mercedes Blanco (Sorbonne Université)
y Aude Plagnard (Université Paul-Valéry) reflexionan sobre su experiencia en el
proyecto ∏ólemos, cuyo principal objetivo es la edición y el estudio de la obra
completa de Luis de Góngora, así como de los documentos relativos a su recepción a lo largo de los siglos xvi y xvii. Entre los textos, incluyen comentarios
sobre su obra, escritos a favor o en contra, o debates en torno a su obra, lo que
se conoce en definitiva como la “polémica gongorina”. Su edición, colectiva,
filológica y digital, disponible ya en línea, da lugar a una serie de reflexiones
sobre la naturaleza de la edición filológica digital que nace justamente de su experiencia “empírica”, así como del rigor y sistematicidad de su metodología.
Blanco y Plagnard trazan elocuentemente la línea que divide el paradigma tipográfico del paradigma digital y las diferentes razones que conducen a seguir uno
u otro. Entre estas razones, se arguye la dimensión y diversidad de materiales del
corpus a editar, cuestiones económicas, el carácter colaborativo, pero sobre todo
la “entidad plural” del texto, que permite ofrecer más de una versión del mismo,
e incluir paratextos de cualquier naturaleza, históricos o fruto de la crítica contemporánea, relacionados con la obra en un único sitio. Destaca este capítulo
por su honestidad y claridad al evidenciar las dificultades de toda edición colaborativa y ofrecer las estrategias adoptadas para superarlas: la necesaria formalización de las diferentes secciones para crear un corpus homogéneo (por ejemplo,
adopción por parte de todos los colaboradores del mismo patrón para la introducción) o el establecimiento de unos criterios ecdóticos. Explican también el
Editar el Siglo de Oro en la era digital
16
Susanna Allés-Torrent
modelo de datos que contempla diferentes tipos de anotación: notas pertenecientes al mismo autor, notas de edición crítica que ofrecen un aparato positivo
de variantes o señalan alguna variante relevante, y notas explicativas del editor.
Altamente relevantes son las descripciones ofrecidas sobre los límites de la conversión de sus archivos originales en Word hacia el formato TEI, así como las
consideraciones sobre las dificultades y los retos puestos por la codificación en
XML-TEI. En fin, este capítulo ofrece un ejemplo elocuente sobre el potencial
de reutilización de los datos textuales codificados para otras salidas, como por
ejemplo las visualizaciones de las relaciones en la interlocución en una comedia
entre dos o más personajes, o la intertextualidad en la polémica gongorina.
Eugenia Fosalba (Universitat de Girona) y Susanna Allés-Torrent (University of Miami) ofrecen una panorámica general del proyecto Pronapoli, concebido para el estudio de la estancia italiana de Garcilaso de la Vega que este
poeta llevó a cabo de forma discontinua entre los años 1529 y 1536. La metodología que emplea Pronapoli en su inmersión total en el contexto italiano (histórico, cultural, literario) ha llevado a la creación de una plataforma digital donde se atomizan las distintas facetas de ese entorno inexcusable en las pesquisas de
sus investigadores: una galería de autores relacionados con Garcilaso y su estancia en Nápoles, un geolocalizador de las academias que dan buena cuenta del
ambiente intelectual del momento, además de una biblioteca digital con transcripciones y digitalizaciones de manuscritos poco conocidos y accesibles, así
como bibliografías primarias y secundarias. La culminación de esta inmersión
total, en una extensión de la plataforma que ha adquirido el título de Soledad
amena, es la edición crítica y digital de las obras de corte horaciano, y a continuación, de la edición de la obra completa del gran poeta, que aparece inmersa
en estas mismas coordenadas contextuales, gracias a un diseño integrador. Se
espera que cuando la edición digital de las obras realizadas en el proyecto anterior se abra al público en general, el impacto de Pronapoli crecerá exponencialmente. En la actualidad, no existe una edición, ya sea impresa o digital, que
cubra las cinco odas latinas. Tampoco hay una edición crítica de estas odas, y la
que se ofrece, de acceso abierto, tiene la virtud de ser la más ampliamente anotada. Permite varios tipos de lectura: una más rápida, simplemente para leer el
texto sin obstáculos (con meras notas explicativas), y otra más erudita, con excursos más extensos o comentarios sobre el aparato crítico, dirigida al lector
académico, ya sea erudito o estudiante. El capítulo dedicado a este proyecto
editorial insiste en la razón de una edición de estas características, y en la necesidad de crear un modelo de representación de datos que dé buena cuenta de la
fuente primaria y del tipo de elementos que de esta se desprenden. Así también,
reflexiona sobre el proceso editorial que se despliega en tres fases principales: el
de la transcripción y establecimiento del texto, la codificación y la visualización
o presentación.
Un último grupo con dos aportaciones, interesantísimas por sus puntos de
conexión y divergencias, se centra en la creación de corpus y el uso de técnicas
Editar el Siglo de Oro en la era digital
17
Introducción
de procesamiento de lenguaje natural para su anotación. Por un lado, Helena
Bermúdez Sabel (JinnTec), Clara Martínez Cantón (UNED) y Pablo Ruiz Fabo
(Université de Strasbourg) ofrecen las directrices esenciales que han llevado a la
creación de DISCO (Diachronic Spanish Sonnet Corpus), un corpus que al momento contiene 4.530 sonetos escritos en español pertenecientes a diferentes
regiones y épocas. El subcorpus para textos del Siglo de Oro se compone de 477
poetas y 1.088 sonetos. El corpus está anotado a partir de técnicas de procesamiento del lenguaje natural (PLN) y contiene informaciones métricas tales
como el número de sílabas por verso, la acentuación, la rima y la existencia o no
de encabalgamiento. Uno de los aspectos sumamente interesantes de esta contribución es la constatación de que los resultados de una anotación automática
pueden detectar problemas de transmisión textual. Su experiencia demuestra,
así, cómo la anotación automática basada en técnicas de PLN pueden ser integradas en los flujos de trabajo para múltiples fines, pero sobre todo, y en el caso de
este monográfico, para el establecimiento, el análisis y la fijación del texto. Al
detectarse errores textuales mediante técnicas automatizadas, los editores pueden
centrar sus esfuerzos en la revisión manual de aquellos pasajes más problemáticos o que induzcan a un error (por ejemplo, la detección de un verso no rimado,
error en el número de versos o sílabas, etc.). Además, esta contribución ofrece
una iluminadora descripción del flujo de trabajo, su metodología y la lógica
detrás del establecimiento de los criterios para la edición y la limpieza de los
textos que otorgan coherencia al corpus.
Por otro lado, Borja Navarro Colorado (Universidad de Alicante), partiendo
de su experiencia con el Corpus de Sonetos del Siglo de Oro desarrollado en el proyecto ADSO (Análisis Distante del soneto castellano del Siglo de Oro), propone el
concepto de “edición digital enriquecida”, basada en un sistema de anotación
multinivel de un corpus literario. El objetivo de este tipo de anotación es el de
fijar un análisis a través de la integración de informaciones a diferentes niveles
de descripción lingüística y literaria (como por ejemplo, métrica, sintáctica, semántica, temática, etc.). Además, Navarro propone una serie de requisitos inherentes
a toda edición digital enriquecida: interoperabilidad (uso de estándares como
XML-TEI y compatibilidad con otros corpus), perspectivismo (relación entre los
diferentes niveles de análisis para mantener la unidad textual), unidad del corpus
(consistencia), sencillez y claridad (posibilidad de edición manual del código). Al
valorar estos requisitos, Navarro analiza también ventajas y desventajas, y evalúa
el uso de herramientas y lenguajes de marcado. Algunos casos discutidos corresponden a la anotación de la información sintáctica o a la sobreposición de informaciones, donde el lenguaje XML-TEI pone problemas de verbosidad, en el
primero, y de anidación en el segundo. En el caso del Corpus de Sonetos del Siglo
de Oro hasta el momento el análisis se ha centrado en la detección del hipérbaton
como rasgo estilístico. Para ello los textos se han marcado a tres niveles diferentes:
métrico, léxico y sintáctico. Para los dos primeros tipos de anotación se ha utilizado XML-TEI, mientras que para la representación de la información sintáctica
Editar el Siglo de Oro en la era digital
18
Susanna Allés-Torrent
se ha usado el formato CONLL. Esta contribución da buena cuenta de la complejidad de la anotación de un corpus a niveles diferentes con informaciones de
naturaleza heterogénea y de los retos informáticos a tener en cuenta.
Como indican Sabel, Martínez y Ruiz, ambos corpus coinciden e incluyen
algunos de los mismos textos (concretamente, 17 autores y 333 sonetos en común), la mayoría de los cuales han sido recabados de la Biblioteca Virtual Miguel de Cervantes. Ambas aportaciones son altamente iluminadoras para entender el procesamiento del lenguaje natural y qué aplicaciones prácticas tienen
estas en los estudios literarios y para la crítica textual. Mientras que Sabel, Martínez y Ruiz ejemplifican lo que las técnicas automáticas de procesamiento de
texto pueden aportar a la tradición textual y al establecimiento de un texto,
Navarro añade complejidad a la anotación lingüística y semántica que puede
conllevar una edición digital.
Como no podía ser de otra manera, en este monográfico, muchos proyectos
relevantísimos relacionados con los textos del Siglo de Oro han quedado fuera,
pero huelga decir que no ha sido nuestra intención ofrecer con exhaustividad la
variada casuística de lo que se está llevando a cabo. El objetivo ha sido ofrecer
una serie de contribuciones que dialogaran entre ellas, ya fuera de manera implícita o explícita, y que dieran buena cuenta de lo que constituye hoy en día la
edición filológica de textos del Siglo de Oro.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital:
la Biblioteca Digital del Proyecto Mambrino
Anna Bognolo
Università di Verona
ORCID: 0000-0002-1194-4520
[email protected]
Stefano Bazzaco
Università di Verona
ORCID: 0000-0002-3496-3687
[email protected]
Resumen
El presente trabajo trata la creación y publicación de la Biblioteca Digital del
Proyecto Mambrino, grupo de investigación de la Universidad de Verona que
se ocupa de los libros de caballerías italianos de inspiración española publicados
en Venecia en los siglos xvi-xvii. Se aportan informaciones acerca de las obras
del corpus, los objetivos del proyecto, y la realización de la Biblioteca Digital,
cuyo centro recae en las ediciones digitales piloto del libro trece del Ciclo de
Amadís de Gaula, el Sferamundi di Grecia de Mambrino Roseo da Fabriano.
Finalmente, se aclaran los futuros avances e integraciones para sustentar la difusión y la accesibilidad a los recursos.1
Palabras clave
Proyecto Mambrino; PRIN Mapping Chivalry; edición digital académica; accesibilidad; Amadis de Gaula.
Abstract
Editing Chivalric Romances in the Digital Age: the Case of Mambrino Project Digital Library.
1. El presente trabajo se inscribe en el marco del Progetto Mambrino (Gruppo di Ricerca sul
Romanzo Cavalleresco Spagnolo), del PRIN Mapping Chivalry. Spanish Romances of Chivalry
from Renaissance to 21st century: A Digital Approach (2017-2023), del proyecto de Excelencia
“Inclusive Humanities 2023-2027” del Dipartimento di Lingue e Letterature Straniere de la Università di Verona.
Editar el Siglo de Oro en la era digital
20
Anna Bognolo - Stefano Bazzaco
This work deals with the creation and publication of the Digital Library of the
Mambrino Project, research group at the University of Verona that deals with
Italian Romances of Chivalry published in Venice in the 16th-17th centuries.
Information is provided about the works in the corpus, the goals of the project,
and the creation of the Digital Library, with digital editions of the thirteenth book
of the Amadis of Gaul Cycle, the Sferamundi of Greece by Mambrino Roseo da
Fabriano, at the center. Finally, future developments and integrations to support
the dissemination and accessibility of resources are clarified.
Keywords
Mambrino Project; PRIN Mapping Chivalry; Digital Scholarly Edition; accessibilty; Amadis of Gaul.
Libros de caballerías entre España e Italia: el corpus
En la primera edad moderna, España fue un foco de irradiación de nuevos tipos
de ficción en prosa. Géneros como la novela sentimental, picaresca, celestinesca,
pastoril y caballeresca salieron de España para propagarse de especial manera por
Italia y Francia, y más tarde a toda Europa, para alimentar el mercado del libro
en el primer siglo de la era de Gutenberg (Cabo Aseguinolaza 2013).
En la prosa castellana del siglo xvi, sobre la base del éxito del Amadís de
Gaula, los libros de caballerías son un acervo de novedades y experimentaciones.
Bajo la presión del interés comercial de la imprenta, en un contexto literario de
hibridismo y maleabilidad, los libros de caballerías se apoderan de formas y
contenidos de otros géneros y se hacen cada vez más interesantes (Marín Pina
2011).2 Constituyen un patrimonio de formas y contenidos que se expande, y
2. Los libros de caballerías no son, como se ha creído, una forma literaria desdeñable por mal
compuesta y aburrida (“todos una mesma cosa” decía el canónigo del cap. I, 47 del Quijote). Para
traer a colación un solo ejemplo recientemente publicado en edición moderna, El Mexiano de la
esperanza, caballero de la fe (1583) de Miguel Daza, estudiado por Ana Martínez Muñoz, no es
solo un libro de aventuras con episodios de novela pastoril o sentimental, sino una poliantea de
erudición humanística con discusiones filosóficas, digresiones históricas y geográficas, excursos
enciclopédicos y comentarios moralizantes. Es también una novela en clave que esconde personaEditar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
21
encuentra soluciones técnicas que se mantienen hasta en las novelas de hoy
(Brooks 2004; Pavel 2005; Mazzoni 2011).
El Proyecto Mambrino estudia precisamente la recepción de los libros de caballerías hispánicos en Italia y en Europa; los responsables científicos son Anna Bognolo y Stefano Neri, y el equipo de trabajo está formado por investigadores del
Departamento de Lenguas y Literaturas Extranjeras de la Universidad de Verona
(Stefano Bazzaco, Federica Zoppi) y de otras universidades italianas (Paola Bellomi, Giovanni Cara, Claudia Demattè, Tiziana Mancinelli, entre otros).
El corpus de interés del proyecto está constituido por más de cincuenta
obras en lengua italiana, traducciones del español y continuaciones de originales, que se difundieron en más de trescientas cincuenta ediciones. El grupo de
investigación está censando todos los ejemplares de estas ediciones, conservados
en las bibliotecas de todo el mundo, en una base de datos bibliográfica de la que
se hablará más adelante, que contiene por el momento alrededor de mil seiscientas entradas.
A pesar de su importancia, el corpus caballeresco italiano de derivación española es poco conocido y ningún texto se ha publicado en edición moderna. La
falta de dedicación de los estudiosos de literatura italiana se debe a la marginalidad del género respecto al canon nacional; a esto se añade la dificultad debida a
la extensión de los textos, que hace poco rentable consagrarse a la tarea. Por
consiguiente, poner los textos a disposición para que se conozcan ha sido un
objetivo fundamental del proyecto, así como la publicación en una biblioteca
digital pareció la solución más adecuada, porque permite optimizar la consulta
de un corpus tan vasto y reducir los costes de edición. Permite además integrar
en un único sitio varias novelas, de manera que una interrogación transversal y
cruzada pueda revelar inmediatamente las continuidades o diferencias, e individuar recurrencias de personajes, lugares y aventuras dentro de la totalidad del
mundo narrativo. Finalmente, la ventaja de editar los libros en la red es que se
hacen prontamente accesibles a la comunidad internacional.
Historia del Proyecto Mambrino
El Proyecto Mambrino nació en 2003.3 Su nombre no se debe solamente al famoso yelmo conquistado por el paladín Rinaldo y reconquistado por Don Quijote, sino sobre todo al nombre del traductor y escritor Mambrino Roseo da
Fabriano, el prolífico autor de casi todas las traducciones y continuaciones italianas de libros de caballerías españoles (Bognolo 2010, Bognolo y Neri 2014).
lidades de la alta nobleza, a la vez que plantea una interlocución irónica con el lector acerca del
estatuto de la ficción, con juegos metatextuales de manera casi cervantina (Daza 2019).
3. Proyecto Mambrino, <https://www.mambrino.it/it/>.
Editar el Siglo de Oro en la era digital
22
Anna Bognolo - Stefano Bazzaco
El objetivo del proyecto fue ambicioso desde el comienzo: se proponía
llevar a cabo una exploración de los libros italianos siguiendo las pautas de las
guías de lectura de libros de caballerías castellanos que publicaba el Centro de
Estudios Cervantinos de Alcalá de Henares. A partir de los ciclos de Amadís de
Gaula y de Palmerín de Olivia, se inició un trabajo de equipo en colaboración
con estudiantes de grado y de máster que redactaron cada uno un trabajo final
dedicado sistemáticamente a un volumen del ciclo, con el análisis de cada
texto, el resumen, el índice de nombres proprios y el estudio de un tema. Al
mismo tiempo se desarrollaron varias tesis doctorales dedicadas a textos clave
de nuestro corpus.4
Una financiación conseguida en 2010 permitió llevar a cabo la digitalización masiva de ejemplares conservados en bibliotecas de la región de Véneto,
como la biblioteca Cívica de Verona y la Biblioteca Bertoliana de Vicenza, que
fueron en parte publicados en discos DVD.5 También se creó la primera página
web que sigue abierta, donde publicamos las mismas colecciones digitalizadas y
abrimos una sección dedicada a la vida y obra del escritor Mambrino Roseo de
Fabriano.6
En 2013 publicamos el Repertorio del ciclo de Amadís de Gaula (Bognolo,
Cara y Neri 2013) que representaba la coronación de todo el recorrido de las
tesis antes recordadas. El repertorio contiene un estudio general sobre la vida del
autor y el éxito de los libros de caballerías en Italia y en Europa, y un resumen y
un índice de personajes de cada uno de los trece libros originales italianos. El
análogo Repertorio del ciclo de Palmerín de Olivia está en preparación (Bellomi,
Bognolo, Neri y Zoppi en prensa). El paso siguiente será justamente transportar
a la red y hacer consultable en acceso abierto todo este abundante material: es
decir, la edición digital interactiva que estamos preparando.
4. Las tesis doctorales son: la de Stefano Neri sobre arquitecturas maravillosas (Neri 2007a y
2007b), la de Linda Pellegrino con la edición del Florisel de Niquea (Silva 2015), la de Stefania
Trujillo sobre el tema del doble en Feliciano de Silva (codirección entre Anna Bognolo y Alberto
del Río, Universidad de Zaragoza), la de Stefano Bazzaco, con la edición del Leandro el Bel (Luján
2020). Se ha leído recientemente la tesis de Giada Blasut, que contiene la edición del Silves de la
Selva (codirección entre Anna Bognolo y José Manuel Lucía Megías, Universidad Complutense
de Madrid) y se está redactando la de Manuel Garrobo Peral sobre una base de datos de las fiestas
en la serie de Amadís de Gaula (codirección entre Stefano Neri y Nieves Pena Sueiro, Universidade da Coruña y Proyecto BIDISO).
5. Los discos DVD contenían la reproducción en facsímiles de los ejemplares digitalizados acompañados por una ficha de descripción bibliográfica. En aquel momento pudimos llevar a cabo la
transcripción de dos de los libros elegidos porque eran ediciones príncipes, Il secondo libro delle
prodezze di Splandiano (1564) y Aggiunta al Florisello (Le prodezze di don Florarlano) (1564), que
fueron las primeras ediciones consultables de libros de caballerías italianos (Bellomi, Bognolo,
Colombini y Neri 2011-2012).
6. Proyecto Mambrino, Vita di mambrino Roseo <https://www.mambrino.it/it/mambrino-roseo/
vita-di-mambrino-roseo>, Le opere <https://www.mambrino.it/it/mambrino-roseo/le-opere>.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
23
Relación con otros investigadores y otros proyectos.
Mapping Chivalry
Los seminarios de Historias Fingidas, que se inauguraron el 2010, nos permitieron
reanudar la red de relaciones con estudiosos expertos de la materia y abrir las puertas a otros investigadores, mientras daban ocasión a los más jóvenes de percatarse
de la riqueza cultural implicada en el estudio de los libros de caballerías. La convocatoria de los seminarios con periodicidad anual dio lugar a la fundación de la revista del mismo nombre Historias Fingidas (ISSN 2284-2667) donde se publicaban las contribuciones de estas reuniones. La revista fue apoyada desde su
nacimiento por un comité científico de alto nivel, gracias al apoyo del cual, mientras los estudios en este campo se multiplicaban, llegamos a conseguir al cabo de
varios años el nivel más alto de evaluación de las revistas en Italia (Fascia A).
Las relaciones más sólidas y fructíferas se instauraron con algunos grupos de
investigación de la península ibérica como el grupo Clarisel de la Universidad de
Zaragoza guiado por Juan Manuel Cacho Blecua y la revista electrónica Tirant
de València, dirigida por Rafael Beltrán. También es importante el intercambio
científico y didáctico con la Universidad de La Coruña, donde el seminario
SIELAE, con Sagrario López Poza y Nieves Pena Sueiro a la cabeza, publica la
Biblioteca Digital BIDISO.7 Finalmente, la Universidad de Verona ha establecido un convenio de intercambio académico con el Seminario de Estudios sobre
Narrativa Caballeresca de la Universidad Nacional Autónoma de México, dirigido por Axayácatl Campos García Rojas. Estos proyectos alcanzan amplios resultados publicando una gran cantidad de artículos científicos, archivos y textos
fiables, a la vez que permiten unas reuniones sistemáticas de investigación. La
esperanza es que, gracias a la Red Aracne, muchos de los recursos producidos
por estos grupos puedan confluir en un repositorio interoperable.
El Ministerio Italiano de la Universidad (MUR) financió en 2019 el proyecto Mapping Chivalry. Spanish Romances of Chivalry from Renaissance to 21st
century: A Digital Approach (PRIN 2017. Prot. 2017JA5XAR) (Bognolo 2023)
en el que participa un equipo más amplio que incluye grupos de investigación
de las universidades de Trento, de Roma La Sapienza y de Salerno. En este proyecto nacional, con el apoyo de la empresa informática Net7 de Pisa,8 se han
creado otras tres bases de datos: la universidad de Trento ha desarrollado MeMoRam, base de datos de motivos caballerescos (dirs. Claudia Demattè y Giulia
Tomasi);9 la de Salerno el repositorio de textos de teatro caballeresco (dir. Daniele Crivellari);10 la de Roma La Sapienza la base de datos de las reescrituras y
7.
8.
9.
10.
BIDISO, <https://www.bidiso.es/>.
Net7, <https://www.netseven.it/>.
MeMoRam, <memoram.mappingchivalry.dlls.univr.it>.
Teatro Caballeresco, <teatrocaballeresco.mappingchivalry.dlls.univr.it>.
Editar el Siglo de Oro en la era digital
24
Anna Bognolo - Stefano Bazzaco
recreaciones modernas de los libros de caballerías (dir. Elisabetta Sarmati).11 El
equipo de Verona (dir. Anna Bognolo y Stefano Neri) mantiene activo el Proyecto Mambrino, del cual la parte más ambiciosa es la biblioteca digital conectada con la base de datos bibliográfica y la base de datos de Personajes, Lugares
y Motivos narrativos.12
También el Departamento de Lenguas y Literaturas Extranjeras de la Universidad de Verona fue financiado como Departamento de Excelencia en los
años 2018-2022 y 2023-2027, lo que nos ha permitido contratar para el Departamento a dos profesores de informática y dos técnicos e integrar los recursos en un Centro Digital que preservará el sitio y los datos a largo plazo. Esto
ofrece una solución viable a los problemas de sostenibilidad, que es uno de los
aspectos cruciales a la hora de garantizar la longevidad y la supervivencia de este
tipo de trabajos.
La Biblioteca Digital
La Biblioteca Digital del Proyecto Mambrino (de aquí en adelante BDPM)
tiene el objetivo de publicar y dar visibilidad a estos textos del siglo xvi inéditos
modernamente, que fueron muy leídos en su época y ahora están olvidados y
ausentes de las historias de las literaturas española e italiana (Bognolo 2018;
Bognolo y Bazzaco 2019).
En la decisión sobre el tipo de edición que queríamos llevar a cabo, hemos
tenido en cuenta varios factores, en relación con la dimensión del corpus y las
condiciones materiales de la escritura y de producción impresa en los talleres de
Venecia. Ante todo, era evidente la utilidad de publicar el mayor número de
ediciones en un tiempo razonablemente breve; en segundo lugar, las exigencias
de urgencia y de practicidad nos sugerían mantener la conformidad con los criterios de los Libros de Rocinante de la Universidad de Alcalá, una transcripción
levemente modernizada y depurada de errores de un ejemplar de la edición príncipe. En nuestro corpus el criterio del respeto de la voluntad del autor no es
pertinente, puesto que las variantes se deben más a ajustes o descuidos de colaboradores de tipografía y a las incertitudes de la lengua italiana durante la reforma
de Bembo (Trovato 1991). En conclusión, hemos juzgado escasamente viable el
esfuerzo de realizar ediciones críticas y asumido el riesgo de editar un ejemplar lo
más completo y correcto posible de la edición príncipe de la obra.
Por otro lado, como se verá, los resultados de la BDPM merecen validación
científica en cuanto ediciones académicas digitales. El texto de las obras está
preparado y publicado siguiendo criterios y métodos rigurosos y documentados
11. AmadisSigloXX, <amadissigloxx.mappingchivalry.dlls.univr.it>.
12. Biblioteca Digital del Proyecto Mambrino, <mambrino.mappingchivalry.dlls.univr.it>.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
25
de manera que el trabajo del editor sea verificable por parte del lector (Mancinelli y Pierazzo 2020: 9). Junto a ello, la preparación de cada edición es conforme
a los principios de la filología digital, que suponen la superación de los límites
del espacio bidimensional de la ‘página’ impresa, en un ambiente hipertextual
que permite navegaciones y fruiciones diferentes según las exigencias de los
usuarios y no se puede imprimir sin una pérdida de información (Sahle 2016).
Manejando físicamente cualquier ejemplar de nuestro corpus, cualquier estudioso se podrá dar cuenta de su extensión y de las dificultades que se encuentran en la digitalización y transcripción: se componen con una letra cursiva
clara pero apretada y la encuadernación estrecha muchas veces no permite abrir
las páginas para fotografiarlas adecuadamente, tanto que algunas bibliotecas
contactadas se han negado enviar reproducciones digitales.13
La importancia de los libros de caballerías
Creemos que la ficción en prosa anterior a Cervantes merece ser más conocida,
no solamente por su valor en su época, sino para enriquecer la tradición de estudios que podríamos llamar ‘historia internacional de la novela’. A partir de ensayos clásicos como el de Ian Watt (2017), la línea de reflexión mayoritaria que
se afirmó ante todo en los países anglófonos no tiene en cuenta las aportaciones
hispánicas anteriores al Quijote, con la excepción del Lazarillo de Tormes y de la
picaresca. El desconocimiento de la riquísima tradición novelesca renacentista
española es casi total y relega estas obras a la irrelevancia, o a una porción de
saber especialista aislado y cerrado en la historia de la literatura nacional. En este
mismo contexto los libros de caballerías, a causa de su abundancia, de su extensión y de su mala fama, suelen ser los hermanos olvidados, uno de los géneros
perdidos que señaló Alan Deyermond (1975). Hasta hace poco, solo algunas
historias de la literatura les dedicaban un capítulo que les haga justicia.
No obstante, estas obras merecen mayor atención puesto que formaron el eje
de la literatura de evasión de la primera edad moderna, que alimentó la industria
y el mercado del libro, que facilitó la alfabetización y la democratización de la
lectura, sobre todo en el caso de las mujeres, y provocó el paso de la lectura en voz
alta a la lectura silenciosa, con los cambios antropológicos consiguientes (Loretelli
2010). Los libros de caballerías fueron el género que unió generaciones de lectores
europeos en las emociones por los mismos personajes, amores y aventuras, superando las barreras nacionales, lingüísticas y religiosas del Renacimiento.
13. A la transcripción con herramientas de reconocimiento automatizado de textos (HTR) se
han sumado dos niveles de revisión. Para las seis partes del libro de Sferamundi di Grecia (15581565), entre los pocos ejemplares conservados, elegimos dos de la BNE, uno de la Biblioteca
Universitaria de Santiago de Compostela, y tres de la Biblioteca Braidense de Milán.
Editar el Siglo de Oro en la era digital
26
Anna Bognolo - Stefano Bazzaco
El Proyecto Mambrino quiere poner su grano de arena en el estudio de la
novela moderna europea editando estos textos olvidados para que puedan leerse,
conocerse, consultarse y siga adelante la investigación acerca de los mismos.
La configuración general de la Biblioteca Digital
del Proyecto Mambrino
El objetivo de la Biblioteca Digital del Proyecto Mambrino, como se ha mencionado, es ofrecer una herramienta de estudio que permita combinar los resultados de investigación, las ediciones de los textos, el censo bibliográfico y el estudio de las obras, con particular atención hacia el desarrollo narrativo y la
detección de motivos caballerescos. Por lo tanto, en línea general, la BDPM se
concibió como un espacio informativo complejo, es decir una suerte de knowledge site (Robinson 2003) que permite al usuario navegar entre distintos campos
de interés. Se trata de un archivo donde una variedad de recursos, integrados
entre ellos, ofrecen una exploración del corpus textual desde distintas perspectivas, buscando la participación de tipologías de usuarios con intereses no necesariamente coincidentes.
La BDPM se constituye con tres elementos principales. En primer lugar, la
base de datos bibliográfica de las ediciones y ejemplares de los libros de caballerías
italianos, a la cual se añaden las ediciones modernas de las obras, elaboradas según criterios científicos y estándares técnicos acreditados, y diversas bases de datos que contienen lugares, personajes y motivos. Esta última ha conllevado una
interpretación sobre los textos que se fundamenta en los principios ya trazados
por especialistas de la materia. Se presentan a continuación estos tres recursos,
con especial atención a las técnicas de integración de la edición con la base de
datos bibliográfica y los índices para el estudio del contenido de las obras.
1. El censo de las obras: la base de datos bibliográfica
El censo de los ejemplares conservados de las novelas caballerescas italianas es
una de las tareas que interesaron al Proyecto Mambrino desde su fundación en
2003. Las obras, pertenecientes en su mayoría a los ciclos italianos de Amadis y
Palmerino, a los que se añaden otros ciclos menores y obras sueltas, son traducciones, continuaciones de originales y adaptaciones de las más famosas obras
que se produjeron en la península ibérica y que circularon impresas por toda
Europa a lo largo de los siglos xvi y xvii. La gran difusión de estos textos fue por
lo tanto un fenómeno global, lo cual ocasionó que los numerosos ejemplares
que se imprimieron acabaron por leerse y guardarse, y se conservan ahora en
numerosas bibliotecas europeas y americanas. Nos referimos a más de cincuenta
obras, que se difundieron en más de 350 ediciones. Gracias al trabajo de los
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
27
investigadores del proyecto se pudieron registrar los ejemplares de estas ediciones, que, hasta el momento, alcanzan el número aproximado de mil seiscientas,
y sigue en aumento.
El censo se publicó a partir de 2008 en la web del Proyecto Mambrino.14
Sin embargo, las tecnologías informáticas en esa época eran bastante limitadas:
los listados, organizados por título y fecha de las obras, se configuraron como
páginas estáticas que no permitían búsquedas cruzadas.
Cuando dispusimos de recursos económicos suficientes, decidimos mejorar
esta primera versión e integrar a nuestro nuevo proyecto de biblioteca digital una
base de datos de tipo dinámico, que aprovechara sistemas de búsqueda transversales y que pudiera ser puesta al día constantemente, evitando el riesgo de duplicar fichas y facilitando la incorporación de nuevas informaciones. Desde mediados de 2019, trabajamos en el diseño y a la implementación de la base de datos
bibliográfica. La estructura está dividida en tres niveles jerárquicos: obras, ediciones y ejemplares, cada uno compuesto por fichas que contienen varios campos
relacionados entre sí y los distintos niveles.
Fig. 1: filtros y entradas de la base de datos bibliográfica.
Los campos de cada ficha coinciden con los filtros y opciones de búsqueda
disponibles en la interfaz de usuario (Fig. 1), los cuales permiten extraer resultados a partir de la lengua, el sujeto y la tipología de las obras, la pertenencia a un
14. Proyecto Mambrino: Spagnole Romanzerie – Ciclo di Amadis di Gaula, <https://www.
mambrino.it/it/spagnole-romanzerie/ciclo-di-amadis-di-gaula>.
Editar el Siglo de Oro en la era digital
28
Anna Bognolo - Stefano Bazzaco
determinado ciclo, los nombres del autor o del traductor implicados en la publicación. Al acceder a una obra en concreto se ofrecen los metadatos generales,
correspondientes a los mismos campos de búsqueda; en la parte inferior de la
pantalla, por otra parte, se muestran las ediciones de la obra, ordenadas cronológicamente y dispuestas en forma de enlaces, para acceder directamente al nivel
sucesivo, el de una edición específica.
En el interior de la ficha de cada edición, se señala el título original, así como
aparece en las fuentes impresas, los metadatos de la publicación y los ejemplares
conocidos, destacando la eventual presencia de digitalizaciones o ediciones digitales relacionadas por medio de dos distintos iconos gráficos. Actualmente estamos
trabajando en la incorporación de otras informaciones pertinentes, como el nombre del dedicatario de la edición y el enlace a catálogos en línea nacionales e internacionales, como los catálogos OPAC SBN (Catalogo collettivo delle biblioteche
del Servizio Bibliotecario Nazionale) y USTC (Universal Short Title Catalogue).
Fig. 2: ficha de edición de la Aggiunta al quarto libro di Amadis di Gaula, 1563.
Al tener acceso al nivel sucesivo, se ofrecen, para cada ejemplar, los metadatos
asociados a la biblioteca, la descripción material del ejemplar, el permalink del repositorio online de la biblioteca y, en caso que los haya, los enlaces a las digitalizaciones. En el margen inferior, añadimos también un enlace a la edición digital del
ejemplar concreto que publicamos en nuestra web, de modo que el acceso a la
misma pueda darse a partir de los distintos niveles jerárquicos de la base de datos.
Con respecto a la precedente versión, los avances son significativos y se
fundamentan en una mayor flexibilidad de búsqueda y de consulta, lo cual convierte la base de datos bibliográfica en punto de acceso fundamental a los textos
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
29
de la BDPM. Por un lado, la navegación por niveles determina la organización
de los datos, que pueden extraerse de los filtros de búsqueda; por otro, los metadatos favorecen la exportación a otros repositorios en línea como la red de Excelencia ARACNE NODUS15 y Europeana en el formato Dublin Core según el
protocolo OAI-PMH (Open Archives Initiative’s Protocol for Metadata
Harvesting).16 El próximo paso que se dará en el ámbito del nuevo Proyecto de
Excelencia de la Universidad de Verona (2023-2027) será el de desarrollar una
ontología semántica para describir de forma exhaustiva estos materiales bibliográficos, favoreciendo la distribución de los metadatos en formato digital como
datos enlazados abiertos y la generación automática de redes de conocimiento
relacionadas con el género literario del que nos ocupamos.
2. Las bases de datos semánticas: personajes,
lugares y motivos caballerescos
Las tres bases de datos de personajes, lugares y motivos caballerescos son recursos fundamentales para examinar el contenido de las obras que componen la
BDPM porque permiten detectar similitudes y diferencias entre los distintos
libros. Con respecto a la creación de estos índices, contábamos ya con una labor
previa, que llevó a la publicación de los dos repertorios en papel ya citados. En
estos dos compendios, junto con unos estudios bibliográficos preliminares sobre
la organización, catalogación y difusión de ambos ciclos caballerescos, se encuentran los resúmenes de cada obra de la serie y un apartado final con los
nombres de los personajes y sus apariciones dentro de la saga. El trabajo llevado
a cabo fue una tarea imprescindible para el estudio del contenido de las novelas
caballerescas italianas; sin embargo, la necesidad de extender la investigación,
incluyendo los nombres de lugares y los motivos caballerescos, no se tuvo en
cuenta a causa de las limitaciones de la publicación impresa, porque la consulta
de los dos tomos se habría convertido en una operación engorrosa. Por otra
parte, el medio digital, por su intrínseca naturaleza, prometía responder a estas
necesidades de análisis y catalogación.
En primer lugar, creamos dos bases de datos distintas para las entidades
nominales (named entities) de personajes y lugares, cada una organizada por fichas. Al acceder a una ficha, el usuario puede encontrar los principales datos
15. Sobre la red ARACNE NODUS, véase Pena Sueiro y Saavedra Places (2019); Collantes
Sánchez (2023).
16. Red ARACNE - Criterios, <https://www.red-aracne.es/recursos/criterios#pie1>. Estamos de
momento trabajando en la extracción de los metadatos de cada ficha en el formato Dublin Core,
con el fin de facilitar su inclusión en el portal de Red ARACNE NODUS. Se prevé que en un
segundo momento los metadatos relativos a las ediciones se incluyan en el mismo fichero XML de
los textos editados.
Editar el Siglo de Oro en la era digital
30
Anna Bognolo - Stefano Bazzaco
relacionados con la entidad consultada: en el caso de los personajes se señalan el
ciclo de pertenencia, el nombre regularizado, el nombre español, los pseudónimos, el género y una breve historia del sujeto, que da cuenta de sus principales
intervenciones dentro de cada libro del ciclo; para los lugares, por otro lado, se
indican el nombre regularizado y la tipología, distinguiendo entre lugares reales
e imaginarios.
Todos los datos incluidos en las fichas, que podrán extenderse en relación
con las necesidades del proyecto, permiten realizar una búsqueda cruzada entre
las distintas entidades nominales. Por ejemplo, si el usuario tiene la intención de
investigar las doncellas guerreras, se pueden extraer todos los personajes femeninos que aparecen dentro de un ciclo; y del mismo modo, si quiere aplicar herramientas de georreferenciación para ver la distribución espacial de una obra en
concreto, todos los lugares reales citados.
Con respecto a los motivos caballerescos, por otra parte, hemos previsto
que, a través del portal principal, el usuario pueda realizar sus propias búsquedas
por palabras clave, aplicar diferentes filtros y acceder a categorías de motivos
divididos en tres apartados principales: motivos de corte, de aventura y de lo
maravilloso, a los cuales se añaden las secciones de modificadores (es decir de
elementos que califican un motivo sin suponer un cambio determinante en su
disposición en el entramado narrativo) y de motivos metanarrativos (Zoppi
2022; Bognolo 2023). Dentro de cada sección se encuentran las fichas de motivos, que no son exclusivas de ningún apartado: en cada ficha se indica el nombre
del motivo en tres idiomas (italiano, español e inglés), un código de referencia
derivado de otros índices conocidos (por ejemplo los de Thompson, Rotunda y
Guerreau-Jalabert), una breve descripción y una bibliografía de referencia. Además, se señalan las conexiones con otros índices de motivos en papel y en línea,
para resaltar los aspectos de continuidad y las innovaciones del género caballeresco con respecto a otras tradiciones narrativas.
Finalmente, dentro de cada ficha contenida en las tres bases de datos, se incluyó una sección de ocurrencias, es decir de las apariciones de tal personaje, lugar o
motivo en las obras que componen la biblioteca digital. Esta solución constituye
otra vía de acceso a las ediciones digitales del proyecto, consiente la exploración de
los textos e impulsa la navegación y la comparación entre episodios.
La base de datos es de tipo relacional y tiene la peculiaridad de memorizar la
información en los ficheros XML-TEI de los resúmenes de las obras: de este modo,
el portal se alimenta de manera automática, porque cada ocurrencia se genera a
partir del procesamiento de las informaciones que se insertan a nivel de backend.
Esto permite que al incorporar una nueva edición digital y al actualizar las bases
de datos, las nuevas entradas vayan incorporándose a los ficheros TEI que se suben
a una database XML nativa.17 Esta solución implica que con la puesta en línea de
17. Para ello, se ha utilizado Exist https://exist-db.org/exist/apps/homepage/index.html.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
31
nuevos contenidos textuales se potencian las posibilidades de interacción de los
usuarios, porque tendrán no solamente unas bases de datos cada vez más extensas
a su disposición, sino también unos resúmenes enriquecidos.
3. La edición digital académica del corpus caballeresco italiano
Como ya hemos subrayado, el núcleo de la Biblioteca Digital son las ediciones
digitales de las obras del corpus, que es una forma de presentación de los datos.
En general, nuestra herramienta presenta algunas características fundamentales
de los primeros prototipos desde el punto de vista de la producción y presentación de los contenidos (por ejemplo, la vista en paralelo de digitalizaciones y
texto, o la producción de documentos XML-TEI). Esta continuidad de modelos
y estándares es la base que asegura cierta estabilidad metodológica en las prácticas editoriales digitales (Pierazzo y Del Turco 2023: 115) y acrecienta la usabilidad por parte del usuario.
Guiados por la intención de ofrecerles a los estudiosos una herramienta dinámica, que permitiera integrar el texto de las obras con la base de datos bibliográfica y los índices semánticos, concebimos una visualización basada en una
versión personalizada del software de publicación TEI Publisher.18 Nos situamos, por lo tanto, en el campo de las ediciones prêt à porter, es decir, las publicaciones que aprovechan softwares de visualización ya existentes, adaptándolos
a las necesidades específicas de un proyecto en concreto (Pierazzo 2016).
Nuestra edición aparece como una página web tripartita en que se integran
las imágenes digitalizadas de la fuente con las transcripciones y los resúmenes
capítulo por capítulo, que constituyen la capa de estudio semántico del texto.
Para generar estos tres recursos, elaboramos un flujo de trabajo de tipo colaborativo que comentamos a continuación.
3.1. Digitalización de las fuentes y relaciones con bibliotecas
La foto-reproducción de los ejemplares del corpus caballeresco italiano fue una
tarea del Proyecto Mambrino desde su fundación. Remontan al año 2010 las
primeras iniciativas de digitalización con bibliotecas locales, como la Cívica de
Verona y la Bertoliana de Vicenza, pero esta perspectiva de llevar a cabo el trabajo con medios propios cedió el paso a iniciativas colaborativas de más amplio
alcance. Dentro de estas, constituyó un momento fundamental la propuesta de
cooperación con la Biblioteca Nacional de España (BNE), puesto que esta institución se mostró muy abierta a una colaboración con el proyecto. Al respecto,
18. Tei Publisher, <https://teipublisher.com/index.html>.
Editar el Siglo de Oro en la era digital
32
Anna Bognolo - Stefano Bazzaco
aclaramos que la BNE representa un ejemplo ejemplar de gestión del patrimonio cultural, ya que en estos años se está acercando a los mismos recursos de
preservación y distribución sugeridos por los mayores planes europeos, y ofreciendo como resultado excelentes prácticas de producción, utilización y difusión
de las imágenes digitalizadas.19
En nuestro caso, la BNE se ocupó de digitalizar las ediciones principes de
obras de nuestro interés, a partir del corpus piloto que escogimos, es decir, el
decimotercer libro del ciclo de Amadís, titulado Sferamundi di Grecia, que es
una obra original en seis tomos de la pluma del polígrafo veneciano Mambrino
Roseo da Fabriano. A continuación, gracias a la financiación del proyecto de
excelencia, pudimos hacer públicas las digitalizaciones de la BNE gracias a unos
servidores IIIF (International Image Interoperability Framework) del Departamento de Lenguas y Literaturas Extranjeras de la Universidad de Verona, favoreciendo la posibilidad futura de una difusión a largo plazo que pudiera alimentar a la vez la visibilidad del proyecto y la de la biblioteca. El IIIF es un formato
nacido en el contexto de la biblioteconomía que se fundamenta en la interoperabilidad y la difusión de foto-reproducciones de la fuente como un conjunto de
especificaciones estándar de API según una estructura Json-LD (Linked Data).
Emplear tal modelo descriptivo para nuestras imágenes acrecienta de forma notable la accesibilidad, fruición y preservación del facsímil digital (Mancinelli
2021: 74-81). Las imágenes se presentan como piezas de un mosaico que la arquitectura de la edición comulga en un único artefacto digital, pero que a la vez
son exportables como objetos separados, en el respeto de los principios FAIR,
sobre todo por lo que atañe al procesamiento de metadatos y a la reutilización
de las imágenes en otros proyectos. En este sentido, la BNE podrá aprovechar
en el futuro nuestro trabajo de sistematización de los materiales archivados y
favorecer un uso extensivo de las mismas digitalizaciones en red.
Esperamos que esta primera experiencia sea el punto de arranque para nuevas colaboraciones que no se limiten a la adquisición de imágenes, que son planes de menor interés desde el punto de vista de la investigación porque limitan
la difusión y reutilización del patrimonio documental digitalizado. Sin embargo, nuestra experiencia al respecto nos ha permitido constatar que todavía existe
19. La página web de la BNE resulta de sumo interés al respecto. Ya en años anteriores a la
pandemia Covid-19 la institución había difundido la guía “Proceso de digitalización en la Biblioteca Nacional de España” <https://www.bne.es/sites/default/files/repositorio-archivos/
ProcesoDigitalizacionBNE_0.pdf>, que sigue representando un ejemplo encomiable de documento para la gestión de proyectos de digitalización a nivel europeo. Sin embargo, aún de más
interés son las recientes noticias acerca de nuevos planes para la preservación digital y la reutilización de los artefactos digitales derivados de sus fondos documentales (1 marzo 2023, <https://
www.bne.es/es/noticias/nuevo-impulso-digitalizacion-acceso-reutilizacion-digital-bne>). Sobre
la integración de los metadatos de imágenes digitalizadas al formato de datos enlazados se consulten Santos Muñoz, Molleja López y Vizcaíno Ruiz (2022) y el volumen editado por Spadini,
Tomasi y Vogeler (2021), punto de referencia para la comunidad internacional.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
33
cierta reticencia al diálogo sobre la interoperabilidad por parte de algunas instituciones. El deseo es que esta situación pueda cambiar cuando se fijen de forma
contundente los planes de digitalización previstos por la agenda europea,20 que
de momento parecen más bien unas sugerencias que necesitan cierto tiempo
para arraigar de forma definitiva.
3.2. Transcripción semi-automática de las fuentes
A partir de las digitalizaciones, nos interesaba transcribir los textos. Como se ha
dicho, puesto que el corpus es muy amplio, la transcripción manual no parecía
rentable: exploramos por lo tanto la posibilidad de emplear herramientas de reconocimiento de textos para los impresos antiguos (HTR – Handwritten Text
Recognition) que permitieran extraer transcripciones de forma no supervisada,
las cuales después se corregirían por medio de un atento proceso de revisión.
Tras una valoración de los softwares de HTR disponibles, decidimos emplear la plataforma Transkribus, una herramienta elaborada por el grupo DEA
(Digitalisierung & Elektronische Archivierung) de la Universidad de Innsbruck,
en el contexto del plan Horizonte2020, actualmente gestionada por la Cooperativa Europea READ (Retrieval and Enrichment of Archival Documents)
(Muehlberger et al., 2019).
La plataforma fue entrenada para el reconocimiento de la letra cursiva del
XVI por medio de la transcripción manual de algunas páginas de las fuentes y,
pasando por la elaboración de unos específicos modelos de HTR, permitió
transcribir de forma semi-automática las obras piloto del corpus con un margen
de error mínimo que se acercaba al 1%, dependiendo de la calidad de las digitalizaciones empleadas (Bazzaco 2018). Estas transcripciones en bruto constituyeron el primer paso para la fijación del texto de las obras, porque de entrada se
revisaron por grupos de estudiantes y en un segundo momento se editaron gracias a la intervención de especialistas, colaboradores del proyecto.
El empleo de herramientas de transcripción automática representa un claro
aspecto de interés del proyecto desde el punto de vista metodológico, porque, a
la luz de sus aplicaciones en otros ámbitos, coincidió con un primer momento
de transferencia de conocimiento hacia una comunidad de usuarios interesados.
Es el caso, por ejemplo, de los estudiantes, a quienes se formó en la producción
automática del texto y su revisión. Para este fin, en los últimos cuatro años se
impulsó la investigación sobre reconocimiento de textos por medio de varios
talleres y seminarios, insistiendo en la utilización de Transkribus como una herramienta capaz no solamente de aligerar la labor de transcripción, lo cual res-
20. Digital Agenda for Europe, <https://www.europarl.europa.eu/factsheets/en/sheet/64/digitalagenda-for-europe>.
Editar el Siglo de Oro en la era digital
34
Anna Bognolo - Stefano Bazzaco
ponde a una función eminentemente instrumental, sino también como propulsora de un cambio en las prácticas editoriales, porque constituye de por sí un
instrumento capaz de potenciar de modo determinante el flujo de trabajo ecdótico tradicional (Bazzaco et al. 2022).
En nuestro caso, a causa de la extensión del corpus, seguimos la idea, bien
trazada por Sahle (2016) y retomada por Alvite-Rojas Castro (2022), de ofrecer
una edición científica porque basada en la captura de “algunas propiedades de la
fuente originaria”, lo cual conlleva que sea crítica en el sentido de que es “el resultado de la reflexión y del análisis de las fuentes textuales” (2022: 3).21 Esperamos que nuestras experimentaciones en el área de la transcripción automática de
impresos antiguos permitan el avance de otros proyectos, poniendo las bases
para una participación más activa de los filólogos en el proceso de migración de
los textos al espacio del World Wide Web.22
3.3. El modelo de representación de los datos:
la codificacióna la luz de la integración de recursos
Como es bien sabido, la modelización representa un aspecto central en la formalización de los objetos analógicos y constituye un pasaje decisivo para la confección de una edición digital académica (Ciula y Marras, 2023). Esto es verdad
por lo menos por dos razones. En primer lugar porque, a pesar de que contamos
con muchos ejemplos de ediciones digitales de altísimo nivel científico y metodológico, falta todavía un modelo estándar, sobre todo por lo que atañe a la
presentación de los datos, si bien la TEI sigue siendo el punto de referencia
(Spence, 2014; Allés-Torrent, 2017: 5 y ss.; Alvite y Rojas Castro, 2022: 5). En
segundo lugar, y consecuentemente, porque es la modelización, entendida como
configuración conceptual de la edición en cuanto ambiente informativo para las
estrategias de construcción de significado, la que guía las posibilidades de “empleo” por parte de sus usuarios.
Con respecto a esta cuestión, son significativas las palabras de Baillot y
Busch, quienes sostienen que “la comprensión del entorno editorial por parte
del lector está en la base de todas las decisiones editoriales que implica el desarrollo de la edición” (2021: 175, trad. mía). Así, la modelización, contextualizada dentro de un marco eminentemente semiótico, se percibe como momento
primordial de cada edición digital académica, porque implica la definición de
21. Sobre este tema se vea también Allés-Torrent (2020: 69).
22. La plataforma Transkribus propone planes para usuarios individuales, de uso gratuito y limitado a un número de entrenamientos y reconocimientos mensuales; para usuarios académicos
depende del plan escogido. Más información en: <https://www.transkribus.org/plans>. En el caso
del Proyecto Mambrino, hemos elaborado un modelo de HTR para el reconocimiento de la tipografía cursiva, que pondremos a disposición de los usuarios en 2024.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
35
un modelo abstracto y formal sobre el cual, después, hay que fundamentar la
memorización de los datos (analógicos) y la selección de la tecnología de publicación (Mancinelli 2021: 69).23
Dos principios esenciales son los que guiaron la preparación de las ediciones
digitales del Proyecto Mambrino: primero, integrar un aparato que permitiera
el estudio de los contenidos de las obras; segundo, ofrecer a los usuarios distintas
modalidades de lectura y acceso al texto. Se trata, en otras palabras, de buscar
una forma de navegación de las obras que respete la correspondencia textoimagen, pero que integre también los resúmenes y unifique los recursos principales en una única pantalla. Pensamos en una infraestructura que permitiera
conectar los materiales entre ellos y que respetara estándares de economía de la
información, con el fin de no distraer la atención del usuario. De este modo, los
metadatos responden a la voluntad de enlazar las ediciones con repositorios externos; mientras que las bases de datos permitirían engarzar los contenidos con
datos y proyectos afines al ámbito de estudio.
Para cumplir con estos propósitos se procedió con la elaboración de un sistema de marcado que consintiera la navegación simultánea del texto y del resumen de la obra, siendo este último el canal de acceso a las bases de datos semánticas. Se pasó entonces a la creación de dos ficheros XML-TEI distintos.
El texto de la edición (fichero “source”)
El primer fichero XML-TEI a la base de nuestra edición contiene el texto de la
transcripción revisado y reproduce la estructura lógico-material de la fuente impresa de la obra. Este fichero (que llamamos source) está compuesto por una selección
(subset) de elementos relevantes para las finalidades del proyecto, que se incluyeron
en el esquema de validación Relax-NG del Proyecto Mambrino generado con la
herramienta ROMA.24 En conformidad con las normas de la TEI P5, se previeron
dos secciones principales: el encabezado TEI, que contiene los metadatos de la
edición digital e informaciones sobre la fuente empleada, y el texto editado.25
— El encabezado (teiHeader): está compuesto por un primer bloque de
metadatos, insertados en el elemento <fileDesc> y sus principales subsecciones, que son por la mayoría obligatorias según las prescripciones
del modelado básico de la TEI. En primer lugar, el elemento <titleSt23. Dicho en otras palabras, la modelización “implica la traduzione di schemi concettuali, di
sistemi complessi di conoscenza e relativi oggetti, in modelli processabili computazionalmente o
in paradigmi operazionali” (Ciula y Marras 2023: 51), lo cual se fundamenta en una interacción
mutua entre estudios humanísticos y computacionales .
24. TEI: ROMA, <https://roma.tei-c.org/>.
25. Los ficheros XML-TEI son descargables desde el visualizador TEI Publisher de cada edición.
Editar el Siglo de Oro en la era digital
36
Anna Bognolo - Stefano Bazzaco
mt>, en que se indican título de la edición digital, autor y editor de la
obra original y responsables de la edición, distinguiendo entre curadores, revisores y codificadores, cada uno relacionado con su propio código ORCID. Sigue pues el apartado <publicationStmt>, que contiene
metadatos sobre institución editora (el Departamento de Lenguas Extranjeras de la Universidad de Verona), lugar y fecha de publicación,
licencia de distribución (normalmente CC BY-NC-ND 4.0, que no
permite la distribución comercial y de obras derivadas). Además, para la
identificación de la edición dentro de la BDPM, se añadió el elemento
<seriesStmt>, que informa sobre la colección editorial y el ciclo. El elemento <sourceDesc>, finalmente, restituye informaciones acerca del
ejemplar editado, como la localización (@type: catalogue_number) y el
enlace al registro de la biblioteca. Este conjunto de metadatos es de gran
importancia porque, al ser estable y compartido entre todas las ediciones, no implica solamente inventariar la edición digital dentro del corpus, sino también asegurar la interoperabilidad con otros proyectos y la
extracción automática de informaciones por medio de parsers. El nivel
de detalle, sin embargo, puede extenderse por medio de otros metadatos
opcionales: de momento estamos trabajando en la definición de un esquema de metadatos Dublin Core para facilitar la futura exportación al
formato de datos OAI-PMH.
— El texto de la obra (text): desde el punto de vista de la estructura lógica, en
el cuerpo del texto se identifican las divisiones textuales (elemento <div>
combinado con atributos @type), el título y el cuerpo de cada capítulo
(elementos <head> y <p>). A partir de esta estructura, se añadieron los
elementos que explicitan los aspectos materiales del documento, como
rupturas de páginas y de líneas (<pb> y <lb>). El marcado así concebido,
que al parecer resulta muy básico, tiene el fin de proporcionar un texto
desprovisto de una interpretación fuerte, que sea lo más objetivo posible.
De hecho, se preservan solamente los elementos que son esenciales para
los propósitos del proyecto: los saltos de página y de línea implican una
visualización paralela del texto y de las digitalizaciones (obviando la necesidad de presentar también una versión diplomática del texto); los elementos que describen la estructura lógica, como los títulos de capítulos,
posibilitan aplicarles una presentación con un estilo específico a distintas
porciones del texto. El resultado es un documento que evita la verbosidad
y redundancia del lenguaje de la TEI, fomentando la preservación y la
reutilización del texto limpio por parte de otros usuarios.
Un aspecto de interés dentro del proyecto supone un último recurso que
permite la navegación simultánea de texto y su resumen. Se trata de un identificador xml:id progresivo que situamos a la altura de las divisiones textuales de cada
capítulo: este atributo pone en relación el título del capítulo con la porción de
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
37
resumen correspondiente. De este modo, se pudo eludir el notorio problema de
las jerarquías sobrepuestas, con el resultado de que toda la base de estudio semántico de la obra queda reflejada en otro fichero TEI, anclado al texto y ordenado
según la misma estructura de niveles anidados.
Los resúmenes de la obra (fichero “commentary”)
Como se dijo, al fichero textual de la obra se añade un segundo documento
XML-TEI que contiene los resúmenes capítulo por capítulo de la misma, en el
cual se señalan las entidades nominales (nombres de personajes y lugares) y los
motivos caballerescos. Se trata en otras palabras de adoptar una perspectiva modular de tipo stand-off, donde se le delega a los resúmenes la función de reproducir parte del contenido semántico, mientras que el texto de las ediciones queda intacto y preparado para futuras integraciones. La idea es de concebir un
entorno digital hecho por distintos componentes que son extensibles y reemplazable sin afectar la apariencia general de la plataforma, que pueda configurar la
edición como un growing work site (Schillingsburg, 2009: párrafo 4 y ss.).
Este segundo documento es más simple que el precedente desde el punto de
vista de la estructura:
— El encabezado TEI del fichero es menos extenso y es sencillo en su organización. En las secciones <titleStmt>, <publicationStmt> y <seriesStmt> se insertan las mismas informaciones que en el documento TEI
relativo al texto, como el título, los responsables de la edición, la colección y el ciclo de pertenencia. Varía solamente el elemento <sourceDesc>, que no remite a la cinquecentina, sino al correspondiente repertorio en papel del que extraemos los resúmenes.
— El texto del documento está compuesto por dos secciones. La división
inicial, que llamamos paratexto digital, contiene informaciones acerca de
la obra impresa e incluye los nombres de autor, editor, dedicatario: cada
uno de ellos está incluido en un elemento <persName> y presenta enlaces
a repositorios de autoridades como VIAF (Virtual International Authority File) o DBpedia con fines de desambiguación. Sigue pues el cuerpo de
los resúmenes, dividido por capítulos, en que se indican las entidades
nominales y los motivos. En concreto, para las entidades insertamos el
elemento <name> con sus atributos @person y @place en correspondencia
de la primera aparición de una entidad en el capítulo; mientras que, con
respecto a los motivos, conectamos el grupo de motivos que aparecen en
un capítulo con el título correspondiente del resumen por medio del elemento <interpGroup>, de modo que el investigador al consultar los resúmenes en el visualizador de la edición tenga de entrada toda la información necesaria para el estudio de la obra en cuestión.
Editar el Siglo de Oro en la era digital
38
Anna Bognolo - Stefano Bazzaco
Esta solución es particularmente eficaz porque constituye la base para la
alimentación de la plataforma, puesto que a cada inserción de una nueva edición
en la BD se transmiten informaciones a las bases de datos semánticas, que incorporan las nuevas entidades y señalan el lugar de aparición dentro de la obra de
forma automatizada. De tal manera, facilitamos la expansión de la plataforma y
aseguramos una mayor participación por parte de colaboradores externos al proyecto, que necesitarán tan sólo conocer los principios básicos del etiquetado y
confeccionar un buen documento TEI para implementar la plataforma.
3.4. Ediciones de lectura: los eBooks del Proyecto Mambrino
Con la intención de proveer al usuario una modalidad de acceso al texto distinta, pensamos en la creación de unos eBooks descargables que se caracterizaran
como “ediciones de lectura”, porque suponen la presencia de materiales de soporte en forma de vínculos hipertextuales. Gino Roncaglia distinguió entre dos
distintas modalidades de consulta de los textos (2009: 14 y ss.). La primera de
ellas es llamada lectura lean forward y corresponde a un acercamiento activo al
texto, concebido para recabar información, que seleccionamos y elaboramos:
adoptamos esta postura por ejemplo cuando estudiamos o estamos ante la pantalla del ordenador, porque buscamos y procesamos la información que nos interesa. Por otra parte, la segunda modalidad es llamada lectura lean back, es decir
tumbada hacia atrás, como cuando leemos una novela o vemos una película relajados en un sofá y dejamos que la información impulse nuestra imaginación
sin que se necesite una intervención concreta dentro del proceso comunicativo.
Como se puede apreciar, el libro impreso es a la vez una herramienta de investigación y un objeto ergonómico apto para la lectura relajada, siendo por lo tanto
idóneo para ambas modalidades. Sin embargo, en la migración de un texto al
entorno digital no se mantiene esta doble configuración y es prerrogativa del
editor planear distintas modalidades de representación de los datos textuales.
En el caso de nuestra edición digital, la visualización web requiere una postura del tipo lean forward, lo cual la caracteriza más bien como un “objeto para
usar” que un “texto para leer”.26 Los eBooks, al contrario, se ajustan a una postura de tipo lean back porque proponen una lectura lineal del contenido textual
y se adaptan también a situaciones de lectura en movilidad. De momento estamos trabajando en la creación de unos eBooks de los tomos del Sferamundi que
cumplan con este propósito, pero que mantengan las informaciones semánticas,
por ejemplo incluyendo unos índices finales de resúmenes, personajes, lugares y
motivos con enlaces hipertextuales que remitan al texto de la obra.
26. Se vean al respecto: Pierazzo (2015: 147-51); Stinne Greve Rasmussen (2016: 119 y ss.);
Allés-Torrent (2017: 15).
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
39
3.5. Diseño de la edición
Una vez preparados los facsímiles, las transcripciones, los resúmenes y los
eBooks, el paso siguiente consistió en concebir un ambiente web que permitiera
conjugar y manejar todos estos materiales. Por un lado, estábamos convencidos
de que la plataforma de visualización tenía que agrupar todos los recursos en una
única pantalla, evitando dispersar la atención del usuario en un constante vaivén
entre los distintos componentes de la edición. Por otro, era necesario presentar
los materiales de manera eficaz, para que la arquitectura web no resultara de
difícil comprensión y se acomodara a las expectativas de lectura e interpretación
de los usuarios.
Soportados por la empresa Net7 de Pisa concebimos una versión personalizada de la herramienta TEI Publisher que tuviera en cuenta ambas necesidades.
Fig. 3: diseño de la edición digital académica de la primera entrega
de Sferamundi di Grecia (1558).
La presentación web, como se puede apreciar, se basa en el principio general
de economía de la información y se ajusta al modelo de edición sinóptica ya
empleado por otras ediciones digitales. En la columna de izquierda aparece la
imagen facsímil en formato IIIF, acompañada por funciones de zoom y visualización a toda pantalla, mientras que en la columna central presentamos el texto
transcrito de la obra. A estas dos secciones añadimos una columna a la derecha
que contiene los resúmenes, cuya prerrogativa es la conexión del texto con las
bases de datos semánticas.
Toda una serie de botones del visualizador permite manejar los tres contenidos principales de la edición: hay flechas para la navegación sincrónica de las
páginas digitalizadas y del texto, mandos con funciones de zoom para el texto,
un desplegable para la navegación de capítulos. En la sección del resumen, además, añadimos una función para activar la detección de entidades, que aparecen
en distintos colores: al seleccionarla, el usuario accede a la correspondiente voz
Editar el Siglo de Oro en la era digital
40
Anna Bognolo - Stefano Bazzaco
del índice semántico, que se abre en una nueva pestaña. Por medio de estos
mandos aseguramos que el texto de la edición siga siendo central en el espacio
de interacción del usuario, pero también ofrecemos el acceso a otros recursos.
Además, incorporamos al diseño del visualizador un botón de download, que
permite al usuario descargar y consultar en local un fichero comprimido que contiene los documentos XML-TEI del texto y del resumen, la versión eBook de la
obra y un fichero TXT para el procesamiento con herramientas de lectura distante, para el estudio cuantitativo y el procesamiento automático de la información.27
En la parte inferior de la página, justo debajo del visualizador, hay el apartado de metadatos. En él aparecen distintas informaciones: el responsable de la
edición, la fecha de publicación, la licencia de distribución y los códigos de referencia del artefacto digital, como el identificador ISBN y el DOI. Pero también se incluyen enlaces a los distintos niveles de la base de datos bibliográfica,
que permite volver a las fichas de obra, edición y ejemplar correspondientes al
texto consultado. La página web de la edición, también en el caso de los metadatos bibliográficos, admite que el usuario pueda acceder a otras secciones de la
BDPM, sin que por ello abandone la página principal del visualizador. De hecho, la ficha de la base de datos bibliográfica aparece en una nueva pestaña, lo
cual asegura que siempre se pueda volver al texto de la edición en correspondencia del punto en que se había dejado la lectura. Se trata, en otras palabras, de
volver a poner al centro de la edición el texto, evitando que la navegación resulte demasiado compleja y, por consiguiente, opaca para el usuario (Van Mierlo
2022: 117 y 118).
Conclusiones: difusión, sostenibilidad y accesibilidad
La Biblioteca Digital del Proyecto Mambrino estará disponible en la web desde
enero de 2024. Como ya se ha mencionado, se trata de uno de los cuatro portales que constituyen el proyecto Mapping Chivalry. Spanish Romances of Chivalry
from Renaissance to 21st century: A Digital Approach, dedicado al estudio de la
literatura caballeresca ibérica y sus múltiples manifestaciones literarias. En concreto, la plataforma realizada por el grupo de investigación veronés se ocupa del
censo, el estudio y la publicación digital de las novelas de caballerías italianas de
derivación española del Renacimiento. Para responder a estos objetivos, se crearon distintas herramientas que permitieran una renovación y mejor difusión de
los resultados de investigación del Proyecto Mambrino: una base de datos bi-
27. Pueden consultarse los trabajos de Franco Moretti producidos en el Stanford Literary Lab,
por ejemplo: <https://litlab.stanford.edu/projects/operationalizing/> (cons. 19/01/2024). Sobre
la estilometría y los estudios computacionales de atribución en relación con las literaturas ibéricas,
véase la bibliografía citada en Bazzaco (2021).
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
41
bliográfica que registra los ejemplares conservados de las obras caballerescas,
unas bases de datos semánticas que acrecientan las posibilidades de estudio del
corpus, unas ediciones digitales académicas que faciliten el acceso a los textos. A
pesar de que una parte del trabajo inicial de ideación e inicialización del portal
está hecha, quedan todavía algunas cuestiones abiertas, sobre todo en lo que
atañe a la preservación, difusión y utilización de los recursos generados.
Entre los objetivos futuros, quizás el más central es el tema de la difusión
de la información, que tiene que fundarse en la integración con otros repositorios en línea. Con tal fin, se están dando varios pasos para la incorporación de
los contenidos de la plataforma a varios repositorios, de manera que las ediciones sean accesibles a través de distintos portales. En primer lugar, por medio de
la incorporación de un metabuscador de dominio en la página del proyecto
Mapping Chivalry, los productos digitales de la BDPM serán puestos en relación con los tres portales elaborados por los grupos de investigación con que
colaboramos, fomentando la agrupación de los contenidos y la conexión con
otros proyectos del mismo ámbito. En segundo lugar, gracias a la adaptación
de los metadatos al protocolo de distribución OAI-PMH, se podrán incorporar
los productos de nuestra investigación a repositorios de más amplio alcance,
como RED ARACNE y Europeana. La intención futura es que, gracias a la
migración de los contenidos al formato de datos enlazados abiertos, nuestra
biblioteca digital alimente investigaciones futuras por parte de diversos grupos
de usuarios: conocedores del género caballeresco, especialistas de otros sectores
de estudio y también lectores en general, interesados al contexto de producción
y difusión de las obras.28
Con respecto a la sostenibilidad, por otra parte, adoptamos varias estrategias. Gracias a las financiaciones obtenidas por el Proyecto de Excelencia veronés “Le Digital Humanities applicate alle lingue e letterature straniere” (20182022), contamos actualmente con el apoyo de los técnicos informáticos del
departamento para disponer de unos servidores que nos aseguren que el portal
no se convierta en un cementerio digital. Sin embargo, es evidente que muchas
bibliotecas y ediciones digitales, si bien siguen siendo accesibles, necesitan una
puesta al día y ajustes técnicos periódicos, debidos a los constantes cambios en
28. El tema de capturar la atención del público ha sido tratado por la comunidad científica con
poca frecuencia. Peter Robinson (2005), y años más tarde Porter (2013) y Rosselli del Turco
(2016), se interrogaron sobre el uso que se hace de las ediciones digitales académicas y lamentaron
la falta de un amplio público con respecto a los esfuerzos humanos y económicos invertidos para
su producción. Las respuestas que dieron estos investigadores trazaban un panorama de las ediciones digitales académicas que parecía todavía poco maduro para convertirse en punto de referencia
para una extensa comunidad de usuarios. La nueva generación de ediciones, que se basa en una
mayor interacción y difusión de los datos, quizás consentirá trazar un cuadro más riguroso y a la
vez esperanzador sobre este tema. Al respecto, se vean también las reflexiones de Franzini et al.
(2019) y Van Mierlo (2022: 117 y ss.).
Editar el Siglo de Oro en la era digital
42
Anna Bognolo - Stefano Bazzaco
los protocolos de difusión de la información, así como la permanente evolución
tecnológica. Por esta razón, el flujo de trabajo que planeamos se fundamenta en
la formación de jóvenes estudiantes. La transferencia de conocimiento es indispensable para contar con una nueva comunidad de usuarios que, guiados por el
interés en la materia y las herramientas de las humanidades digitales, se conviertan posteriormente en colaboradores del proyecto, contribuyendo a la expansión del trabajo que ya se llevó a cabo.
Desde otra perspectiva, para acrecentar la participación externa pensamos
también en el reconocimiento del trabajo editorial por medio de la atribución
de códigos ISBN y DOI a los recursos de la BDPM. Se trata de un paso fundamental para favorecer la incorporación al proyecto de colaboradores y estudiantes porque a los colaboradores se les asegura que los esfuerzos invertidos podrán
después valorarse por parte del sistema académico. Hay que señalar que la acreditación de la actividad editorial en el medio digital ha entrado muy recientemente en los debates de la comunidad científica (Bleier 2021). Sin embargo, el
reconocimiento del trabajo no parece ser todavía una preocupación de las principales instituciones europeas comprometidas en la distribución y preservación
de productos editoriales. Un ejemplo es que dentro del portal ISBN no se encuentra una solución unívoca para asignarle el código a cada edición digital
académica, que de momento debe considerarse una extensión de un producto
editorial ya conocido como es el libro electrónico. Parece que algo se está moviendo al respecto, pero se trata de un proceso de mediación que necesita todavía cierto tiempo para asentarse.
Un último aspecto de interés, que nos ocupará en los próximos meses, es la
cuestión de la accesibilidad. En concreto, entendemos la accesibilidad como un
concepto extendido y de largo alcance, que abarca cuestiones como la usabilidad, la marginalidad y la inclusión (Martinez et al. 2019: 42 y ss.). En relación
con tales asuntos, estamos definiendo un plan de trabajo que convertirá la
BDPM en un espacio virtual en que se sientan representados e incluidos grupos
que, de otra manera, quedarían marginados, por ejemplo adaptando el diseño
de la interfaz y de productos como los eBooks a las prerrogativas de los discapacitados visuales.
Gracias a las financiaciones previstas por el nuevo proyecto de excelencia,
centrado principalmente en los temas de la accesibilidad y adaptación de los
recursos digitales a los principios FAIR, estamos convencidos de que se podrán
alcanzar todos estos objetivos, hasta convertir la Biblioteca Digital en un lugar
de conocimiento versátil y atractivo para todo tipo de usuario.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
43
Bibliografía
Allés-Torrent, Susanna, «“Tiempos hay de acometer y tiempos de retirar”:
literatura áurea y edición digital». Studia aurea: revista de literatura española
y teoría literaria del Renacimiento y Siglo de Oro, vol. 11 (2017), pp. 13-30,
<https://raco.cat/index.php/StudiaAurea/article/view/332408>.
—, “Crítica textual y edición digital o ¿dónde está la crítica en las ediciones digitales?”. Studia aurea: revista de literatura española y teoría literaria del Renacimiento y Siglo de Oro, vol. 14 (2020), pp. 63-98, <https://doi.org/10.5565/
rev/studiaaurea.395>.
Alvite-Díez, María Luisa y Antonio Rojas-Castro, “Ediciones digitales académicas: concepto, estándares de calidad y software de publicación”, Profesional de la información, v. 31, n. 2 (2021), <https://doi.org/10.3145/epi.
2022.mar.16>.
Baillot, Anne y Anna Busch, “Editing for Man and Machine. Digital Scholarly Editions and their Users”, Variants, 13 (2015), «Users of Scholarly
Editions: Editorial Anticipations of Reading, Studying and Consulting»,
pp. 175-187.
Baranda Leturio, Consolación y Eduardo Rodríguez, “Red ARACNE: retos
y objetivos de un proyecto de coordinación en letras hispánicas digitales”,
Janus, Anexo 1: «Humanidades Digitales: desafíos, logros y perspectivas de
futuro», (2014), pp. 101-109.
Bazzaco, Stefano, “El Progetto Mambrino y las tecnologías OCR: estado de la
cuestión”, Historias Fingidas, 6 (2018), pp. 257-272, <http://dx.doi.
org/10.13136/2284-2667/89>.
—, “Experimentos de estilometría en el ámbito de los libros de caballerías. El
caso de atribución de un original italiano: Il terzo libro di Palmerino
d’Inghilterra (Portonari, 1559)”, in “Prenga xascú ço qui millor li és de mon
dit”. Creació, recepció i representació de la literatura medieval., (coord.) Meritxell Simó, (eds.) G. Avenoza, A. Contreras, G. Sabaté, L. Soriano, Cilengua : San Millán de la Cogolla, 2021, pp. 149-166.
Bellomi, Paola, Bognolo Anna Colombini; Federica, Stefano Neri, Ciclo italiano di “Amadis di Gaula”. Collezione della Biblioteca Civica di Verona, direzione
scientifica dell’edizione fotodigitale di A. Bognolo, studi preliminari di A. Bognolo e P. Bellomi, Prefazione di A. Contò, Verona, QuiEdit, 2011-2012.
Bellomi, Paola, Bognolo Anna, Stefano Neri, Federica Zoppi, Repertorio delle continuazioni italiane ai romanzi cavallereschi spagnoli. Vol. 2. Ciclo di
Palmerino di Oliva (Venezia 1544-1566), Roma, Bulzoni, (en prensa)
Bleier, Roman, “How to cite this digital edition?”, DHQ: Digital Humanities
Quarterly, vol. 15 (2021), Issue 3.
Bognolo Anna y Stefano Neri, «Progetto Mambrino. Resultados y perspectivas», JANUS. Estudios sobre el Siglo de Oro, 3 (2014), pp. 68-72. <http://
www.janusdigital.es/estaticas/ver.htm?id=1>
Editar el Siglo de Oro en la era digital
44
Anna Bognolo - Stefano Bazzaco
Bognolo, Anna y Stefano Bazzaco, “Tra Spagna e Italia: per un’edizione digitale del Progetto Mambrino”, eHumanista/IVITRA, 16 (2019), pp. 20-36.
Bognolo, Anna, «Vida y obra de Mambrino Roseo da Fabriano, autor de libros
de caballerías», eHumanista, vol.16, 2010, pp. 77-98. (http://www.ehumanista.ucsb.edu/)
—, “Reti di libri, libri in rete. Libros de caballerías tra Italia e Spagna” en Maria
Rosso, Felice Gambin, Giuliana Calabrese, Simone Cattaneo (eds.) Trayectorias literarias hispánicas: redes, irradiaciones y confluencias, Roma, AISPI
Edizioni, 2018, 91-106.
—, “Attualità dello studio dei libri di cavalleria: il progetto PRIN ‘Mapping
Chivalry’ nel xxi secolo”, en «Caballeresca y reescrituras (siglos xixxxi)», Elisabetta Sarmati y Amy Bernardi (coords.), Orillas, 12 (2023),
pp. 485-495.
Brooks, Peter. Trame: intenzionalità e progetto nel discorso narrativo, Torino,
Einaudi, 2004.
Cabo Aseguinolaza, Fernando “L’Italia o l’invenzione della letteratura spagnola. Frenching Amadis. Stampa e orizzonte europeo. Ancora traduzioni. I
viaggi di Diana. Picari pellegrini”, trad. Anna Bognolo, Historias Fingidas,
1 (2013), pp. 177-199.
Ciula, Arianna y Cristina Marras, “Modelli, metamodelli e modellizzazione
nelle Digital Humanities”, en Fabio Ciotti (ed.), Digital Humanities. Metodi, strumenti, saperi, Roma, Carocci, 2023, pp. 51-65.
Collantes Sánchez, Carlos M., “Red Aracne Nodus: consolidación y nuevos
horizontes en las Humanidades Digitales”, en Antonio Sánchez Jiménez,
Cipriano López Lorenzo, Adrián J. Sáez, José Antonio Salas (eds.), La actualidad de los estudios de Siglo de Oro, Kassel, Reichenberger, 2023, pp.
489-501, <http://www.reichenberger.de/Media/hd1/hd1_051.pdf>.
Daza, Miguel, Corónica de don Mexiano de la Esperança, Caballero de la Fe, ed.
Ana Martínez Muñoz, Alcalá de Henares, Universidad de Alcalá / Instituto
Universitario de Investigación en Estudios Medievales y del Siglo de Oro
Miguel de Cervantes, 2019
Deyermond, Alan “The lost Genre of Medieval Spanish Literature”, Hispanic
Review 43, 231-59, 1975.
Franzini, Greta, Simon Mahoney y Melissa Terras, (2019), “Digital editions
of text : Surveying user requirements in the Digital Humanities”, ACM
Journal on Computing and Cultural Heritage (JOCCH) vol. 12, no. 1 (2019),
<https://doi.org/10.1145/3230671>.
Loretelli, Rosamaria, L’invenzione del romanzo. Dall’oralità alla lettura silenziosa, Roma Laterza, 2010.
Lucía Megías, José Manuel, “Elogio del texto digital 2.0 (¿el triunfo de la segunda textualidad?)”, en Déborah González y Helena Bermúdez Sabel
(eds.), Humanidades Digitales: Miradas hacia la Edad Media, De Gruyter,
2019, pp. 90-110.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
45
—, “El editor de texto ante el reto digital: elogio de la edición 2.0”, Revista de
Humanidades Digitales, 4 (2019), pp. 93-114, <https://doi.org/10.5944/
rhd.vol.4.2019.25188>.
[Luján, Pedro de], Leandro el Bel, ed. Stefano Bazzaco, Universidad de Alcalá,
Alcalá de Henares, 2020.
Mancinelli, Tiziana y Elena Pierazzo, Che cos’è un’edizione scientifica digitale,
Carocci, Roma 2020.
Mancinelli, Tiziana, “Per l’edizione scientifica digitale dei ‘Documenti
d’Amore’ di Francesco da Barberino: modelli, metodi e strumenti”, en Sara
Bischetti y Antonio Montefusco (eds.), Francesco da Barberino al crocevia,
De Gruyter, Berlín, 2021, p. 65-90.
Marín Pina, Ma Carmen, Páginas de sueños. Estudios sobre los libros de caballerías castellanos, Zaragoza, Institución “Fernando el Católico”, 2011.
Martínez, Merisa, Wout Dillen, Elli Bleeker, Anna-Maria Sichani y Aodhán Kelly, “Refining our conceptions of ‘access’ in digital scholarly editing: Reflections on a qualitative survey on inclusive design and dissemination”, Variants, 14 (2019), pp. 41-74, <https://doi.org/10.4000/variants.
1070>.
Mazzoni, Guido, Teoria del romanzo, Bologna, Il Mulino, 2011 [2003].
Mühlberger, Günter et al., «Transforming scholarship in the archives through
Handwritten Text Recognition. Transkribus as a case study», Journal of
Documentation - Emerald Publishing, 75/5 (2019), pp. 954-976.
Neri, Stefano. L'eroe alla prova: architetture meravigliose nel romanzo cavalleresco
spagnolo del Cinquecento. Pisa ETS, 2007
Neri, Stefano. Antologia de las arquitecturas maravillosas en los libros de caballerias Alcala de Henares Centro de estudios Cervantinos, 2007
Pavel, Thomas, Representar la existencia: el pensamiento de la novela. Barcelona
Critica, 2005.
Pena Sueiro, Nieves y Ángeles Saavedra Places, «ARACNE. Red de Humanidades Digitales y Letras Hispánicas», Historias Fingidas, 7 (2019), pp.
407-412, <http://dx.doi.org/10.13136/2284-2667/149>.
Pierazzo, Elena y Roberto Rosselli del Turco, “5. Critica testuale e nuovi
metodi: l’edizione scientifica digitale”, en Fabio Ciotti (ed.), Digital Humanities. Metodi, strumenti, saperi, Roma, Carocci, 2023, pp. 114-136.
Pierazzo, Elena, Digital scholarly editing: Theories, models and methods, Aldershot, Ashgate, 2015.
—, “What future for digital scholarly editions? From Haute Couture to
Prêt-à-Porter”, International Journal of Digital Humanities, vol. 1 (2019),
pp. 209-220.
Porter, Dot, “Medievalists and the Scholarly Digital Edition”, Scholarly
Editing, 34 (2013), <http://www.scholarlyediting.org/2013/essays/essay.
porter.html>.
Robinson, Peter, “Where We Are with Electronic Scholarly Editions, and Where
Editar el Siglo de Oro en la era digital
46
Anna Bognolo - Stefano Bazzaco
We Want to Be”, Jahrbuch für Computerphilologie, 5 (2003), 125-146,
<http://computerphilologie.uni-muenchen.de/jg03/robinson.html>.
—, “Current Issues in Making Digital Editions of Medieval Texts —Or, Do
Electronic Scholarly Editions Have a Future?”, Digital Medievalist, 1.1
(2005), <http://www.digitalmedievalist.org/journal/1.1/robinson>.
Rojas Castro, Antonio, “La edición crítica digital y la codificación TEI. Preliminares para una nueva edición de las Soledades de Luis de Góngora”, Revista de Humanidades Digitales n.1 (2016), pp. 4-19.
Roncaglia, Gino, La quarta rivoluzione. Sei lezioni sul futuro del libro, Roma,
Laterza, 2009.
Rosselli del Turco, Roberto, “The Battle We Forgot to Fight: Should We
Make a Case for Digital Editions?”, en Matthew Driscoll y Elena Pierazzo
(eds.), Digital Scholarly Editing. Theory, Practice and Future Perspectives,
Cambridge, Open Book Publishers, 2016, pp. 219-261.
Sahle, Patrick, «What is a scholarly digital edition (SDE)?», en Matthew
Driscoll y Elena Pierazzo (eds.), Digital Scholarly Editing. Theory, Practice and Future Perspectives, Cambridge, Open Book Publishers, 2016,
pp. 19-39.
Santos Muñoz, Ricardo, Eva María Molleja López y Marta Vizcaíno Ruiz,
“Integración de una base de datos de procedencias en el entorno MARC y
de datos enlazados: el caso de la Biblioteca Nacional de España”, RUIDERAe: Revista de Unidades de Información, n. 20 (2022), III, pp. 1-11.
Shillingsburg, Peter, “How Literary Works Exist: Convenient Scholarly Editions”, Digital Humanities Quarterly, vol. III, n. 3 (2009), <http://digitalhumanities.org/dhq/vol/3/3/000054/000054.html>.
Silva, Feliciano de, Florisel de Niquea: partes I y II, ed. Linda Pellegrino, Alcalá
de Henares, Universidad de Alcalá, servicio de publicaciones, 2015.
Spadini, Elena, Francesca Tomasi y Georg Vogeler (eds.), Graph Data-Models
and Semantic Web Technologies in Scholarly Digital Editing, Norderstedt,
BoD, 2021, <https://kups.ub.uni-koeln.de/55227/1/Vogeler.pdf>.
Spence, Paul, “Edición académica en la era digital: modelos, difusión y proceso
de investigación”, Anuario Lope de Vega. Texto, literatura, cultura, 20 (2014),
pp. 47-83.
Stinne Greve Rasmussen, Krista, “Reading or using a digital edition? Reader
roles in scholarly editions”, en Matthew Driscoll y Elena Pierazzo (eds.),
Digital Scholarly Editing. Theory, Practice and Future Perspectives, Cambridge, Open Book Publishers, 2016, pp. 119-135.
Trovato, Paolo, Con ogni diligenza corretto: la stampa e le revisioni editoriali dei
testi letterari italiani, 1470-1570, Bologna, Il Mulino, 1991.
Van Mierlo, Wim, “The Scholarly Edition as Digital Experience: Reading, Editing, Curating”, Textual Cultures, vol. 15, n. 1, Special Issue: «Provocations
Toward Creative-Critical Editing» (Spring 2022), pp. 117-125, < https://
www.jstor.org/stable/48687518>.
Editar el Siglo de Oro en la era digital
Editar libros de caballerías en la era digital: la Biblioteca Digital del Proyecto Mambrino
47
Watt, Ian, Le origini del romanzo borghese: studi su Defoe, Richardson e Fielding,
Milano, Bompiani, 2017.
Zoppi, Federica, «Reflexiones sobre la creación de una base de datos de motivos
caballerescos: un desafío científico y digital», Historias Fingidas, Número
Especial 1: «Humanidades Digitales y estudios literarios hispánicos» (2022),
pp. 245-269, <https://doi.org/10.13136/2284-2667/1103>.
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés
en los proyectos ARTELOPE y EMOTHE
Jesús Tronch Pérez
Universitat de València
[email protected]
Resumen
En este trabajo se describe el tratamiento de textos electrónicos en tanto que
datos en dos proyectos de bibliotecas digitales de obras del teatro clásico español
e inglés que utilizan TEI en el marcado semántico de los textos: los proyectos
ARTELOPE (Lope de Vega), y EMOTHE (teatro europeo 1500-1700). En
esta descripción se abordan sus procesos de captura, flujo de trabajo, estructuración y publicación. Finalmente, se explica cómo editar en TEI en estos proyectos conlleva, además de la codificación semántica, juicios interpretativos y decisiones editoriales similares a los que realiza un editor que fija el texto de la obra.
Palabras clave
Edición de marcado; codificación; Text Encoding Initiative, TEI; ARTELOPE;
Lope de Vega; EMOTHE; teatro europeo 1500-1700.
Abstract
Editing Classical Spanish Theater in TEI in ARTELOPE and EMOTHE.
This work describes the treatment of electronic texts as data in two projects of
digital libraries focusing on classical Spanish and English theater works that use TEI
for semantic markup of the texts: the ARTELOPE projects (Lope de Vega) and
EMOTHE (European theater 1500-1700). This description covers their capture processes, workflow, structuring, and publication. Finally, it explains how editing in TEI
in these projects involves, in addition to semantic encoding, interpretative judgments,
and editorial decisions similar to those made by an editor who establishes the text.
Keywords
Markup editing; encoding; Text Encoding Initiative, TEI; ARTELOPE; Lope
de Vega; EMOTHE; early modern European theatre.
Editar el Siglo de Oro en la era digital
50
Jesús Tronch Pérez
En su reciente libro Theater as Data, Miguel Escobar (2021: 75-93) analiza varias facetas en las que el estudio del teatro se enriquece con la ciencia de los datos
(en el sentido de información almacenada y procesada electrónicamente), y en
la clasificación de estas facetas, destina un capítulo a las “palabras como datos”
junto a las de “relaciones”, “movimiento” y “lugar”.1 En estas páginas describiré un tratamiento de las palabras en tanto que datos en el teatro clásico español
e inglés, en concreto cuando estas palabras se “editan en TEI” en dos proyectos
que se ocupan de la difusión de obras teatrales de la época a través de textos
electrónicos, y en los que participo en varios órdenes y niveles como editor, codificador, revisor y coordinador.
Aún a riesgo de ser innecesario, recordemos que “TEI” es el acrónimo del
consorcio Text Encoding Initiative, que elabora y actualiza unas Guidelines o
directrices para la codificación semántica, en lenguaje de marcado XML, de
textos humanísticos electrónicos (TEI Consortium 2023). Todo texto electrónico, en tanto que conjunto de datos que procesará un ordenador, necesita un
modelo de datos que describa cómo se organiza y se representa la información
textual que transmite. Las directrices TEI son un modelo de datos (Escobar
2021: 78) que establecen un esquema de reglas de codificación que identifica y
describe semánticamente elementos textuales, sus categorías y sus interrelaciones, y un vocabulario controlado para los códigos o marcas insertados en el
texto digital que delimitan esos elementos.
Los dos proyectos en cuestión son ARTELOPE, sobre las comedias de Lope
de Vega, y EMOTHE, sobre el teatro europeo de los siglos xvi y xvii (en concreto las tradiciones italiana, francesa, inglesa, española y portuguesa).2 Además
de ofrecer bases de datos en acceso abierto con información sobre las obras teatrales, ambos proyectos producen ediciones digitales de las obras en sendas bibliotecas en línea y datos estadísticos sobre intervenciones de los personajes, estructura de la obra, y en su caso, estructuras métricas.
Una cuestión terminológica previa
En las páginas que siguen, para referirme a los textos electrónicos codificados
producidos por los proyectos, utilizo el término “edición digital”, dado que,
siguiendo la definición de Sahle (2016: 26-28), no son una mera digitalización del texto de una edición previa (generalmente impresa) sino que ofrecen
1. Esta publicación es parte del proyecto I+D+i «Teatro español y europeo de los siglos xvi y xvii:
patrimonio y bases de datos», referencia PID2019-104045GB-C54 (acrónimo EMOTHE), financiado por MICIN/AEI/10.13039/501100011033.
2. ARTELOPE, dir. Joan Oleza, Universitat de València, https://artelope.uv.es/; EMOTHE,
dir. Jesús Tronch y Joan Oleza, Universitat de València, https://emothe.uv.es/.
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
51
funcionalidades propias del medio digital derivadas principalmente del marcado semántico del texto. Y utilizo el término “editor digital” para referirme a
la persona o personas responsables de esa edición digital (edición y codificación del texto electrónico para ARTELOPE y para EMOTHE), sin presuponer que este editor es la misma persona que fija el texto de la obra (en papel o
en soporte electrónico). Como señalo más adelante, la mayoría de las ediciones digitales en estos proyectos son una representación digital de ediciones
previas, y en estos casos pueden denominarse “metaediciones”, siguiendo a
Portela (2022: 101).
Empleo deliberadamente los términos derivados de “editar”, teniendo en
cuenta las acepciones “publicar”, “adaptar un texto” y “modificar un documento o archivo”, como recoge el Diccionario de la Real Academia, a las que añado
“representar”. Las propias directrices TEI se definen como recomendaciones de
maneras adecuadas de representar [énfasis mío] aquellas características de recursos textuales que necesitan que se identifiquen explícitamente para facilitar su
procesamiento por programas informáticos (“About”). Como explica Burnard
(2014: par. 3), el lenguaje de marcado XML para textos electrónicos proporciona una manera simple de representar [énfasis mío] datos estructurados como una
secuencia lineal de datos de caracteres y de etiquetar partes concretas de esa secuencia con etiquetas con nombre, para indicar una semántica o una función
estructural de las mismas.
Esta “representación” en TEI suele denominarse marcado o codificación
(markup o encoding en inglés), y encoder o codificador a quien se encarga de ella.
Pero prefiero aprovechar la polisemia del término “editar”, porque en ARTELOPE y en EMOTHE el tratamiento del texto para representarlo en un archivo
XML-TEI puede conllevar intervenciones en el texto digital que se suman a la
codificación en tanto que simple anotación o descripción semántica de elementos y características textuales que interesan a los proyectos, y, como explicaré en
el apartado “Editar en TEI”, a menudo conlleva juicios interpretativos y decisiones editoriales similares a los que realiza quien establece el texto.
Para justificar esta elección léxica de “edición”, “editor”, “editar”, traigo a
colación ejemplos provenientes de proyectos editoriales análogos. En la serie
de ediciones electrónicas shakespearianas Folger Digital Texts, ahora renombrada como The Folger Shakespeare,3 los encargados de la transformación del
texto impreso a distintos formatos electrónicos, Michael Poston y Rebecca
Niles, definen su responsabilidad como “Edited for XML and encoded by”,
para distinguirla de la de los editores críticos del texto que se publicó primeramente en papel, Paul Werstine y Barbara Mowat. Esta frase (que reúne “editar” y “codificar”) es la que consta en los metadatos de los archivos XML de
3. The Folger Shakespeare, Folger Shakespeare Library, <https://www.folger.edu/explore/shakespeares-works/>;
Editar el Siglo de Oro en la era digital
52
Jesús Tronch Pérez
cada obra.4 Además, en la actual página web de The Folger Shakespeare que
informa sobre los diferentes formatos en los que los usuarios se pueden descargar los textos (“Usage”), se describe a Michael Poston como “Digital Editor”
(junto al de “Encoding Architect”), mientras que en la versión anterior se
describía como “Digital Texts Editor and Encoding architect” y a Rebecca
Niles como “Digital Texts Editor and Interface architect” (“About”). Es interesante observar que al final de su ensayo sobre Folger Digital Texts, Niles y
Poston (2016: 141) emplean el término compuesto “editor-encoders” después
de haber recurrido en varias ocasiones a la pareja “editors and encoders” y
“encoders and editors” (2016: 118-119). Otro uso de “editor” es el que observamos en la frase “markup editor” en el proyecto Digital Victorian Periodical
Poetry,5 en cuya documentación se define “markup editor”, como el que realiza la codificación del texto o los metadatos en un determinado formato o
lenguaje de marcado SGML, HTML, o XML (Chapman 2023). Por último,
cuando el estándar usado en la codificación es el propuesto por el consorcio
Text Encoding Initiative, no es infrecuente encontrar el término “TEI edition”, “edition in TEI”, o similares.6
Descripción de los proyectos ARTELOPE y EMOTHE
El Proyecto ARTELOPE ofrece en acceso abierto una base de datos que permite explorar diversos aspectos de 433 comedias de, o relacionadas con, Lope de
Vega (no solo las de autoría fiable sino también las probables y dudosas, y algunas atribuidas que son de especial interés aunque no le pertenezcan), y está
creando una biblioteca en línea de ediciones digitales de estas obras. La Biblioteca Digital que acompaña la base de datos, que inició su andadura una vez esta
última estuvo plenamente operativa (Oleza 2014: 219-220), tiene como objetivo que los usuarios puedan acceder fácilmente, sin salir de la interfaz, a un texto
electrónico con grafía y puntuación modernizada, a estadísticas sobre aspectos
estructurales de la obra (versos y fragmentos en prosa en los distintos actos o
jornadas, número de acotaciones y de apartes), sobre porcentajes de interven4. En concreto en la declaración de responsabilidad (etiquetada con <respStmt>) en la sección
destinada a la descripción del archivo (<fileDesc>), dentro del encabezamiento o <teiHeader> del
propio archivo electrónico.
5. Digital Victorian Periodical Poetry Project, dir. Alison Chapman, Edition 0.98.8beta, University of Victoria, 30/06/2023, https://dvpp.uvic.ca/index.html.
6. Véase Helsinki Corpus TEI XML Edition (2011), Fukushima y Bourrier (2019-2020), Fukushima, Bourrier y Parker (2022: abstract, par. 3 y 10), Beshero-Bondar (2018), y los proyectos Digital Dinah Craik (University of Calgary, https://www.digitaldinahcraikproject.org/), Mabbott Poe
(University of Iowa, https://mabbottpoe.org/), The Peter Still Digital Edition (Rutgers University,
https://stillpapers.org/about), y XML Helsinki Corpus Browser (University of Helsinki, https//
helsinkicorpus.arts.gla.ac.uk).
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
53
ción de los personajes, y sobre la versificación; y además que puedan realizar
búsquedas de palabras y frases en todo el corpus que reúne la base de datos.
Hasta la fecha, la Biblioteca Digital ARTELOPE ofrece en acceso abierto ediciones digitales de 334 títulos.
El Proyecto EMOTHE, y en concreto su Biblioteca Digital, publica en acceso abierto ediciones modernizadas de una selección de obras teatrales de las
tradiciones italiana, francesa, española, portuguesa e inglesa de los siglos xvi y
xvii, así como traducciones y adaptaciones (históricas o contemporáneas) y los
datos estadísticos de todos los textos. Como indica Oleza (2013: 152), este proyecto representa una expansión en dirección europea de la experiencia del grupo
de investigación ARTELOPE, en cuyo seno surgió EMOTHE. En esta Biblioteca Digital y en su base de datos, el teatro español está principalmente representado por las obras de la colección CANON 60 que elaboró el grupo TC/12
(Oleza 2015), pero también por otras obras de interés desde una perspectiva
europea (por ejemplo, Don Lope de Cardona, que tiene adaptaciones interlingüísticas en Don Lope de Cardone de Jean Rotrou y en The Young Admiral de
James Shirley), o porque han sido fruto de un trabajo Final de Máster o de tesis
doctorales (por ejemplo, La estrella de Sevilla, editada por Nàdia Revenga). Hasta la fecha, la Biblioteca ofrece unas 350 ediciones entre originales de las cinco
tradiciones (180) y traducciones y adaptaciones (160). En el caso del teatro español, unas 68 originales y 42 traducciones.
Las bibliotecas digitales de ARTELOPE y de EMOTHE son “proyectos de
biblioteca y archivo”, una de las siete categorías de proyectos de humanidades
digitales que distingue Leonhardt (2014: 6-7), al igual que pueden clasificarse
proyectos como LEMDO (acrónimo de Linked Early Modern Drama Online,
que reúne proyectos y antologías de teatro anglófono de la época y que se desarrolla en la University of Victoria, en Canadá),7 Folger Shakespeare (antes Folger
Digital Texts, con ediciones críticas modernizadas de la obra de Shakespeare) o
EarlyPrint (anteriormente Shakespeare His Contemporaries y ahora abarcando
textos no teatrales).8 ARTELOPE y EMOTHE llevan a cabo una codificación
de los textos dramáticos en lenguaje de marcado XML según las directrices TEI,
que es una práctica bastante generalizada en los proyectos centrados en textos
humanísticos.
Los dos son proyectos colaborativos (como LEMDO), en los que intervienen muchos y distintos “editores digitales” de los textos a través de plataformas
en las que se puede trabajar remotamente mediante programas que centralizan
la información en servidores de las respectivas universidades. Son proyectos concebidos para tratar gran número de textos de obras de teatro de los siglos xvi y
7. LEMDO, dir. Janelle Jenstad, University of Victoria, https://lemdo.uvic.ca/.
8. EarlyPrint, Northwestern University and Washington University in St. Louis, https://earlyprint.org/.
Editar el Siglo de Oro en la era digital
54
Jesús Tronch Pérez
xvii y los metadatos sobre las obras. Y finalmente, son proyectos cuyos textos
electrónicos están en acceso abierto.
Seguiré la descripción en torno a los tres aspectos del proceso ecdótico que
distingue Allés-Torrent (2020: 75-78): captura, estructuración y publicación, a
los que añadiré un subapartado sobre el flujo de trabajo y software.
Captura y procedencia de los textos
Las bibliotecas digitales de ARTELOPE y EMOTHE están concebidas como
una plataforma para facilitar el conocimiento de las obras teatrales a través de
textos electrónicos y su codificación semántica en XML-TEI, al servicio de otros
usuarios e investigadores. Para este fin, la gran mayoría de las ediciones digitales
capturan el texto establecido en una edición fuente externa, mientras que un
porcentaje menor son ediciones en las que el texto está establecido por investigadores o colaboradores propios de los proyectos. Incluso en bastantes de estos
casos, los editores del texto (los que fijan el texto, críticamente o no), no son los
“editores digitales”. Generalmente esa captura de textos externos a los proyectos
se realiza mediante una transcripción a soporte informático encargada, o, en el
caso de ARTELOPE, se realiza en el proceso de modernización de la grafía llevado a cabo por el propio editor digital responsable de la obra en cuestión.
La procedencia de los textos es diversa. En ARTELOPE, algo más de un 60%
proviene de los textos editados por la Real Academia Española, por estudiosos
como Emilio Cotarelo, Marcelino Menéndez Pelayo, y en menor medida Eduardo
Juliá, textos que en bastantes casos son la única edición moderna disponible y que
cuentan con la ventaja de estar en dominio público. Un 20% son ediciones relativamente recientes de estudiosos, críticas o no, firmadas por hispanistas como, por
ejemplo, Alonso Zamora Vicente (La dama boba), Maria Grazia Profetti (El caballero de Olmedo), Hélène Tropé (Los locos de Valencia), Alejandro García Reidy (El
castigo sin venganza), Guillermo Serés (El villano en su rincón), o Abraham Mañoral
(El ausente en su lugar). En este grupo destacan por el número de ediciones empleado (un 10% del total) Jesús Gómez y Paloma Cuenca, con sus ediciones para la
Fundación Castro. En los casos de ediciones con aparato crítico de variantes y enmiendas, este no se reproduce en la Biblioteca Digital. El 20% restante corresponde a textos establecidos por investigadores propios de los proyectos, ediciones que,
como las de la Colección CANON 60 o las de la Fundación Castro, modernizan
la grafía y la puntuación y, en una gran mayoría, no ofrecen aparato crítico o explicación de la transmisión histórica del texto y de los procedimientos editoriales.
La elección de la procedencia de la gran mayoría de las ediciones en la Biblioteca Digital ARTELOPE ha recibido juicios desfavorables por no ser ediciones críticas sino actualizaciones de ediciones anticuadas de Menéndez Pelayo, Cotarelo y Mori, etc. Respondiendo a estos juicios, el director de
ARTELOPE, Joan Oleza, ha señalado que efectivamente la gran mayoría no
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
55
son ediciones críticas “porque nunca han querido serlo”, puesto que para ARTELOPE “lo fundamental [es] producir en el menor tiempo el mayor número
posible de ediciones digitales, realizadas sobre fuentes solventes para facilitar
los usos digitales de los textos”, como el análisis estilométrico del grupo ETSO
de la Universidad de Valladolid, o el reconocimiento digital automático de
textos manuscritos llevado a cabo por el centro Pattern Recognition and Human Language Technology de la Universidad Politécnica de Valencia;9 y para
ofrecer los análisis de las estadísticas de cada obra como datos procesables: “a
estos propósitos sirven de la misma manera ediciones críticas y ediciones no
críticas”.10 Este imperativo temporal hace inviable la elaboración, como pauta
general, de ediciones críticas propias que requiere la dedicación completa de un
investigador durante, al menos, un año, y que a efectos de esta investigación
digital es un trabajo improductivo.
En EMOTHE, los textos provenientes de una edición fuente externa constituyen un 75%, tanto en títulos originales en los respectivos idiomas de cada
tradición como en traducciones. Los de títulos originales son: (1) ediciones críticas ya publicadas de las que se obtiene permiso, en papel (como la de Don Lope
de Cardona, de Eugenia Fosalba), o telemática (como las procedentes de Digital
Renaissance Editions, o Richard Brome Online); (2) ediciones firmadas por estudiosos sin que cuenten con aparato crítico consistente en introducción y notas
de enmiendas y variantes (como A Chaste Maid in Cheapside del dramaturgo
Thomas Middleton, en edición de Bryan Loughrey y Neil Taylor, impresa en
papel, o como las telemáticas de Théâtre Classique); y (3) recodificación de ediciones digitales externas, como las de las colecciones CANON 60, Folger Shakespeare, o Internet Shakespeare Editions.11
De las traducciones y adaptaciones de procedencia externa (un 72% del
total de traducciones y adaptaciones), no solo se incluyen traducciones ya publicadas, con la autorización correspondiente de las que no están en dominio público, sino también traducciones inéditas, de las que se ha tenido noticia y se
han rescatado del “cajón del olvido”, con el permiso de sus autores.
9. ETSO: Estilometría aplicada al Teatro del Siglo de Oro, dir. Álvaro Cuéllar y Germán Vega
García-Luengos, Universidad de Valladolid, <http://etso.es/>; Pattern Recognition and Human
Language Technology Research Center, Universitat Politècnica de València, https://www.prhlt.
upv.es/handwritten-text-recognition/.
10. Comunicación privada de Joan Oleza incluida en informe remitido al Ministerio de Ciencia
e Innovación sobre el proyecto de investigación EMOTHE, referencia PID2019-104045GBC54.
11. Hay casos en los que el responsable de la fuente externa es a su vez el responsable de la edición
digital en EMOTHE, como ocurre con José Camões y los proyectos que dirige en el Centro de
Estudos de Teatro, Teatro de Autores Portugueses do Séc. XVI, <http://www.cet-e-quinhentos.
com/>; y Teatro de Autores Protugueses do Séc. XVII, <http://www.cet-e-seiscentos.com/> o con
Alejandro García Reidy, responsable de la codificación para EMOTHE de su edición crítica de El
castigo sin venganza publicada en papel por Milenio en 2009.
Editar el Siglo de Oro en la era digital
56
Jesús Tronch Pérez
Estructuración: modelo de datos y personalización TEI
En tanto que modelo de datos, las directrices TEI prevén muchas etiquetas, con
sus atributos y posibles valores, para codificar la semántica de determinados
elementos del texto, de manera que puedan satisfacer un amplio espectro de
ediciones, por lo que cada edición o cada proyecto necesita centrarse en una
selección de los elementos a codificar, es decir, necesita hacer una customization
o personalización. Los proyectos ARTELOPE y EMOTHE, en tanto que dedicados a textos teatrales que usan el verso, confeccionan su propio subconjunto
de etiquetas TEI a partir de los módulos “6. Verse” y “7. Performance Texts”,
además de los módulos comunes a todo documento TEI; y en el caso de ediciones críticas en EMOTHE, a partir del módulo “12 Critical Apparatus”.
Los elementos del texto a codificar son los personajes del drama (elenco), las
divisiones de la obra principalmente en actos y escenas, y también en paratextos
de diversos tipos, las acotaciones, los parlamentos, las didascalias de interlocutor, versos (incluyendo partes iniciales, medias y finales de versos compartidos),
párrafos y líneas de prosa, las palabras o segmentos del diálogo que se dicen en
“aparte”, los segmentos textuales que reciben énfasis lingüístico o retórico (y que
se visualizan como cursiva), las estructuras métricas o estrofas (en EMOTHE
solo en las obras españolas y portuguesas), notas al texto (tanto las que están
presentes en el texto utilizado para la edición digital, o las aportadas por el editor
digital del proyecto); y aparato crítico (solo en EMOTHE y en aquellas ediciones críticas realizadas por investigadores del proyecto o que han constituido un
trabajo Final de Máster o una tesis doctoral).
La lista de los personajes se codifica como un paratexto (y, por tanto, dentro
de la sección frontal del cuerpo del texto marcada con el elemento <front>), con
el elemento <castItem> en una lista de personajes <castList>, con los consiguientes elementos <role> para el nombre del personaje (por ejemplo “Feliciano”) y <roleDesc> para la descripción de este papel (por ejemplo, “caballero”).
Otros proyectos, como LEMDO, codifican las dramatis personae en la descripción del perfil no bibliográfico del texto (elemento <profileDesc>) dentro de la
cabecera con los metadatos del archivo (el <teiHeader>), y en concreto con la
etiqueta <listPerson>, dentro de la descripción de los participantes <particDesc>. Las discrepancias que puede haber entre el nombre del personaje que
aparece en la lista de dramatis personae y el nombre como didascalia de interlocutor en cada parlamento se salvan al asociar cada uno de estos a un identificador XML único que el responsable de la edición digital asigna a cada personaje.
La codificación en TEI mediante un identificador único de los interlocutores permite que un personaje que varía su nombre en la didascalia de interlocutor a lo largo de la obra tenga todos los parlamentos asociados al mismo personaje y permite distinguir a qué personajes distintos corresponde en cada
momento una misma expresión del interlocutor (por ejemplo, en Las mocedades
del Cid: comedia segunda, la didascalia “DON DIEGO” puede referirse a Don
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
57
Diego Ordóñez de Lara o a uno de los cinco hijos de Arias Gonzalo). Asimismo,
se puede identificar los personajes en didascalias de interlocutores generales tipo
“Todos”, “All”, “Ambos” “Both, o “Voces”, “Dentro”, “Voices within”.
Se codifican los versos de un parlamento dentro del elemento <lg> (grupo de
versos) en todos los casos, incluido cuando no está previsto identificar estas agrupaciones con determinadas estrofas (por ejemplo, blank verse en teatro inglés).
Un elemento que ARTLOPE y EMOTHE codifican de manera singular (al
menos desconozco otros proyectos que lo hagan), es la sección o segmento de un
parlamento que se dice en “aparte”. Este singular aspecto se codifica como <seg
type=“aside”>: con la etiqueta del elemento <seg>, dando el valor “aside” al
atributo @type. Las directrices TEI no contemplan una etiqueta específica para
“aside”, ni tampoco recogen “aside” como valor que defina un tipo de acotación
junto a las categorías “delivery”, “business”, “entrance”, etc.12
La base de datos en FileMaker de ARTELOPE no está programada para la
codificación del aparato crítico según las directrices TEI, mientras que la de
EMOTHE, desarrollada con posterioridad, sí que facilita esta opción. El método TEI para enlazar texto y aparato crítico es el de parallel segmentation (en
contraste con, por ejemplo, LEMDO, que utiliza el método double end-point
attachment con un archivo externo que contiene el aparato crítico).
Las notas, marcadas con el elemento <note> dentro del propio archivo (no
en un archivo externo), se pueden asociar a cualquier componente del texto
(personajes del elenco, interlocutores, acotaciones, segmentos en el diálogo), y
clasificar según el valor seleccionado para el atributo @type. Los tipos de nota
son: nota del autor, del traductor, del editor crítico o una nota propia como
editor digital.
ARTELOPE y EMOTHE no codifican elementos estructurales inferiores a
la línea de verso o de prosa, o a la acotación. Tampoco se agrupan segmentos de
diálogo dispersos en varias unidades estructurales (por ejemplo, texto de canciones repartido entre varios parlamentos), ni personajes del elenco que estén relacionados; los encabezamientos del tipo “Canción”, “Carta”, están tratados como
acotación en vez de estar etiquetados con el elemento <head>. Entre los signos
de puntuación, las comillas (dobles o simples) y los corchetes cuadrados no se
codifican según su semántica o función, y lo que se visualiza como cursiva, se
codifica sistemáticamente con <emph>.
Una selección de obras reciben una edición “avanzada” en tanto que se
codifican, con vistas a ulteriores estadísticas, aspectos como antropónimos,
topónimos (aludidos o relacionados con la acción de la obra), referencias mitológicas, oficios, citas literarias, latinismos, referencias a lugares del escenario,
12. Una opción habría sido añadir un nuevo atributo, de manera análoga a como se hizo con el
atributo “asonancia” en el proyecto ReMetCa de métrica medieval castellana (González-Blanco y
Rodríguez 2015, para. 11).
Editar el Siglo de Oro en la era digital
58
Jesús Tronch Pérez
elementos escenográficos, atrezo, vestuario, gestos, movimiento, y efectos especiales. El elemento TEI empleado para estos aspectos del texto es el referencing string <rs>, con los correspondientes valores en el atributo @type para
indicar los diferentes aspectos.
Para las referencias al texto por numeración, ARTELOPE numera todos los
versos (no los textos en prosa, como es el caso de cartas) de manera continua sin
reiniciar el cómputo en cada acto o jornada. En EMOTHE, dado que se trata
de una biblioteca que recoge ediciones de distintas tradiciones teatrales, el editor
digital tiene varias opciones: con respecto a la segmentación de la numeración,
por obra, actos/jornadas, y escenas; y con respecto a los elementos numerados,
versos solo, versos y prosa, e intervenciones o parlamentos. Los parlamentos en
prosa se pueden codificar de distinta manera, como un solo párrafo, o permitiendo que cada línea tenga un número (según la numeración del texto fuente o
la decidida por el editor textual).
A partir de los textos editados en TEI, se obtienen datos estadísticos sobre
(1) intervenciones de los personajes (cuántas intervenciones están asignadas a
cada personaje que habla en la obra, y en su caso cuántos párrafos, versos o
versos compartidos), (2) estructura de la obra (número de secciones en que se
divide la obra, distribución del número de versos o elementos de división del
diálogo en cada sección, número de acotaciones, número de apartes), y (3) en
su caso, estructura métrica (desglose de formas estróficas, con el cómputo de
versos y de estrofas para cada forma; y listado secuencial de las estrofas, indicando el rango de versos).
En resumen, ARTELOPE y EMOTHE aplican a la gran mayoría de las
ediciones digitales un marcado que podemos calificar como básico pero suficiente para los propósitos de ambos proyectos de conseguir codificar un gran número
de textos diversos, a cargo de diferentes editores digitales para los que, en su gran
mayoría no necesitan conocer las directrices TEI, y a través de una plataforma
que no requiere el uso de una herramienta de edición de XML (como oXygen).
La codificación semántica de componentes del texto no es tan densa como la
realizada en LEMDO, que marcan signos ortográficos e introduce elementos de
anclaje para enlazar con otras partes del texto o con otros archivos (Jenstad 2023:
242-243). Pero el marcado en ARTELOPE, EMOTHE y LEMDO no es tan
complejo como el que realiza Folger Digital Texts, ahora Folger Shakespeare, en el
que las unidades mínimas de codificación son la palabra, el signo de puntuación
y el espacio en blanco; o el de EarlyPrint, (anteriormente Shakespeare His Contemporaries), cuyo marcado denso contempla la identificación de la categoría gramatical de cada palabra.13 La personalización TEI en ARTELOPE y EMOTHE
13. The Folger Shakespeare, Folger Shakespeare Library, https://www.folger.edu/explore/shakespeares-works/; EarlyPrint, Northwestern University and Washington University in St. Louis,
https://earlyprint.org/.
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
59
es más parecida a la de Early English Books – Text Creation Partnership,14 o la de
la colección CANON 60 realizada por la Biblioteca Virtual Cervantes, si bien a
diferencia de estas la codificación de ARTELOPE y EMOTHE enriquece los
textos con la asignación de cada parlamento al interlocutor correspondiente, asociación necesaria para generar los datos estadísticos.
Flujo de trabajo y software
El flujo de trabajo y el software empleado en ARTELOPE y EMOTHE es
muy similar, ya que este último surgió en el seno del primero, como he indicado anteriormente. En ambos proyectos el responsable de la edición digital
emplea en primer lugar un editor de texto plano o un procesador de textos, y
completa la codificación en el programa de gestión de la base de datos, el software propietario FileMaker.15 Una vez acabada la codificación, FileMaker genera un archivo XML-TEI, que es de nuevo validado con el programa oXygen,
editor XML propietario. Para asegurar la actualización continua, los responsables de la edición digital tienen conectado el programa FileMaker constantemente con el servidor alojado en la Universitat de València (Muñoz Pons
2013: 487).
La primera fase del tratamiento del texto electrónico consiste en un marcado previo, realizado en un editor de texto plano o en un procesador de textos,
con etiquetas propias, insertadas solo al principio del elemento estructural o
característica del texto, sin necesidad de introducir una etiqueta de cierre, ya que
FileMaker está programado para detectar en una misma línea la marca de párrafo o una marca preliminar distinta como punto de inserción de la etiqueta de
cierre. Sí que se debe marcar el inicio y final del segmento de diálogo que se dice
en “aparte” y las palabras o frases enfatizadas mediante cursiva. Este sistema de
trabajo se concibió para que los numerosos y distintos responsables de la edición
digital no necesitaran conocer o recibir entrenamiento en el estándar TEI ni
adquirir un editor de XML como oXygen.
Una vez el texto está “premarcado”, se inserta en la base de datos FileMaker,
los actos y jornadas y distintos paratextos por separado. El programa distribuye
los elementos “premarcados” en distintos campos o tablas de la base de datos. Se
sigue con la codificación a través de una ventana de edición del FileMaker, en la
que se van insertando etiquetas mediante botones, ventanas de diálogo y menús
14. Early English Books Online – Text Creation Partnership, The University of Michigan Library,
https://quod.lib.umich.edu/e/eebogroup/.
15. Cabe señalar que la base de datos ARTELOPE empezó a desarrollarse en 1998, cuando programas similares de código abierto no disponían de las mismas funcionalidades. En el desarrollo técnico
de la base de datos intervino Arturo Silvestre Mora, de quien tomó el relevo Carlos Muñoz Pons.
Editar el Siglo de Oro en la era digital
60
Jesús Tronch Pérez
desplegables en una interfaz sencilla. En este proceso, se asignan identificadores
a cada parlamento y se pueden añadir notas y distinguir los tipos de acotaciones.
Una vez finalizada la codificación por parte del editor digital, este acciona el
proceso por el que FileMaker revisa la estructura y jerarquía de la codificación
de cada acto o jornada; y en el caso de aparecer errores identificados por FileMaker, los corrige y vuelve a accionar la revisión de la estructura. Una última
operación asigna automáticamente la numeración de líneas (en verso y/o prosa)
o de parlamentos así como distintos identificadores XML a lo largo del archivo.
En ARTELOPE este archivo XML-TEI contiene identificadores xml:id para
cada verso, mientras que en EMOTHE también tienen identificadores las divisiones en actos y escenas, los parlamentos, acotaciones y párrafos en prosa.
A partir de entonces, el proceso pasa a manos de los técnicos informáticos o
del responsable del proyecto para extraer el archivo XML-TEI de la base de datos
y validarlo con el esquema TEI-All. Este archivo XML-TEI (que constituye una
“edición TEI”) es el fichero matriz, a partir del cual se generan archivos posteriores: archivo HTML-PHP, mediante la transformación con el lenguaje de hojas
de estilo extensible XSL, para la visualización del texto de la obra en una edición
hipertextual disponible en la web; y, próximamente, archivo en formato EPUB;
y un archivo XML con los datos estadísticos (tras un análisis realizado con una
aplicación desarrollada ad hoc), que posteriormente se transforma con XSL en un
archivo HTML asociado accesible desde la edición hipertextual.
Publicación
En el apartado de publicación, distinguimos entre la Biblioteca Digital en la
web y los repositorios donde se depositan en acceso abierto los archivos XMLTEI de las obras teatrales. Estos últimos, así como los archivos de los datos estadísticos, están disponibles en la plataforma GitLab;16 mientras que en EMOTHE,
se pueden descargar individualmente desde el índice de la Biblioteca Digital.17
Como se ha apuntado anteriormente, para su visualización en la web, los
dos proyectos transforman los archivos matriz XML-TEI en archivos HTML
con extensión .php porque se recurre a funcionalidades dinámicas del lenguaje
de programación PHP para que, a partir de archivos HTML-PHP que combinan código de ambos lenguajes, sea el servidor el que remita archivos en HTML
al navegador para visualizar su contenido.
16. La de ARTELOPE en https://gitlab.com/artelope1/ARTELOPE, la de EMOTHE en
https://gitlab.com/emothe/emothe-research-project.
17. Y sin tener por el momento la totalidad de los archivos disponibles, desde los respositorios
abiertos ZENODO (el servicio operado por el CERN), https://zenodo.org/communities/emothe,
y RODERIC (el repositorio institucional de la Universitat de València), https://roderic.uv.es/.
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
61
En estos momentos estamos considerando la posibilidad de adoptar las recomendaciones del Endings Project,18 que ofrece estándares recientes para preservar
los datos (Jenstad 2023: 241): estándares viables a largo plazo como HTML5,
JavScript, CSS, en un sitio de internet estático que no dependa de software situado
en un servidor (sin bases de datos, sin PHP, sin Python, ni funcionalidades de
búsqueda), para que las ediciones se puedan depositar en bibliotecas, servidores y
ordenadores personales, y puedan utilizarse incluso sin conexión a internet.19
Las notas de comentario o glosas, así como las de variantes, se muestran por
medio de ventanas emergentes que el usuario tiene que llamar y cerrar, como es
habitual en ediciones web. Además, las ediciones HTML-PHP contienen funcionalidades que permiten al usuario optar (mediante selectores en el panel de
navegación) por visualizar de manera destacada las acotaciones, los versos compartidos, los apartes y la métrica (como se muestra en la siguiente imagen).
Fig. 1: Captura de pantalla de la edición de El castigo sin venganza en la Biblioteca
Digital EMOTHE con la opción de “mostrar métrica” seleccionada.
18. The Endings Project, University of Victoria, <https://endings.uvic.ca/index.html>.
19. Se han adherido a estas directrices proyectos como LEMDO o Digital Victorian Periodical
Poetry Project, que ofrecen ediciones estáticas que viajan con sus propios metadatos, pero que, en
el caso de LEMDO, pueden integrarse en nuevas antologías (Jenstad 2023: 249)
Editar el Siglo de Oro en la era digital
62
Jesús Tronch Pérez
En EMOTHE, los textos de las obras originales y las de sus traducciones se
ofrecen también en edición de textos paralelos, aun cuando en la mayoría de los
casos las traducciones no se realizaron exactamente a partir de la edición del
original usada en EMOTHE.
Editar en TEI
Según las características del texto fuente a representar digitalmente, editar en
TEI para ARTELOPE y EMOTHE puede consistir solo en el cotejo del texto
transcrito y en su codificación semántica, pero también puede conllevar distintos tipos y grados de intervención en el texto, así como juicios de interpretación
y decisiones editoriales similares a los realizados en una edición tradicional.
Como han observado Niles y Poston (2016: 136), la práctica de codificar el
texto de las ediciones shakespearianas de Mowat y Werstine es similar a la de
editar estos textos shakespearianos, ya que ambas dependen del desarrollo de
una comprensión abstracta del texto y de una preparación del mismo, ambas
idean cómo representar mejor características significativas del texto, y ambas
tienen en cuenta las diversas capas del texto: su contenido, su modelo de datos
y su hoja de estilo.
Tanto si se está editando en el sentido de fijar el texto de una obra de manera digitalmente nativa, como preparando una “metaedición” digital de un
texto ya establecido (propio o por otra persona), editar en TEI supone pensar en
el texto más allá del modo analógico en el que lo visualizamos (en papel o en una
pantalla) y considerar sus componentes estructurales y otras características de
interés como datos; supone, como señala Allés-Torrent (2020: 75), ser consciente “de lo que implica trabajar con datos informáticos”, con la “materialidad
digital” de la edición electrónica.
Un ejemplo ilustrativo de lo que implica editar en TEI un texto entendido
como datos los podemos encontrar en los casos de canciones o cartas para los
que el texto fuente impreso no indica explícitamente quién canta o quién lee la
carta. En El ausente en su lugar de Lope de Vega, verso 1278 (en la edición crítica de Abraham Madroñal, que es la que usa ARTELOPE para la Biblioteca
Digital), Carlos lee una carta después de un parlamento de Marquina:
Marquina
Tú verás
que Elisa no puede más,
pues eres, Carlos, discreto.
Lea Carlos
«Si una mujer principal,
Porque a su padre obedece.[...]
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
63
Madroñal ha representado como acotación “Lea Carlos” lo que en su texto
base aparece de manera ambigua, o combinada, como una didascalia de interlocutor prefijada al parlamento que constituye la carta:
Est. Lindo achaque. Mar.. Tu veras
que Elisa no puede mas,
pues eres, Carlos, discreto.
Lea Car. Si vna mujer principal,
porque a su padre obedece
(Lope de Vega, fol. 88)
Como editor “en papel” (modo analógico), Madroñal confía en que el lector (humano) interpretará que la carta la lee Carlos porque así lo indica la acotación que habrá leído, aunque el texto de la carta parece corresponder tipográficamente al parlamento encabezado por “Marquina”. Sin embargo, como
editor en TEI para ARTELOPE de la edición crítica de Madroñal, debo marcar
la carta como parte de un parlamento asignado a Carlos a pesar de que no haya
una didascalia de interlocutor en el texto fuente impreso. De lo contrario el
cómputo de esos versos quedarían asignados a Marquina en las estadísticas. Así,
mi codificación de este pasaje después de la acotación “Lea Carlos”, contiene el
correspondiente elemento <sp> con el valor “#Carlos” en el atributo @who, y el
elemento <speaker> sin englobar ningún texto.
<stage>Lea Carlos</stage>
<sp who=”#Carlos”>
<speaker></speaker>
<lg type=”redondilla”>
<l xml:id=”es-1414” n=”1253”>«Si una mujer principal,</l>
Una codificación mecánica puede fácilmente pasar por alto que la carta la
lee Carlos y dejar el contenido de la misma como parte del parlamento de Marquina, pero no quien edita el marcado de este pasaje pensando como editor de
palabras como datos que tendrán su posterior procesamiento informático.
En el caso de prólogos y epílogos en determinadas obras teatrales, por ejemplo en The Knight of the Burning Pestle de Francis Beaumont, una edición en
papel puede plasmarlos antes y después del cuerpo principal del texto sin necesidad de decidir si forman parte de este o constituyen un paratexto. La disposición tipográfica o el cambio o no de página no indicarán inequívocamente al
lector qué parte estructural de la obra constituyen. Sin embargo, una edición
TEI requiere decidir si se codifica como una división del texto distinta del acto
o formando parte de este.
Hay ediciones en papel que incluyen una acotación de “Aparte” en una
posición ambigua sin señalar claramente qué segmento del diálogo se dice como
“aparte”. Quien edita en TEI para ARTELOPE y EMOTHE delimita ese segEditar el Siglo de Oro en la era digital
64
Jesús Tronch Pérez
mento en el marcado, de manera similar a como un editor crítico lo señala entre
paréntesis (si esa es la convención empleada).
Una de las convenciones o normas de las bibliotecas digitales ARTELOPE
y EMOTHE dicta que las didascalias de interlocutor muestren nombres completos, no abreviados. Cuando en el texto fuente hay didascalias abreviadas y
estas son ambiguas, por ejemplo, “Ser.” interpretable como “Servant” or “Sergeant”, la edición en TEI requiere desambiguar la abreviatura, como lo haría un
editor crítico cuya norma de edición contempla expandir esas abreviaturas.
Otro caso relacionado con didascalias de interlocutor ocurre cuando en el
texto fuente se repite la misma didascalia en lo que, en teoría, es un solo parlamento del mismo personaje, generalmente a causa de una acotación interna que
divide en dos o más partes el parlamento. Por ejemplo, en la traducción francesa
a cargo de François-Victor Hugo (1866, 3: 92) de Macbeth de Shakespeare, en la
escena quinta, la didascalia “LADY MACBETH” se repite tres veces al estar su
parlamento dividido por una acotación de salida del “serviteur” y otra acotación
de entrada de su marido. Aquí se presentan dos opciones de codificación. Una
intervención mínima marcaría con tres elementos <sp> cada sección del parlamento de Lady Macbeth, cada una con sus respectivos elementos <speaker> para
englobar cada didascalia “LADY MACBETH”. Esta opción reflejaría los componentes estructurales tal como están tipográficamente indicados en el texto fuente
impreso. (Una variante conllevaría codificar los tres parlamentos dentro de un
elemento de grupo de parlamentos <spGrp>, a su vez con su atributo @who.) Sin
embargo, la lógica de la estructura dramática, no la de la disposición tipográfica
del texto impreso fuente, obligaría a marcar todo con un solo elemento <sp>
(y por tanto un solo elemento <speaker>), para lo que la edición digital de
EMOTHE podría modificar el texto fuente mismo y eliminar las didascalias segunda y tercera, como manera de representar mejor la estructura dramática.
En ocasiones, por necesidades de adaptar el texto a las características de la
plataforma de edición y las convenciones de la Biblioteca Digital, hay que recolocar una acotación. Por ejemplo, en La corona merecida de Lope de Vega, la
edición en papel de Gómez y Cuenca (1993a: 685) que utiliza ARTELOPE
muestra la acotación “[Lea la otra carta.]” en el margen derecho a la altura del
segundo verso “y de quien vivo en su fe” del parlamento de Don Álvaro (tercer
acto, verso 2373). Esta posición con el parlamento empezado es extraña y puede
deberse al propósito de reflejar la posición en el manuscrito en el margen izquierdo (fol. 48 v) pero adaptándola a las convenciones de la edición en la Fundación Biblioteca Castro. Por su parte, la Biblioteca Digital de ARTELOPE
solo coloca acotaciones en el margen derecho cuando son un “aparte”, de manera que la necesaria recolocación de la acotación obliga a decidir el lugar óptimo,
al igual que hizo un editor crítico como Rodríguez-Gallego (2015: 756): la
acotación se resitúa delante del parlamento de Don Álvaro.
Otra norma de las bibliotecas digitales es que ofrecen ediciones con grafía y
puntuación actualizadas al uso moderno. Esto conlleva, en casos como las menEditar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
65
cionadas ediciones de la Real Academia Española, a que el editor digital modernice la grafía y la puntuación, un tipo de intervención en el texto realizado en la
mayoría de las ediciones críticas publicadas hoy en día.
Otra modificación importante del texto fuente es también la corrección de
erratas, tal como haría un “copy editor”. Por ejemplo, como editor digital para
EMOTHE de la comedia de William Congreve Love for Love, en la edición de
G. Salgado (1968), corregí duplografías obvias como “that don’t be- | believe” o
“to undergo a | a wife?”.
La codificación de la métrica en obras del teatro español ayuda a detectar
deficiencias en el texto fuente. Como la edición web permite una opción para
visualizar la métrica, y resultaría extraño a los lectores ver una indicación de estrofa que no se corresponde con los versos y su esquema de rima, se realizan dos
tipos de intervenciones según la situación: anotación y/o modificación del texto.
En Los locos por el cielo de Lope de Vega, para la que ARTELOPE utiliza la edición de Jesús Gómez y Paloma Cuenca para la Fundación Castro (1994), la
codificación de la métrica hace sospechar algo inadecuado en la línea “caja,
trompeta, bandera imperial patricio” (verso 1565), segmento hipermétrico que
sigue a un serventesio que culmina una tirada de tercetos y precede a la acotación “Vanse, y sale Maximiano y Capitan”. Una interpretación plausible es que
se trata de una impresión errónea como parte del diálogo de lo que era parte de
una acotación, la cual podría tener una formulación como propone la enmienda
del editor crítico Enric Bassegoda (2009: 372): “Caja, trompeta, bandera imperial vanse, y sale Maximiano y Patricio, capitán”. En la edición para ARTELOPE,
el texto se mantiene, pero se incluye un comentario en nota.
En el caso de omisión de un verso para completar una estrofa, se inserta en
el texto una nueva línea con una secuencia de puntos suspensivos entre corchetes cuadrados para indicar la laguna. Varios de esos casos se observan en El
ejemplo de casadas de Lope de Vega, para la que ARTELOPE utiliza la edición
de Jesús Gómez y Paloma Cuenca (1993b). Al marcar la redondilla se observa
que falta un verso después de “¡Qué santa correspondencia!”, laguna también
presente en el texto base de la Parte XIV. En esta misma obra, en el Baile inicial,
la Fregona 1ª dice “Él se precia de cantar, | oficio que no le toca”, cuando “cantar” no rima con ninguna terminación mientras que, como ha observado Daniel
Fernández (en consulta privada), “cantor” (que sería, propiamente, el “oficio”
citado en el verso siguiente), rima con el “menor” y el “bebedor” de los siguientes versos (que forman parte de un villancico o canción). En la edición para
ARTELOPE se enmienda a “cantor” y se advierte y justifica esta alteración en
una nota: “La rima sugiere corregir a «cantor» la lectura «cantar» en la Parte V y
en la edición de Gómez y Cuenca (p. 195).”
Un último ejemplo de intervención del editor digital tiene que ver con el
paratexto de los dramatis personae. La comedia El galán Castrucho de Lope de
Vega tiene la peculiaridad de que hay un elenco de figuras al principio de cada
jornada. La plataforma de edición en FileMaker de ARTELOPE y de
Editar el Siglo de Oro en la era digital
66
Jesús Tronch Pérez
EMOTHE no está programada para estos casos de múltiples listas intercaladas
entre divisiones del cuerpo del texto. En la edición para ARTELOPE, que emplea la edición de Cotarelo para la Real Academia Española, se optó por reunir
todos los personajes en una nómina inicial, y anotar la modificación. En cambio, en la edición para EMOTHE, que emplea la edición de Juan Molina para
la colección CANON 60, se respetó el triple elenco y su posición, para lo que
se tuvo que alterar manualmente el archivo XML-TEI con el fin de intercalar
las listas donde correspondía.
Conclusión
Editar en TEI para los dos proyectos está, en primer lugar, definido por el modelo de datos, y por el software empleado (procesador de texto y gestor de base
de datos FileMaker, y editor de XML oXygen), lo que permite cumplir el objetivo de conseguir una gran cantidad de textos de manera uniforme por diversos
editores digitales que pueden trabajar a distancia. En segundo lugar, editar en
TEI está caracterizado por el margen de intervención que tienen los responsables de la representación electrónica del texto fuente. Cuando en ARTELOPE y
EMOTHE esta intervención implica alterar el texto establecido previamente
(como en el caso de la modernización de la grafía, la expansión de didascalias de
interlocutor, la corrección de erratas, la inserción de signos para indicar lagunas
que ayudan a visualizar la métrica), la edición puede considerarse una edición
“creativa” académica, según define Tanselle (1995: 13.-14) una de las variedades de edición académica, es decir, una edición que altera el texto para “mejorarlo” según un estándar de uniformidad y determinados criterios.
Esta “mejora” de los datos humanísticos (como son los textos teatrales electrónicos) también se aprecia en la labor de lo que en inglés se considera un digital
curator, lo que en el ámbito museístico se diría en español un “conservador”, con
el propósito de asegurar que la representación de los objetos de estudio funcionen
bien como datos procesables e interoperables (Flanders y Muñoz). Como ha observado Susanna Allés-Torrent (2020: 64), en los últimos años, “la figura del editor
... se está alterando y dando lugar a posiciones teóricas que lo convierten en una
especie de moderador”, al tiempo que evoluciona el concepto de edición digital.
Los ejemplos que he comentado en el último apartado muestran como la
edición en TEI (sea un texto editado críticamente por el propio investigador o un
texto previamente editado por otra persona) conlleva una labor de adaptación a
las convenciones de cada proyecto, a veces de modificación del mismo texto, con
decisiones editoriales y juicios interpretativos que van más allá de un marcado
mecánico, de una mera descripción semántica de características y componentes
estructurales del texto teatral, hasta el punto que podríamos preguntarnos si estamos ejercitando lo que se podría denominar una “codificación crítica”, en tanto
que el “editor” ejercita su juicio crítico para decidir cómo interpretar y cómo reEditar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
67
presentar elementos textuales, y basa sus decisiones en un conocimiento de la
transmisión del texto, en la que se incluye el modelo de datos a partir del cual se
representa el texto.20 Si entendemos, como propone Sahle (2016: 24 y 38), que
lo “crítico” o la “crítica” se refiere a las actividades que aplican un conocimiento
académico y un razonamiento al proceso de reproducir o transformar un documento o texto en una edición, o cuando la edición añade información a la representación del documento para hacerlo más utilizable; si entendemos, como argumenta Allés-Torrent (2020: 73), que la “crítica” en las ediciones digitales “no se
encuentra ya en la recopilación de las variantes ni en la aspiración de ofrecer un
texto único, sino en la práctica y el proceso hermenéutico basado en una
metodología digital (captura, estructuración, publicación)”, podemos reconocer
que hay una dimensión “crítica” en lo que supone editar en TEI para ARTELOPE y EMOTHE.
20. De manera análoga, Dahlström (2010) sugiere el término “digitalización crítica” para referirse
a un tipo de actividad en la digitalización en bibliotecas que tiene similitudes con la crítica textual.
Editar el Siglo de Oro en la era digital
68
Jesús Tronch Pérez
Bibliografía
“About the Folger Shakespeare”, en The Folger Shakespeare, [en línea] Folger
Shakespeare Library, <https://web.archive.org/web/20220318211857/
https:/shakespeare.folger.edu/about-the-folger-shakespeare/>.
Allés-Torrent, Susanna, “Crítica textual y edición digital o ¿dónde está la
crítica en las ediciones digitales?”, Studia Aurea, XIV (2020), pp. 63-98,
20-09-23, <https://doi.org/10.5565/rev/studiaaurea.395>.
Bassegoda i Pineda, Enric (ed.), “Los locos por el cielo”, en Comedias de Lope de
Vega, Parte VIII, coord. Rafael Ramos, Lleida, Milenio, 2009, pp. 305-427.
Beshero-Bondar, Elisa Eileen, “Rebuilding a Digital Frankenstein by 2018:
Reflections toward a Theory of Losses and Gains in Up-Translation.” Presented at Up-Translation and Up-Transformation: Tasks, Challenges, and
Solutions, Washington, DC, July 31, 2017, en Proceedings of Up-Translation and Up-Transformation: Tasks, Challenges, and Solutions, Balisage Series on Markup Technologies, vol. 20 (2017), 20-09-23, <https://doi.
org/10.4242/BalisageVol20.Beshero-Bondar01>.
Burnard, Lou, “The TEI and XML”, en What is the Text Encoding Initiative?
How to add intelligent markup to digital resources, new edition [online],
Marseille, OpenEdition Press, 2014, 19-20-23, <https://doi.org/10.4000/
books.oep.426>.
Chapman, Alison, y DVPP team, ed., “The Digital Victorian Periodical Poetry
Schema (BETA): Schema and guidelines for encoding poems from the Digital Victorian Periodical Poetry database”, Digital Victorian Periodical
Poetry, University of Victoria, <https://dvpp.uvic.ca/dvpp.html>.
Cotarelo Emilio, ed., «El galán Castrucho», en Obras de Lope de Vega, VI: obras
dramáticas, Madrid, RAE, 1928, pp. 31-67.
Dahlström, Mats, “Critical Editing and Critical Digitization”, en Text Comparison and Digital Creativity: The Production of Presence and Meaning in
Digital Text Scholarship, ed. Ernst Thoutenhoofd et al., Amsterdam, Brill,
2010, pp. 79-97.
Escobar Varela, Miguel, Theater as Data: Computational Journeys into Theater
Research. University of Michigan Press, 2021, <https://doi.org/10.3998/
mpub.11667458>.
Flanders, Julia, y Trevor Muñoz, “An Introduction to Humanities Data Curation”, DH Curation Guide: A Community Resource Guide to Data Curation in the Digital Humanities. Maryland Institute for Technology in the
Humanities, 20-09-23, <https://archive.mith.umd.edu/dhcuration-guide/
guide.dhcuration.org/glossary/intro/index.html>.
Fukushima, Kailey, y Karen Bourrier, “Inside Digital Dinah Craik: Feminist
Pedagogy, Cognitive Aprrenticeship, and the TEI”, Journal of the Text Encoding Initiative, XII (2019-2020), 20-09-23, <https://journals.openedition.org/jtei/2185>.
Editar el Siglo de Oro en la era digital
Editar en TEI teatro clásico español e inglés en los proyectos ARTELOPE y EMOTHE
69
Fukushima, Kailey, Karen Bourrier, y Janice Parker, “The Lives of Mistresses
and Maids: Editing Victorian Correspondence with Genealogy, Prosopography, and the TEI”. Digital Humanites Quarterly, 16.1, 2022), 20-09-23,
<https://www.digitalhumanities.org/dhq/vol/16/1/000595/000595.html>.
Gómez, Jesús, y Paloma Cuenca, ed., «La corona merecida», en Comedias, XII
/ Lope de Vega, Madrid, Turner (Biblioteca Castro), 1993a, pp. 609-705.
—, ed., «El ejemplo de casadas», en Comedias, XV / Lope de Vega, Madrid, Turner (Biblioteca Castro), 1993b, pp. 187-285.
—, ed., «Los locos por el cielo», en Comedias, X / Lope de Vega, Madrid, Turner
(Biblioteca Castro), 1994, pp. 1-94.
González-Blanco, Elena, y José Luis Rodríguez, “ReMetCa: A Proposal for
Integrating RDBMS and TEI-Verse”, Journal of the Text Encoding Initiative, VIII (2015), 20-09-23, <https://journals.openedition.org/jtei/1274>.
Helsinki Corpus TEI XML Edition, Helsinki: The Research Unit for Variation,
Contacts and Change in English (VARIENG), University of Helsinki,
2011, <https//helsinkicorpus.arts.gla.ac.uk>.
Jenstad, Janelle, y Tracey El Hajj, “Converting an SGML/XML Hybrid to
TEI-XML: The Case of the Internet Shakespeare Editions”, Proceedings of
Balisage: The Markup Conference 2021, XXVI (2021), 20-09-23, <https://
doi.org/10.4242/BalisageVol26.Jenstad01>.
Jenstad, Janelle, “Linked Early Modern Drama Online: A New Editorial and
Encoding Platform for Shakespeare and His Contemporaries”, en Reimagining Shakespeare Education: Teaching and Learning through Collaboration,
ed. Liam E. Samler et al., Cambridge, Cambridge University Press, 2023,
pp. 239-50.
Leonhardt, Nic, “Digital Humanities and the Performing Arts: Building Communities, Creating Knowledge”, Keynote Address SIBMAS/TLA Conference, XII, 2014, 20-09-23, <https://mappinggth.hypotheses.org/files/2014/09/
Nic-Leonhardt_DH-and-the-Performing-Arts_June-2014.pdf>.
Madroñal, Abraham, ed., “El ausente en el lugar”, en Comedias de Lope de Vega:
Parte IX, coord. Marco Presotto, Lleida, Milenio, 2007, pp. 417-531.
Molina, Juan, ed., Lope de Vega, El galán Castrucho, en Colección CANON
60, Alicante: Biblioteca Virtual Miguel de Cervantes, 2014.
Muñoz Pons, Carlos, “El proceso de edición digital en Artelope y CTCE”,
Teatro de palabras: revista de teatro áureo, «Lope de Vega y el teatro clásico
español: nuevas estrategias de conocimiento en humanidades», VII (2013),
pp. 483-96.
Niles, Rebecca, y Michael Poston, “Re-Modeling the Edition: Creating the
Corpus of Folger Digital Texts”, en Early Modern Studies after the Digital
Turn, ed. Laura Estill et al., New York / Toronto, Iter and the Arizona
Center for Medieval and Renaissance Studies, 2016, pp. 117-44.
Oleza, Joan, “Exploring a Multilingual Digital Edition of Early Modern European
Theater”, Journal of Early Modern Cultural Studies, 13.4 (2013), pp. 152-54.
Editar el Siglo de Oro en la era digital
70
Jesús Tronch Pérez
—, “Una base de datos para una travesía compleja”, en Renovación en el Siglo de
Oro: repertorio e instrumentos de investigación, ed. Héctor Urzáiz y M. Zubieta, Cuadernos de teatro clásico 29, Madrid, Compañía Nacional de Teatro Clásico, 2014, pp. 209-240.
—, “Los datos del TC / 12: objetivos, programas y resultados (2011-2013)”, El
patrimonio del teatro clásico español: actualidad y perspectivas. Homenaje a
Francisco Ruiz Ramón, ed. Germán García-Luengos, H. Urzaiz Tortajada y
P. Conde Parrado, Valladolid, Ediciones Universidad de Valladolid, 2015,
pp. 51-70.
Portela, Manuel, Literary Simulation and the Digital Humanities. New York:
Bloomsbury, 2022.
Rodríguez-Gallego, Fernando, ed., “La corona merecida”, en Comedias de
Lope de Vega Parte XIV, coord. José Enrique López Martínez, Madrid, Gredos, 2015, I, pp.583-829.
Sahle, Patrick, “What Is a Scholarly Digital Edition”, en Digital Scholarly Editing: Theories and Practices, ed. Matthew James Driscoll y Elena Pierazzo,
Cambridge (UK), Open Book Publishers, 2016, pp. 19-39.
Salgado, Gamini, ed., “Love for Love”, en William Congreve / Three Restoration
Comedies, Harmondsworth, Penguin Books, 1968, pp. 258-365.
Shakespeare, William, Comedies, Histories and Tragedies, London, 1623.
Tanselle, George Thomas, “The Varieties of Scholarly Editing”, en Scholarly
Editing: A Guide to Research, ed. D. C. Greetham, New York, Modern Language Association of America, 1995, 9-32.
TEI Consortium, “P5: Guidelines for Electronic Text Encoding and Interchange”, Text Encoding Initiative, 20-09-23, http://www.tei-c.org/.
“Usage Guidelines for Folger Shakespeare Download Formats”, en The Folger
Shakespeare, The Folger Shakespeare Library, 19-09-23, <https://www.folger.edu/explore/shakespeares-works/download/usage-guidelines/>.
Vega y Carpio, Lope de, Doze comedias ... Novena parte, Madrid, viuda de
Alonso Martín, 1617, facsímil digital disponible en Biblioteca Digital Hispánica <http://bdh-rd.bne.es/viewer.vm?id=0000014188&page=1>
Editar el Siglo de Oro en la era digital
Por la dignidad del texto.
El teatro del Siglo de Oro y de Lope de Vega
en la red. Principios ecdóticos
y de Humanidades Digitales1
Ramón Valdés Gázquez
Universitat Autònoma de Barcelona
PROLOPE
ORCID: 0000-0002-7429-9709
[email protected]
Resumen
Los textos del teatro del Siglo de Oro se han ido poniendo en la red en diferentes formatos desde imágenes de testimonios a textos procesados. En cuanto a los
textos procesados, la calidad filológica es muy variada, pero han llegado a la red
muchos textos no fiables establecidos con métodos y criterios caducos o sin la
mínima solidez ecdótica exigible, frente al excelente panorama que ofrece hoy la
edición crítica en papel. Aunque contar con una cantidad de textos importante
tiene algunas ventajas, hay que lamentar que se hayan difundido y replicado
gran cantidad de textos no fiables y convendrá ser prudentes en su uso para la
investigación o sencillamente su lectura. Es necesario que desde el ámbito académico se publiquen y difundan las ediciones críticas y textos fiables de que ya
disponemos en ediciones críticas digitales, pero también es conveniente explorar
e idear estrategias de digitalización y difusión más rápida que permitan ponerlos
al alcance tanto de la ciudadanía como de la comunidad investigadora según
unos principios básicos e irrenunciables de Filología y de Humanidades Digitales de calidad en un contexto de Cultura y de Ciencia abiertas.
Palabras clave
Edición crítica digital; teatro del Siglo de Oro, Lope de Vega, internet, XMLTEI, Minimal Computing, Slow Science.
1. Este artículo se beneficia de la participación del autor en el proyecto de investigación “La integral dramática de Lope de Vega: textos, métodos, problemas, proyección” (PID2021-124737NBI00), financiado por el Ministerio de Ciencia e Innovación, con fondos FEDER, así como del
reconocimiento al SGR LT&T: Literary Traditions and Texts of the Early Modern Age: Italian,
Iberian and Transatlantic Networks (2021SGR00155), financiado por la AGAUR, de la Generalitat de Catalunya.
Editar el Siglo de Oro en la era digital
72
Ramón Valdés Gázquez
Abstract
For the Dignity of the Text: Golden Age Theater and Lope de Vega Online. Editorial
and Digital Humanities Principles.
The plays of the Spanish Golden Age Theater have been disseminated online in
various formats, ranging from images of ancient manuscripts to processed texts.
However, the Internet has seen the proliferation of numerous unreliable texts, often
established with outdated methods and criteria, or lacking the necessary meticulous
editorial work.This stands in stark contrast to the high standards set by contemporary critical editions in print. While the digital availability of a vast number of texts
offers certain advantages,, it is regrettable that these unreliable versions have been
widely disseminated and replicated. Consequently, caution is advised when using
them for research or casual reading. This predicament underscores the urgency of
bringing critical editions and reliable texts, already available in print, to the digital
realm. There is a pressing need for high-quality scholarly digital editions that adhere
to the principles of Philology and Digital Humanities. Simultaneously, there is merit in exploring expeditious methods of digitalization and rapid dissemination strategies, ensuring that these critical editions and texts are promptly accessible to both
citizens and the research community. Such efforts must align with the fundamental
and non-negotiable principles of quality in an open culture and science scenario.
Keywords
Digital Scholarly Edition; Spanish Golden Age Theater, Lope de Vega, Internet,
XML-TEI, Minimal Computing, Slow Science.
En las páginas que siguen trazaremos un panorama sobre los textos y ediciones
de teatro del Siglo de Oro que se encuentran hoy en la red, con especial atención
a los de Lope de Vega. Ofreceremos un balance y unas reflexiones sobre su cantidad y su calidad y, a estas alturas del siglo xxi, en un contexto práctico y teórico, una propuesta sobre estrategias y principios que conviene seguir en el futuro.
Para entender mejor qué textos hay hoy, será bueno también entender cómo
llegaron y se compartieron en red los primeros.
Podríamos decir que hoy la presencia del teatro del Siglo de Oro en la red,
sumando diferentes formatos de presentación desde los textos procesados y publicados en HTML (muchos, en realidad, generados a partir de una codificación
en XML-TEI), a los archivos PDF con imágenes de testimonios antiguos de las
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
73
bibliotecas o de ediciones críticas, o webs de ediciones críticas digitales propiamente dichas, es ya masiva. Según ha mantenido Germán Vega García-Luengos
en diferentes ponencias y cursos la más nutrida de las tradiciones dramáticas
nacionales del siglo xvii está ampliamente representada en la web. Si consultamos el portal Teatro Clásico Español de la Biblioteca Virtual Miguel de Cervantes
(BVMC) que él coordina, a fecha de agosto de 2023, nos da un resultado de
4381 documentos entre texto en HTML, reproducciones digitales de manuscritos e impresos antiguos en formato PDF, textos codificados en XML-TEI, etc.
Claro, debe considerarse que esos 4381 ítems pueden incluir hasta cinco o diez
veces una misma obra en diferentes formatos y testimonios.
Pero veamos de dónde venimos para entender mejor dónde estamos y plantearnos adónde vamos o querríamos llegar, sobre todo, en términos de calidad textual.2
El teatro del Siglo de Oro en los inicios de Internet
y la World Wide Web
Cabe decir que los inicios de esta digitalización —entendiendo ahora por tal
cualquier iniciativa de digitalización en imagen (reproducción facsimilar) o texto— fueron muy tempranos, y llegaron fundamentalmente de la mano de dos
ámbitos que no tardaron mucho en coordinarse: el de las bibliotecas y el de la
academia e investigación.
Los primeros pasos del teatro del Siglo de Oro en el terreno digital se dieron
por los investigadores y en forma de texto plano; formatos basados en UNIX, así
como archivos creados con procesadores de textos comerciales como WordPerfect, Word y compartidos por listas de correo; o también, formatos RTF o, más
adelante, PDF subidos a la red y publicados finalmente en HTML. Fueron
Vern Williamsen y James T. Abraham, acompañados también por David Hildner y Matthew D. Stroud quienes compartieron generosamente los primeros
textos íntegros en Internet e inmediatamente, tras su creación, en la World Wide
Web.3 La iniciativa de Williamsen y Abraham fue más que loable y científica-
2. Aunque pretendemos mencionar los hitos principales de la llegada del teatro del Siglo de Oro en
la red, no seremos exhaustivos, sino que más bien aprovecharemos la mención de algunos hitos para
entender, sobre todo, cuál es la calidad textual, filológica y digital que podemos encontrar y por qué.
Cabe mencionar entre los panoramas y las reflexiones previas destacables los de J. M. Lucía Megías
(2008), G. Vega García-Luengos (2014) y sus “Herramientas informáticas ” en la web Casa di Lope
actualizadas por F. Antonucci, Marco Presotto (2018) y V. Casais y S. Fernández Mosquera (2022).
3. Se puede rastrear la historia en J. M. Lucía Megías (2008), J. T. Abraham (2015), Matthew D.
Stroud (2015) y en la página Comedias.org mantenida por la Association for Hispanic Classical
Theater, fuertemente relacionada con el nacimiento de este proyecto. Queda fuera de nuestra
historia del teatro áureo en la red un hito fundamental en la digitalización, aunque de obligada
mención: el Teatro Español del Siglo de Oro (TESO), de 1997, dirigido por Carmen Simón Palmer
y con asesoría de múltiples especialistas, aunque en su momento fue una iniciativa muy importanEditar el Siglo de Oro en la era digital
74
Ramón Valdés Gázquez
mente honesta. En la presentación de la colección de textos se advertía claramente: “No se debe considerar estos textos como ediciones ‘críticas’ ni definitivas”. Sin necesidad de esperar a la web 2.0 ni que las Humanidades Digitales se
bautizaran como tales en los años 2000, el proyecto se concebía de modo colaborativo: un investigador podía enviar y donar su texto, mientras otro añadía
notas aclaratorias y cualquier lector enviaba enmiendas si se veían errores. Se
ofrecían unos términos de uso que auguraban la filosofía de las licencias Creative Commons: libertad de utilización sin ánimo de lucro y con cita de reconocimiento.4 Esto favoreció la reutilización legítima por parte de otras bibliotecas
virtuales, como la Biblioteca Virtual Universal argentina, la IntraText Digital
Library, por otros especialistas, como Miguel Garci-Gómez, que incluyó la colección íntegra en la suya propia (Cibertextos interactivos), o por los mismos investigadores en otros proyectos (Hildner reutiliza sus transcripciones para Comedias.org en Teatro de los siglos de Oro, en Québec, proyecto dirigido por R.
Serrano y A. Hermenegildo). También se produjeron reutilizaciones no tan legítimas, pues hemos podido ver textos de Comedias.org en editoriales comerciales (todos las conocemos) que ofrecen, previo pago, servicio print-on-demand,
sin declarar, por supuesto, el origen del texto digitalizado que toman de la red
como obra de dominio público (pues la declaración sobre el uso legítimo no
parecía tener la fuerza legal y coercitiva de un copyright formalizado al uso).
Independientemente de legitimidades, ilícitos punibles o no y éticas deontológicas, una de las ventajas indiscutibles de la red es la mayor difusión a través de
la multiplicación y réplica de los textos, una vez han sido publicados. La facilidad
de copia de textos digitales implica un beneficio en doble sentido: por un lado, su
mayor difusión y por otro, su pervivencia. Sin embargo, si lo medimos desde una
óptica ecdótica, habrá que tener muy presente también, claro, que esas ventajas
se convierten en serio peligro, pues esos textos que se subieron a la red con la
mejor intención, pero con declaración de provisionalidad científica, ahí quedan
y, deficientemente establecidos, se reutilizan y generan su propia tradición: si los
textos no se han establecido con rigor crítico, podemos estar transmitiendo, replicando y multiplicando, no solo los textos, sino los errores que, al ser provisionales, contienen. Y, siguiendo su ciclo vital inevitable en la red, esos textos, deficientemente establecidos, son base de estudios de carácter científico.
te (véase Lucía Megías 2008: 90-95). Hoy en la red, pero no en acceso abierto, es uno de esos
casos en los que, algunos investigadores que ya adquirimos el costoso CD ya inoperativo, nos
hemos negado a pagar dos veces para poder consultar el mismo producto que ya habíamos adquirido. No hemos podido acceder hoy al proyecto Comedia: Spanish Drama (Electronic Texts Center) de la Biblioteca de la Universidad de Virginia descrito por Lucía Megías (2008: 101ss.).
4. “Se les concede a los usuarios el derecho de usar o citar estos textos para cualquier fin académico y legítimo. Si se quisiera usar un texto para una producción teatral o para la publicación, se
debería poner en contacto con Matthew D. Stroud para más detalles sobre los derechos y permisos.” (presentación en la página que ofrece la colección de textos).
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
75
Veamos un ejemplo de lo que venimos diciendo. En la web de Teatro de
los Siglos de Oro de Alfredo Hermenegildo y Ricardo Serrano, de indudable
mérito filológico e informático (con la revista Teapal, el analizador Brocense,
debates pioneros sobre la informática textual, etc.), se ofrecen 34 comedias.
De ellas, solo 9 parecen haber sido establecidas con algún criterio ecdótico y
son, a decir verdad, minoría o práctica excepción los textos críticos sólidos,
como la edición de Miguel Zugasti de Todo es dar en una cosa, de Tirso. David
Hildner, que ya había transcrito una colección de textos de varios autores para
Comedias.org, como ya hemos dicho, los recogió y los incluyó también en este
proyecto y, aunque se debe valorar el mérito tecnológico de la codificación en
XML así como la posibilidad de conversión y descarga en diferentes formatos,
no debe olvidarse que los textos-base para las transcripciones de Hildner son
escogidos sin criterio ecdótico alguno: ediciones de 1830 o 1840, de la BAE
de 1873 o de principios de siglo xx de la RAE; por ejemplo, las ediciones de
Leipzig de Johann Georg Keil, por lujosas que fueran y por mucho que sean
buen testimonio del amor alemán por Calderón, carecen de rigor ni fundamento filológico que avale tomarlas como modelo para una edición rigurosa
en nuestros tiempos. Con todo, estos textos ya electrónicos de Hildner en el
nuevo proyecto de Québec son utilizados para estudios de segmentación métrica, para los que, cabe pensar, contar con textos críticos bien establecidos
debería tener alguna relevancia.
Sea como sea, el teatro del Siglo de Oro empezó a tener una deseada y merecida presencia en la red gracias a los esfuerzos de estos investigadores estadounidenses y al poco nacería y tomaría el testigo la Biblioteca Virtual Miguel de
Cervantes. De hecho, los primeros pasos de la propia BVMC no fueron ajenos,
tampoco, a estas experiencias del lejano Oeste, y tuvo muy presente qué podía
aprender de esos investigadores de las universidades de Arizona o Duke.5
Desde sus inicios en 1999 la BVMC intentó lograr el doble objetivo de
ofrecer una importante cantidad de textos a la vez que una elevada calidad de los
mismos. Lograr ese doble objetivo presentaba problemas cuando, además, había
que conjugarlo con el imprescindible respeto de los derechos de autor (o de los
editores filológicos y las casas editoriales implicadas). En algún caso la solución
pasó por publicar textos con derechos de autor caducados, pero fue mala solución, pues esa caducidad implicó también caducidad científica. Aunque se crearan diferentes niveles de usuario para algunos textos (Sabido 2001: 15), al intentar satisfacer la necesidad de publicar en acceso libre una importante cantidad de
textos y el deseo de que tuvieran calidad y valor científico, la BVMC se vio y se
ha visto involucrada en alguna polémica por obras publicadas sin permiso o sin
declarar con exactitud sus editores filológicos (paradójicamente, a veces —cabe
5. Según explica Stroud (2015: 2): “interest in making new plays available on our website has
waned in light of the well funded Biblioteca Virtual Miguel de Cervantes in Spain”.
Editar el Siglo de Oro en la era digital
76
Ramón Valdés Gázquez
decirlo en su defensa— por el prurito de publicar buenos textos).6 Hay que
asumir que se puede plantear una disyuntiva entre dar acceso a obras o ediciones
de dominio público, sin problemas de derechos, pero con un valor científico
menor o periclitado, y textos y ediciones críticas de valor filológico, pero con
derechos de autor. Lo que queda fuera de lugar es entender la red como el far
West o un territorio sin ley. La BVMC no ha sido en esto ni la única ni excepción,
y son encrucijadas y polémicas en las que se han visto involucradas también bibliotecas virtuales de diferentes latitudes; de hecho, se podría decir que son conflictos comunes o propios del proceso de digitalización de muchos bienes o
servicios en nuestra sociedad.7 Es necesaria reflexión y son necesarios equilibrios:
porque un respeto a ultranza de todos los derechos implicaría una parálisis de
iniciativas de Ciencia y Cultura Abiertas con que se vulnerarían los derechos de
acceso del ciudadano a las mismas. Resulta significativo que las instituciones
europeas estén defendiendo en ultimísimos tiempos para los datos de investigación las licencias Creative Commons-Public domain.
El portal del Teatro Clásico Español, TC-12, Canon 60.
Testimonios, textos críticos y ediciones críticas en la red
Con todo, y volviendo a nuestro tema, tal vez podríamos decir que, en la actualidad, a través del macro-portal del Teatro Clásico Español de la BVMC,
inaugurado en 2013, se han integrado más textos de este periodo y, con el
diestro timón de Germán Vega, se ha avanzado por este mar proceloso. Dos
factores han permitido aumentar la cantidad e interés de los textos: la digitalización masiva de testimonios antiguos por las bibliotecas y los resultados de
6. Véase a este respecto Atarés (2006), Lucía Megías (2009: 19) y (2012: 105-106) y más recientemente Fradejas Rueda (2016). Según lo relatado y demostrado por Fradejas Rueda (2016), la
BVMC habría publicado una edición de su padre, Fradejas Lebrero, del texto medieval de Pedro
López de Ayala Libro de la caza de las aves, diciendo que se habían basado en la edición decimonónica —y libre, por tanto, de derechos— de José Gutiérrez de la Vega, que, según declaraban,
habrían cotejado y enmendado con la de Fradejas Lebrero de 1969 en Castalia. En realidad, se
trataría de una mera transcripción de la de Fradejas Lebrero, según demuestra, no sin humor,
Fradejas Rueda con técnicas de Lingüística Forense —y digámoslo también de Crítica Textual—
rotunda y sobradamente.
7. Véase J. M. Lucía Megías (2009: 19) y (2012: 105-106), Rojas Castro (2013: 32), Faulhaber
(2014: 26) así como, más allá del ámbito español, Shillingsburg (1999: 161) y Apollon, Bésile y
Regnier (2014). Podríamos decir que son procesos complejos y lógicos de explotación desaforada
(nunca mejor dicho), comprensión de las consecuencias y adaptación y delimitación de la posible
vulneración de derechos hasta llegar a la regulación de la nueva realidad generada por la tecnología
y era digital en los muy diferentes ámbitos sociales, económicos, culturales, etc. Es una de las razones por las que se habla de la uberización de la ciencia; se producen también en ella actuaciones
competitivas que pueden resultar abusivas, desleales, incluso punibles y a veces sin mucha conciencia ni mala fe, cuando en verdad se están vulnerando derechos ajenos.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
77
investigación de unos grupos científicos centrados en la edición crítica tan
activos como generosos.
El proceso de digitalización de fondos antiguos de la Biblioteca Nacional de
España comenzó en 1999, y esa digitalización tomó fuerte impulso y se hizo de
manera masiva en 2008 tras la creación, en el año anterior, 2007, de la Biblioteca Digital Hispánica, que permitió la réplica de sus fondos en la BVMC. Conviene subrayar que la BNE optó por asumir, gracias a una ayuda de Telefónica,
la responsabilidad de digitalizar sus propios fondos, frente a otras bibliotecas,
como la de la Universidad Complutense de Madrid (o la mismísima British
Library), que optó por una cooperación con Google Books, con los riesgos que
comporta la cesión a una empresa privada de la gestión de un bien público.8
Cuando Germán Vega asumió la coordinación del portal Teatro Clásico Español se habían producido ya algunas felices ideas en la estructuración de la BVMC,
como eran las páginas de “Biblioteca de Autor” o “Biblioteca de Obra”, que implicaron de por sí una potenciación de la calidad según José Manuel Lucía Megías
(2009: 19 y 23-26). Germán Vega (2014) explica el proyecto en el que, sin prescindir de esos textos precedentes de la BVMC, basados en ediciones decimonónicas con derechos caducados o en TESO para el teatro del Siglo de Oro,9 se apuesta por incorporar, a través de convenios firmados con las distintas bibliotecas que
iban digitalizando sus fondos, digitalizaciones de testimonios de interés y, gracias
a convenios firmados con grupos y redes de investigación, textos críticos o incluso
ediciones críticas íntegras. Digamos que con esta estrategia el compromiso entre
calidad, cantidad y derechos vigentes se ha podido gestionar magistralmente. Esa
estrategia, todo hay que decirlo, fue también posible en muy gran medida por el
macroproyecto TC/12, vigente a través de diversos proyectos entre 2010 y 2017,
y el empuje de su director Joan Oleza; ayudó, de modo general, a articular y cohesionar a los grupos de investigación y edición en Teatro del Siglo de Oro (lo que
facilitó a su vez la tarea al propio G. Vega ante la BVMC) y acometió, de modo
8. Véase al respecto las fundamentales aportaciones de Robert Darnton (2010), que reúne un par
de artículos suyos en The New York Review of Books de 2008 y 2009 así como la conferencia pronunciada también en este último año en la Feria del Libro de Frankfurt “Digitize, Democratize”.
Una conclusión de los ensayos de Darnton, que explica con gran detalle todo el proceso de creación de Google Books, podría ser que, por elogiable y altruista que pudiera parecer —y fuera— la
iniciativa de Google, al final respondía a los parámetros y objetivos de una empresa privada, y, lo
que es peor, en un contexto de mercado y derechos de autor del que ningún actor se puede sustraer, se vio incluso forzada a comportarse como tal, como empresa privada, por otros agentes
interesados, terceros, que, a su vez, legítimamente defendían sus derechos; al final, efectivamente,
se corren serios riesgos con este modelo de negocio y cesión de la gestión del bien público (verbigracia digitalización de los fondos antiguos) en el que el perjudicado puede acabar siendo el propio bien público, el Estado y el ciudadano. Una perspectiva bien distinta, en defensa de la digitalización por Google, ofrecen los bibliotecarios de la UCM Magán y Tardón (2014), que no citan
a Darnton, aunque sí dan fiel cuenta de la controversia.
9. Véase lo ya dicho en la nota 3; J. M. Lucía Megías denunciaba en (2009: 19) la pervivencia de
textos que habían llegado a la BVMC con las malas prácticas del pasado.
Editar el Siglo de Oro en la era digital
78
Ramón Valdés Gázquez
concreto, proyectos de sumo interés como la biblioteca digital Canon 60, que
implicó la puesta en línea de sesenta y una obras canónicas de nuestro teatro clásico en textos críticos fiables. Así, cada vez es más importante la presencia de testimonios digitalizados de fondos bibliotecarios antiguos (de interés científico per se
en tanto que fuentes primarias), textos críticos e incluso, en el mejor y más loable
de los casos, ediciones críticas digitalizadas (a destacar el caso de la Colección Proteo
del grupo Moretianos, con 24 ediciones críticas digitalizadas, presentadas en formato PDF) con permiso y convenio con los investigadores y editores, satisfaciendo plena y simultáneamente la calidad, incluso excelencia, y vigencia científica
como del respeto a los derechos de autor.10
En lo visto hasta aquí, con todo, siendo honestos, conviene admitir que,
desde un punto de vista tecnológico y en términos de edición crítica digital, estos resultados pueden considerarse humildes. En los mejores casos, como Canon
60, los textos críticos, y por tanto filológicamente fiables, aunque muy oportunamente codificados en XML-TEI, van sin notas ni aparato crítico, por lo que
no pueden considerarse como ediciones críticas plenas; o, si llevan esos aparatos,
como en el caso de la Colección Proteo, se presentan en PDF, lo que limita enormemente su funcionalidad como edición digital (se trataría más bien de ediciones críticas digitalizadas, ofrecidas en PDF, un formato estático). Pero también
se han producido avances importantes que combinan la excelencia filológica y
tecnológica y ya se han acometido algunas que merecen plenamente el nombre
de ediciones críticas digitales.
Dentro del ámbito del Teatro del Siglo de Oro cabe mencionar como ediciones críticas digitales El perro del hortelano de Rosa Navarro en el Centro
Virtual Cervantes (ya de hace unos años, 2004, en HTML, sencilla tecnológicamente pero tal vez la pionera y muy digna edición), La entretenida, de Cervantes, edición de John O’Neill (2013), muy interesante proyecto del King’s College por ciertas características y materiales del repositorio (por poner un ejemplo,
un texto sin puntuar para su manejo y puesta en escena por compañías teatrales), así como La traición en la amistad de María de Zayas, dirigida por Teresa
Ferrer (2015) para TEADOC (consultable hoy a través de la web de DICAT,
con hiperenlaces y materiales multimedia), y La dama boba, dirigida por Marco
Presotto (2015) y realizada en XML-TEI para PROLOPE. Esta última se convirtió en un punto de referencia en reseñas, artículos y catálogos de ediciones
digitales por el concepto de archivo digital y la edición crítica y publicación en
presentación sinóptica de testimonios relevantes (con sus respectivas transcripciones), como son el manuscrito autógrafo, el de “memorión” y la primera edición, relevantes todos en la historia textual de la obra, además de ofrecer, claro,
el texto crítico y aparato de variantes.11 En las ediciones de obras individuales
10. Ya destacaba este importante hito Marco Presotto (2018: 33-34).
11. Véase, por ejemplo, A. Rojas Castro (2017), P. Sahle (actualizado 2020) y N. Mateos Frühbeck
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
79
hay que añadir dos tesis doctorales surgidas en la Universitat de València. La
discreta enamorada, de Lope, integrada luego en la Biblioteca Digital EMOTHE,
de Gemma Burgos (2019) y la de Nadia Revenga (2021), una edición de La
estrella de Sevilla, también en XML-TEI, que puso al alcance del público no solo
la propia edición, descargable, sino el software de publicación, y que luego acabó
por ofrecerse en la Biblioteca Digital EMOTHE complementada con tres traducciones al inglés, francés e italiano.12
Más allá de estas ediciones críticas digitales de obras sueltas que funcionan y
son publicadas y alojadas en sus correspondientes webs creadas en su mayoría ad
hoc, se han puesto en marcha otros dos proyectos que se enfrentarían a la edición
de sendos corpus y ofrecerían así bibliotecas o conjuntos de ediciones críticas digitales.13 En primer lugar, citaremos las “Ediciones críticas” que el Grupo de Investigación Calderón ofrece en su web en la sección así llamada, donde la primera en
publicarse, a inicios de 2021, fue Las manos blancas no ofenden, a cargo de Verónica
Casais Vila. Aparte de ser una edición crítica digital plena, con cómoda visualización de variantes y notas aclaratorias, ofrece también la reproducción digital de los
testimonios; carece de prólogo. Asimismo, desde otra sección de la web, la sección
“Corpus”, se pueden lanzar búsquedas de cadenas de caracteres sobre 33 comedias,
incluidas las tres de las que se ha realizado edición crítica digital. Con estas búsquedas se puede saber la frecuencia de uso de una palabra o acceder a sus concordancias; se ofrecen filtros muy interesantes, aparte de peculiaridades gráficas, como
buscar una determinada palabra en los parlamentos de determinados personajes, o
establecer horquillas temporales.14 Con todo, las “Ediciones críticas” que se ofrecen
como tales en la sección de este nombre hasta el momento son solo tres.
Habíamos mencionado dos bibliotecas digitales: la otra que se está poniendo en marcha en fase beta es la biblioteca llamada Gondomar Digital. La colección teatral del conde de Gondomar. En ella se pretende publicar el interesantísimo corpus de la conocida como colección Gondomar que recopiló, a partir de
1595, Diego Sarmiento de Acuña, I Conde de Gondomar (1557-1626). De
nuevo se trata de ediciones críticas digitales plenas, con posibilidad de visualización de variantes y notas aclaratorias y, en esta ocasión, sí se ofrecen una breve
“Introducción” y una presentación más extensa de “Problemas textuales”. La
(2021). De especial interés, por ejemplo, su presentación de “variantes dinámicas”, es decir, aquellas
que reflejan el proceso creativo del autor que quedó reflejado en pentimenti en el autógrafo.
12. Véase a estos propósitos, también, Marco Presotto (2018).
13. Más adelante nos ocuparemos de la Biblioteca digital ARTELOPE, que no podemos considerar aquí entre las que ofrecen ediciones críticas ni tampoco textos críticos. Tampoco es la pretensión de EMOTHE, aunque ocasionalmente sí haya acogido ediciones críticas y textos críticos
como los ya señalados.
14. Véase Verónica Casais Vila y Santiago Fernández Mosquera (2022). Se entiende que la localización actual de las ediciones en la web del proyecto es provisional y en el futuro se ofrecerán en
una biblioteca digital (383ss.); por el momento han utilizado un esquema XSD para XML y en el
futuro transformarán a XML-TEI.
Editar el Siglo de Oro en la era digital
80
Ramón Valdés Gázquez
web ofrece también una sección de “Búsqueda avanzada” en la que se pueden
buscar palabras o combinaciones, y se puede pedir la búsqueda en cualquier
sección, solo en el texto o solo en las notas, lo cual resultará muy útil para futuros editores. Por el momento ofrece cinco obras en edición crítica.
En el panorama que aquí vamos presentando se puede observar que se están
dando pasos importantes y se empieza a crear un corpus de textos filológicamente dignos, establecidos con rigor, e incluso de ediciones críticas digitales. No
obstante, claro, la abundancia del teatro del Siglo de Oro es tal que, si somos
objetivos, habremos de considerar que estos textos cuidados y estas ediciones
críticas digitales son, proporcionalmente, muy escasos, por mucho que señalen
en una buena dirección. Vayamos ahora al príncipe de los ingenios, paradigma
de la abundancia creativa del teatro del Siglo de Oro. ¿Qué podemos decir?
Testimonios, textos y ediciones de Lope en la red
Comencemos por hacer la misma consulta que cuando hablábamos del teatro
del Siglo de Oro en general. La BVMC nos ofrece un resultado de 640 ítems. De
nuevo hay que recordar que ahí se repiten algunas obras, y que se ofrecen testimonios de todo tipo: desde digitalizaciones (reproducciones fotográficas digitales) en PDF hasta textos en HTML. Es de justicia aplaudir el esfuerzo de digitalización que están haciendo las bibliotecas, y hay que apreciar el valor científico
de los testimonios digitalizados que, directamente en sus catálogos, o a través de
bibliotecas digitales, ponen a nuestra disposición.
Ocuparnos ahora de Lope nos da ocasión para hacer un alto y una reflexión
oportuna para poner en valor los pasos dados en el terreno de la edición crítica
del teatro en coincidencia con los tiempos de la era digital. Más o menos por los
años en que se creaba la World Wide Web y Vern Williamsen y James Abraham
empezaban a compartir sus textos electrónicos en listas de correo, la gran filóloga italiana Maria Grazia Profeti, Premio Nacional de Bibliografía en 1998, reflexionaba y denunciaba respecto a la situación de la edición crítica del teatro de
Lope en torno a 1990:
la tendencia más acusada es la reiterada propuesta de textos bien conocidos (por
ejemplo, se continúa presentando Fuenteovejuna, El caballero de Olmedo, El castigo
sin venganza, etc.). Lo más grave es que sigue faltando un proyecto editorial serio y
programado que prevea la edición crítica del corpus dramático de Lope; se da así el
caso —único, creo, en todas las literaturas nacionales europeas— de un autor fundamental que sigue circulando en ediciones desacreditadas o por lo menos que
obedecen a criterios ecdóticos decimonónicos, completamente superados desde un
punto de vista científico.15
15. La cita procede de Profeti (1992: 173).
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
81
Coincidiendo con esta denuncia estaba dando sus primeros pasos el grupo
de investigación PROLOPE, que se había creado en 1989. Aunque es cierto que
la Parte I de las Comedias de Lope de Vega no vio la luz hasta 1997, es un hecho
que la edición crítica del teatro completo de Lope con el tiempo no fue solo un
proyecto serio y programado, sino que ha llegado a convertirse en una realidad
y un modelo de referencia, pues en 2023 podemos contar ya con la edición
crítica de veintidós partes de comedias (las partes, recordémoslo, eran el formato
de publicación original, género editorial que se creó con Lope, un volumen que
recogía doce obras), o sea unas 250 comedias editadas por investigadores de
todo el mundo tras el acopio y cotejo de todos los testimonios antiguos y el establecimiento de sus textos con riguroso método filológico, además de su anotación y estudio con los oportunos prólogos, aparatos de variantes lingüísticas,
notas onomásticas, listas de erratas, etc. De modo que, respecto a lo que decía
Profeti en 1992, hoy la situación y el panorama de la edición crítica de Lope (en
papel, hay que recalcarlo) ha cambiado radicalmente. Y por fortuna esta reflexión se puede extender a muchos autores del teatro del Siglo de Oro, y es
realmente mucho lo que se ha hecho en los últimos años, así se han abordado en
diferentes proyectos de edición crítica los corpus completos de Calderón, Tirso,
Pérez de Montalbán, Rojas Zorrilla, Vélez de Guevara, Mira de Amescua, Agustín Moreto, Ruiz de Alarcón, Antonio Coello, etc. Si bien es cierto, todos estos
proyectos, con muy escasas excepciones, se concibieron con el objetivo de publicar las ediciones críticas, como decíamos, en volúmenes impresos, no en la red.
Volvamos ahora a Lope y a la red.
¿Qué hay de Lope en la red? Podemos celebrar que en la red encontremos
ya un Lope completo. Si nos fijamos en la cantidad, hay más de trescientas obras
de Lope en la red, lo que nos aproximaría a su completa producción conocida.
Desde los primeros pasos de la BVMC Lope fue un autor bien atendido. No son
ediciones críticas y pueden ser transcripciones modernizadas sobre la base de,
por ejemplo, los impresos antiguos que se habían transcrito antes paleográficamente en TESO (el ya mencionado CD-ROM Teatro Español del Siglo de Oro,
que dirigió Carmen Simón Palmer para Chadwyck-Healey en 1998 y que ofrecía transcripción de ediciones del siglo xvii, aunque no siempre editiones principes). Hay que celebrar que el encargado de llevar la página de autor de Lope y la
inclusión de sus obras fuera Miguel Ángel Auladell Pérez, pues, aunque no fueran ediciones críticas nos regaló ocasionalmente enmiendas muy atinadas, normalmente ope ingenii, aunque sin declarar a veces.16
16. <https://www.cervantesvirtual.com/obra/biblioteca-de-lope-de-vega-0/>, consultada el 5 de
agosto de 2023. Respecto al trabajo de Auladell, puede verse, por ejemplo, el positivo balance de
Daniel Fernández y Clara Monzó (2022: 1035-1036), aunque al lado de buenas enmiendas introdujera también algunos errores propios y careciera de rigor y sistematicidad metodológica (algunas enmiendas las señala, otras no).
Editar el Siglo de Oro en la era digital
82
Ramón Valdés Gázquez
Pero el gran proyecto que ha implicado un paso adelante gigantesco desde
un punto de vista cuantitativo ha sido la Biblioteca Digital ARTELOPE, vinculada a la base de datos y al grupo de investigación del mismo nombre dirigido
por Joan Oleza. En ella se han llegado a incluir hasta hoy nada menos que 314
textos de Lope codificados en XML-TEI, muy cerca de la producción total conservada y reconocida como auténtica. Es importante aclarar que el objetivo de
estos textos era complementar la excelente base de datos ARTELOPE, el objetivo principal del grupo, valiosísimo complemento, claro, si se tiene en cuenta
que, además de poder leer los textos que son el fundamento de su trabajo, se
pueden lanzar además búsquedas de cadenas de caracteres en ellos y sobre el
corpus completo (único lugar en la red y único producto digital en que esto es
posible) que permiten obtener resultados de manera rápida y eficiente. Como
ocurría en la BVMC, no nos encontramos ante ediciones críticas digitales, sino
ante textos marcados en XML-TEI basados en ediciones o textos previos que
son honestamente declarados en la web. Cuando accedemos al texto, en las primeras líneas, en una ficha de presentación, se especifica el texto base de la “edición digital” de la siguiente manera, por ejemplo:
Texto utilizado para esta edición digital:
Las grandezas de Alejandro. Alicante, Biblioteca Virtual Miguel de Cervantes,
1999. Edición digital a partir de: Menéndez Pelayo, Marcelino (ed.), Obras de
Lope de Vega, XIV: comedias mitológicas y comedias históricas de asunto extranjero. Madrid, Atlas (BAE, CXC), 1966, pp. 330-390.
Marcación digital para Artelope:
Souto, Luz Celestina (Artelope)
Aunque en la página de inicio de la Biblioteca aparece un expositor virtual
giratorio automático donde se presentan como “edición digital” (tras especificar
título y autor, en este caso, “Edición digital a cargo de: Souto, Luz Celestina,
Artelope”),17 de nuevo en el estilo de cita propuesto (como ocurría en la ficha de
presentación: “marcación digital”) se deja muy claro, de modo absolutamente
correcto, los límites de lo que es una “codificación”:
Cómo citar esta obra:
Félix Lope de Vega y Carpio. GRANDEZAS DE ALEJANDRO, Tragicomedia,
LAS. Ed. Marcelino Menéndez Pelayo. Codificación digital para ARTELOPE de
Luz Celestina Souto. Artelope. 2015.
<https://artelope.uv.es/biblioteca/textosAL/AL0650_LasGrandezasDeAlejandro.
php>
17. Así, al menos, hasta ahora y en el momento de redacción de este artículo, 6 de agosto de
2023. Quede constancia ya que el diseño de la página de inicio de una web puede cambiar fácilmente.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
83
Se dejan claros los límites filológicos y tecnológicos del trabajo científico acometido y la fuente o edición utilizada como base para la marcación o codificación;
el valor filológico de los textos de esta Biblioteca residirá, por tanto, más en el que
pudieran tener originalmente las ediciones tomadas como base que en el propio
proceso de marcación (que, por supuesto, también tiene valor de por sí, pero
como tal) acometido por ARTELOPE o el investigador que corresponda.18
Con los métodos de trabajo descritos tanto en la BVMC como en la Biblioteca Digital ARTELOPE, podemos decir que hay ya en la red más de 300 textos
de Lope de Vega, lo que es un importante logro en términos cuantitativos. Pero
¿qué hay, entonces, de la calidad de esos textos?
Cantidad versus calidad
Vamos a proponer a continuación un análisis de la calidad de los textos de Lope
que se han publicado en la red. Procederemos primero a un análisis de detalle confrontando algunos textos que encontramos en la red con los de sus respectivas ediciones críticas; veremos luego otros indicios de calidad y estudiaremos y analizaremos con cierto detalle el valor de las ediciones tomadas como texto base para la
producción de los textos de Lope que se han publicado en la World Wide Web.
Así, empezaremos por la comedia El caballero del milagro, que editamos con
Santiago Restrepo para PROLOPE. Al comparar el texto publicado en la web y
nuestra edición crítica para PROLOPE se han podido detectar, en un cotejo por
loci critici, en el de la web, en un proceso típico de transmisión textual, la reproducción pasiva de todos los errores que arrastraba o añadía la edición de los años
noventa que se tomó como base hasta acumular más de treinta errores de la
tradición, y sumar, en el proceso codificación y digitalización, la pérdida de tres
versos íntegros en diferentes lugares de la comedia. Un cotejo exhaustivo tal vez
habría revelado más errores incluso.
Podemos hacer otra comprobación rápida: si miramos los textos publicados
en la red de las comedias de la Parte XXI que recientemente ha editado
PROLOPE,19 veremos que presentan discrepancias en el número de versos, a
veces con la pérdida de dos, cuatro (Ay, verdades, que en amor..., La boba para los
18. Desde un punto de vista más técnico que filológico el proceso era descrito en Carlos Muñoz
Pons (2013: 485) quien proporciona un dato importante. En su proceso podían partir de un
texto ya electrónico generado, por ejemplo, por la BVMC, gracias a un convenio firmado con esta
institución. Las procedencias de sus ediciones han sido múltiples y siempre han quedado correctamente especificadas de la manera ya ejemplificada.
19. Seguimos en esto a Marco Presotto en su intervención en el congreso de la Asociación de
Hispanistas alemanes en Graz en 2023 (“XXIII Deutscher Hispanistentag”, Graz, 22-25 de febrero de 2023). Ya en fase de revisión de este volúmen, recibimos noticia de la publicación Presotto
(2023); como ser verá, en nuestro artículo hay una importante sintonía con sus planteamientos.
Editar el Siglo de Oro en la era digital
84
Ramón Valdés Gázquez
otros, Los bandos de Sena), y en la de El piadoso aragonés se pierden nada menos
que unos 65; en este último caso el texto de la red, sin realizar recensio ni collatio,
toma como base la princeps (a través de la transcripción de TESO) sin tener en
cuenta el autógrafo que nada menos que en 1899 Menéndez Pelayo utilizó para
su edición en la colección de la RAE, la cual no habría generado ningún problema de derechos de copia para su reproducción en la web (de hecho, en otras
ocasiones se han seguido ediciones de Menéndez Pelayo y de la RAE). Así, de las
ediciones disponibles sin derechos de copia vigentes, ni siquiera siempre se han
escogido las mejores.
Algo similar pasa con La batalla del honor, de la Parte VI, cuya tradición
textual conocemos y que, como El piadoso aragonés, dispone de autógrafo. El
texto que se encuentra en la red se basa en la edición de Emilio Cotarelo para la
RAE de 1917 y este, según explicaba en su prólogo, sabía de la existencia del
autógrafo, pero no pudo disponer de él, de modo que el texto base que se codifica para publicar en red prescinde de un manuscrito autógrafo perfectamente
conocido y localizado hace tiempo y utilizado ya en 1934 por Robert K. Spaulding y por Henryk Ziomek en 1972 para sus respectivas ediciones, además de la
nuestra para PROLOPE en 2005. Por otro lado, de nuevo se produce omisión
y errores de numeración que afectan a tres versos (411, totalmente omitido, y
2636-2637; además de un error de numeración a la altura del 1125) de modo
que el texto crítico siempre propuesto, desde los primeros años del siglo xx,
había contado 3125 versos y el que hoy se encuentra en la red cuenta 3122.
Por citar solo un caso más, podemos aludir a El blasón de los Chaves de Villalba, que se publicó en la Parte X. El texto que encontramos en la web tiene
2983 versos, mientras en la edición crítica de José Javier Rodríguez (2010) para
PROLOPE son 3156. Si leemos el estudio textual de José Javier Rodríguez entenderemos perfectamente que la edición de los años noventa que se escogió y
anuncia en la ficha de presentación como base para la codificación y publicación
del texto la web sigue la tradición impresa deturpada por la acción de la censura,
no solamente con la cancelación de esos versos, sino con la sustitución sistemática, por razones diplomáticas del momento, de cualquier alusión a Francia y los
franceses por Albania y los albaneses. El manuscrito apógrafo de Miguel Sanz de
Pliegos y la tradición manuscrita que permitieron a J. J. Rodríguez construir un
texto crítico y recuperar los versos censurados se conoce, asimismo, desde tiempos de Menéndez Pelayo. La acción de la censura y el texto que se ofrece hoy en
la web desfigura por completo una obra que Lope construyó originalmente sobre tramas principales y secundarias, amorosas y guerreras y hechos y personajes
ficticios e históricos (de la guerra entre españoles y franceses por el reino de Nápoles) de importancia para su desarrollo y correcta comprensión. Aparte de las
más de noventa alusiones concretas a Francia y franceses modificadas, entre esos
173 versos desapareció alguna escena completa. ¿Puede tal texto ofrecerse al
público para leer la obra de Lope o ser la base de una investigación seria? Es el
que hoy tenemos en la red.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
85
Si, además de estos errores y deturpaciones que percibimos en obras aleatoriamente escogidas, nos fijamos en las declaraciones de procedencia de los textos
que se publican (buena praxis que hay que agradecer; véase como ejemplo la
remisión a la edición de Menéndez Pelayo en la ficha de ARTELOPE citada de
Las grandezas de Alejandro; de manera similar se ofrece en BVMC), el panorama
no mejora. En esta ocasión nos fijaremos en una muestra de 300 textos (casi la
totalidad del corpus) y la información que en las propias fichas se ofrece, de
modo que las cifras que manejamos son muy representativas, prácticamente descriptivas de una realidad. Atendiendo, insistimos, a la información que en las
propias fichas de presentación se ofrece, veremos que más de 183 textos proceden de ediciones que, cuando menos, podríamos calificar como superadas y
realizadas con criterios del siglo xix o inicios del xx (RAE o BAE, ya fuera Menéndez Pelayo a finales del siglo xix o inicios del xx, ya fuera la conocida como
“Nueva RAE” a cargo de Emilio Cotarelo y otros); otros 50 se basan en las
transcripciones electrónicas que llevó a cabo la BVMC de un determinado testimonio (uno solo, sin cotejo con el resto, normalmente el primer impreso en
Parte) que de la comedia se encontrara en TESO; otros 32 textos se han basado
en las ediciones más recientes, de los años noventa, en Biblioteca Castro, en las
que los editores críticos de PROLOPE suelen detectar problemas. También hay
que considerar entre los textos poco fiables y obsoletos científicamente los cinco
editados por Federico Carlos Sainz de Robles para la Editorial Aguilar, sin información alguna de recensio ni textos base. Excepcionalmente no se ofrece dato
alguno: hemos detectado seis casos. Si sumamos todo lo dicho hasta ahora, algo
más de 280 textos, deberemos considerarlos como no fiables. Unos dieciocho
textos, de los 300, quedan atestiguados como procedentes de ediciones críticas
de filólogos reconocidos (de J. Badía, J. M. Díez Borque, T. Ferrer, R. Froldi, J.
Oleza, A. García Reidy, G. Serés, H. Tropé, A. Zamora Vicente ). Estos textos
que podemos reconocer como fiables (pues proceden de ediciones críticas cuyo
método filológico garantiza su método y establecimiento riguroso) se reducen,
entonces a un exiguo seis por ciento del total de textos presentes en la red.
ANÁLISIS DE LA PROCEDENCIA DE LOS TEXTOS
DE 300 OBRAS DRAMÁTICAS DE LOPE EN LA RED
Editar el Siglo de Oro en la era digital
86
Ramón Valdés Gázquez
La conclusión parece firme e indiscutible: el panorama de la edición crítica
y de los textos fiables del teatro de Lope en la red es desolador, muy similar, lamentablemente, al que trazaba Maria Grazia Profeti respecto a la edición del
teatro de Lope en los años 90. Sus palabras tendrían plena vigencia si las refiriéramos al teatro de Lope publicado en la red a día de hoy, cuando, de hecho, como
antes decíamos, el panorama de la edición crítica no solo de Lope, sino de todo
el teatro del Siglo de Oro, ha cambiado radicalmente, por fortuna. Pero, sin
embargo, ese cambio se ha quedado en los límites del terreno del libro (edición
crítica impresa) y no ha dado el salto a la red, que se ha nutrido de ediciones de
escaso rigor y caducas científicamente, como ya adelantaba muy bien Presotto
(2018). Las denuncias de J. M. Lucía Megías (2009: 17-22) respecto a proyectos
como los de bibliotecas virtuales “de acumulación” que priorizaban la cantidad
sobre la calidad filológica han tenido poca repercusión y ese modo de hacer se
ha perpetuado lamentablemente.20 Lo que por ahora vamos diciendo son datos,
hechos objetivos, no opiniones. Pero vayamos un paso más allá. Porque lo que
aquí se está presentando como desolador, con otra luz o desde otra perspectiva
podría tener su lado positivo —y también por razones objetivas—.
Calidad versus cantidad y velocidad
para la obtención de resultados. Una ganancia
La situación se puede valorar desde distintas ópticas. Si es un hecho que el rigor
y la calidad de los textos de Lope en la red dejan, en general, mucho que desear
y eso es lamentable, ¿no debemos, por otro lado, celebrar como un logro, una
ganancia, contar ya, aunque sea con textos llamémoslos provisionales en vez de
no fiables, de casi toda su producción dramática en la red? Sin duda, no puede
más que considerarse un paso adelante, una ganancia y una aportación de interés contar con ese corpus, y no solo eso, sino que, además, sobre él se puedan
realizar búsquedas a través de la base de datos ARTELOPE.21 Hay que entender
que no se ha pretendido realizar textos críticos, sino sencillamente ponerlos en
20. Por ejemplo: “No se justifica, en absoluto, poner en la Red ediciones ya superadas (o que
nunca tuvieron un valor científico) ni que sean las únicas para dar a conocer determinados textos”
(J. M. Lucía Megías, 2009: 19); aunque Lucía Megías habla, en general, de los textos de la literatura española de la BVMC, sus palabras, como acabamos de ver, siguen siendo perfectamente
aplicables para el teatro de Lope en la red en 2023.
21. Utilizando las opciones de “Búsqueda avanzada”/“Texto de la obra”. Para lanzar búsquedas
sobre el corpus completo basta no seleccionar obra alguna. No hace falta encarecer el interés que
presenta la posibilidad de lanzar búsquedas sobre textos elegidos o filtrados tras la consulta de la
base de datos con los criterios que se hayan estimado oportunos. Aunque las “bibliotecas de autor”
(de Lope y de otros) de la BVMC ofrecían la posibilidad ya de generar concordancias, la cantidad
de comedias de Lope sobre la que se lanza la búsqueda en ARTELOPE, 314 hoy (otoño de 2023),
la convierte en la mejor opción.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
87
la red y en acceso abierto, lo cual no es poco. Pero la cuestión es saber si el usuario es consciente de los límites y problemas que ello implica y si sabe que está
leyendo o consultando texto científicamente no fiable para según qué fines.
La elaboración de ediciones críticas con rigor filológico y su puesta en línea
en webs de calidad digital presenta una complejidad y dificultades que han llevado a la realidad que también antes comentábamos. Existen buenas ediciones
críticas digitales ya disponibles en la red, pero son pocas, exigua minoría. Su
elaboración implica casi la realización y diseño de webs ad hoc22 y resultados
proporcionalmente escasos, ricos en calidad de resultados, pero pobres en cantidad. Así entra en juego un tercer factor. No conviene tener presentes cantidad y
calidad, sino también velocidad.
Y es que la velocidad en la obtención y publicación de datos, en los inicios
de esta era digital que hemos alcanzado, se está revelando también como uno de
los factores determinantes en procesos de investigación.
La estilometría, que tantos avances relevantes y apasionantes está proporcionando en los ultimísimos años en nuestros conocimientos del teatro del Siglo de
Oro tiene como punto de partida y materia prima el texto, obviamente.23 Y de
nuevo, desde esta perspectiva, hay que considerar un logro la cantidad de textos
a disposición y la velocidad con que se han puesto al alcance de los investigadores. Para el proyecto Estilometría aplicada al Teatro del Siglo de Oro (ETSO) es
fundamental alimentar a la máquina con el máximo número de textos posible.
“Cuanto más numeroso sea el conjunto de piezas teatrales y dramaturgos, en
general, mejores y más fiables serán estos análisis” (Cuéllar 2023: 103). Aunque
siempre que han podido en ETSO han contado con las mejores ediciones gracias
a su colaboración con distintos grupos de investigación, no siempre los textos
eran los ideales (ibidem). Pero es que, para este objetivo parece ser poco relevante que sean textos críticos o sencillamente transcritos (incluso de modo automático con uso de Transkribus) de un solo testimonio no especialmente autorizado
ni revisado. Para entendernos: para la estilometría es más importante contar con
gran cantidad de textos que con textos de gran calidad (hablando en términos
filológicos). Según explica Álvaro Cuéllar (2023: 111-112):
Afortunadamente, las pruebas estilométricas, las cuales tienen en cuenta el uso de
las palabras más comunes, parecen no verse especialmente afectadas por un porcentaje irrelevante de errores en la transcripción, que suelen producirse especialmente
en palabras poco comunes. Los resultados estilométricos, por tanto, son muy simi-
22. Es cierto que se está procediendo a la creación de entornos de publicación prediseñados, pero
a medida que aumentamos nuestras exigencias (sin ser extravagancias), esos entornos resultan
demasiado pobres y los que son más ambiciosos y adaptables, requieren ya la intervención de
programadores. Véase al respecto Alvite y Rojas Castro (2022: 7-14).
23. Concretamente para Lope de Vega será de interés la consulta de Vega García-Luengos (2021)
y (2023) como la página de ETSO y todos los avances que está realizando con Álvaro Cuéllar.
Editar el Siglo de Oro en la era digital
88
Ramón Valdés Gázquez
lares con obras procedentes de ediciones cuidadas y con obras procedentes de la
transcripción automática. Esto quiere decir que los textos son perfectamente útiles
para su análisis estilométrico.
A efectos de la estilometría, la acumulación de errores en unos treinta
“tokens” sobre un total de tres mil versos (¿de cuántos “tokens” estamos hablando? unos cuantos miles más, sin duda, podemos multiplicar por seis, por siete )
es por fortuna irrelevante. Recuérdese que en el proceso de trabajo mencionado
se incluye la transcripción automática con herramientas o plataformas como
Transkribus, y en esa transcripción automática se cuenta e incluye explícitamente una porción de inevitables errores (no ya solo los propios del testimonio utilizado, sino los añadidos por el propio Transkribus, por mucho que se haya entrenado y mejorado el modelo):
Las transcripciones resultantes contendrán numerosos errores y problemas, pero
nos pueden ser útiles para diversos propósitos, como constituir el texto base para
una edición cuidada posterior, realizar búsquedas en ellos o su procesamiento con
análisis estilométricos de autoría, como es nuestro caso ahora. Estudios como el de
Eder [2013] y nuestra experiencia con las pruebas informáticas nos apuntan que un
porcentaje de error en las transcripciones no influye en gran medida en los análisis
estilométricos, porque, además, estos suelen basarse en las palabras más frecuentes,
que responden bien a los procesos automáticos de transcripción. (Cuéllar y Vega
García-Luengos 2023: 135)24
Efectivamente, los avances y las conclusiones de Cuéllar y Vega (y lo que en
estas líneas sostienen) parecen sólidos solamente con observar cómo se agrupan
coherentemente en sus diagramas o redes estilométricas los textos de los distintos autores sin importar si estos proceden de ediciones críticas, de testimonios
concretos o de transcripciones obtenidas automáticamente aun con su porción
24. Creo necesario matizar que, sobre la base de mi experiencia como editor de textos, no me
parece buena idea partir de un texto que lleve no solo los errores del testimonio que se digitalice,
sino los de un procedimiento de transcripción automática que sabemos imperfecto. Con mucha
probabilidad se acarrearían en el texto crítico, incluso después de procesos de fijación y revisión,
errores de ambos (tanto del testimonio digitalizado, como los errores del proceso automático de
transcripción). Me parece mejor, en cambio, una transcripción, por el momento, humana, con los
errores inevitables a revisar y corregir que ello comporte, del testimonio que se prevea elegir como
texto base para la constitutio textus. Una idea como la expuesta solo debe partir de un conocimiento muy profundo tanto de los principios y métodos de la Crítica Textual como de la complejidad,
riesgos y problemas ecdóticos que comporta por ahora el uso de sistemas de transcripción y adquisición de textos a través de hardware y software informáticos (y de los problemas y deficiencias de
todo el proceso, obtención y tratamiento tanto de la imagen con escáner como del texto con OCR
y tecnologías aliadas). Incluimos en nuestra bibliografía la referencia de Eder (2013), en cuyo estudio lo que se proponía precisamente era “to verify the impact of unwanted noise in a series of
experiments” (abstract), en línea absolutamente concordante con lo propuesto por Cuéllar, a
quien agradecemos su ayuda en este tema.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
89
de errores (aspecto al que han prestado especial atención para validar sus resultados). Es posible que basarse en ediciones críticas o limpiar, cuidar y estructurar
los messy, dirty, raw data produjera más y mejores resultados, pero lo que ya se
está consiguiendo, desde luego, resulta impresionante e inapelable (¡e imparable!). Por otro lado, la manipulación o limpieza de los messy, raw data no está
exenta, paradójicamente, del riesgo de incluir sesgos indeseables y perjudiciales
para la propia investigación estadística.
En conclusión, en el desarrollo y avance de determinadas líneas de investigación, trabajar con textos no fiables no es que pensemos que pueda ser útil, sino
que sabemos ya positivamente que lo es (o por decirlo con mayor verdad: no es un
grave inconveniente y permite avances). Y desde esta perspectiva, el haber alcanzado la nada despreciable cifra de más de trescientas obras de Lope en la red,
aunque sea en textos filológicamente no fiables o provisionales, se debe valorar
como una ganancia, un logro por el que debemos dar las gracias sinceras a quienes lo han llevado a cabo y que permite realizar, entre otras, las investigaciones
estilométricas que mencionamos.
Fast y Slow Science: uberización y tuiterización de la ciencia
en el ámbito de las Humanidades Digitales
Con todo, como prometíamos, queremos analizar la cuestión desde diferentes
perspectivas, buscando un balance de ventajas e inconvenientes, y merecerá la
pena hacer también otros planteamientos no tan optimistas. Tal vez el principal
problema ya lo hemos expuesto: la falta de advertencia para el usuario de que los
textos no son fiables para según qué operaciones, entre ellas una tan esperable y
lógica en una biblioteca como es la lectura del texto. ¿Se le advierte de que el
texto que se le ofrece no es fiable o presenta limitaciones de fiabilidad? ¿Sabe que
en El piadoso aragonés faltan más de sesenta versos de la obra que escribió Lope?
¿Lo saben ni podrían imaginar los investigadores que no tienen una especial
formación, interés ni preocupación por las cuestiones ecdóticas y que encuentran la obra al alcance de un cómodo clic ignorando su historia textual?25
25. Sobre las dificultades del lector/usuario de la red para reconocer los textos de calidad, más
desde el punto de vista de la curation data, pero también de la calidad filológica por principios y
métodos establecidos por la comunidad científica, véase las reflexiones de Anne Baillot (2023):
“The unsorted wealth of textual material that can be found online requires proper training for the
reader or user to recognise online text quality” (p. 84); “So let us ask again: how can a reader recognise a good text from a poor one, and how can we foster access to the former and/or discourage readers from turning to the latter?” (p. 102), para definir luego como “A digital text of high
quality is one that is freely available to all, in a format that makes adding further information
possible, in the form of annotations, of hyperlinks, of transcriptions, of visualisations, of sonifications, and more, and which can be submitted to quality control, such as scholarly quality assessment” (p. 106); “Digital texts follow quality criteria that go beyond and add up to the editorial
Editar el Siglo de Oro en la era digital
90
Ramón Valdés Gázquez
Ya hemos visto cómo, una vez dado el salto a la red, los textos, en una filosofía colaborativa lícita y deseable, se van reutilizando y diseminando entre unas
bibliotecas y otras (incluso libros impresos), así como para unas investigaciones
u otras. El problema llega cuando, como es el caso, esos textos contienen errores.
Entre los de Lope, probablemente un 94% de los que se encuentran en la red,
como hemos visto. Así, uno de estos textos no fiables, que no han sido establecidos con rigor y método, con sus errores, pueden ser reproducidos y reutilizados en otras webs y servir de base para estudios de investigación, por ejemplo, de
segmentación, donde la calidad textual es especialmente relevante, u otros muchos estudios de carácter interpretativo y hermenéutico. Parecería que el nuevo
contexto digital nos obliga a una nueva defensa de la importancia de la calidad
del texto y de la utilidad y necesidad de la Crítica Textual que ya habían quedado demostradas hace años, como si hubiéramos dado, en este terreno, un paso
atrás. Sin embargo, esa calidad y rigor en el procedimiento depende a su vez de
otro valor a la baja: la ciencia lenta (slow science).
En toda la parte inicial de este artículo hemos contado cómo empezaron a
compartirse y difundirse en la red los primeros textos del Teatro del Siglo de
Oro porque queríamos dejar claro cómo de manera inmediata, espontánea, incluso loable —ejemplo de generosidad científica e intelectual— se habían compartido incluso transcripciones provisionales preparadas con el único fin de dar
clases. Es un hecho que lo que nos ofrece la tecnología se ha convertido, en
cierto aspecto, en una especie de canto de sirena, de fuerte tentación que ha
llevado a dar algunos pasos de una manera algo irreflexiva y precipitada sin calcular desde los posibles riesgos relativos a los derechos de autor y el reconocimiento de la autoría intelectual, hasta la calidad y valor científico mínimo, definitivo o provisional de lo que publicamos. En los inicios de la era digital esto
podría parecer disculpable, pero unos treinta años después cabe reflexionar y
plantearnos si podemos seguir actuando de la misma manera.
En un artículo que contiene un ataque que tildaríamos de tremendamente
injusto e incluso falaz (perdón por la franqueza) contra las Humanidades Digitales por muchos conceptos, Eduard Aibar (2018) no dejó de llamar la atención
sobre algunos puntos que nos deberían invitar a reflexionar.26 Cómo, hasta cierto punto, nos hemos dejado seducir por lo que nos ofrecía la tecnología sin suficiente meditación ni espíritu crítico y nos hemos lanzado a la rápida publicación de resultados inmaduros o de baja calidad guiados por un afán de
competencia, más que de excelencia científica. En cierto modo esta idea está en
norms that were developed over the past centuries” (p. 108); no está de más notar que plantea en
idénticos términos la tensión entre cantidad y calidad en la información publicada en la red: “The
tension is also one between the quantity and quality of digitised information” (p. 95).
26. Aunque Aibar no lo cita, algunos de los temas por él puestos sobre la mesa ya los había tratado Alan Liu (2012) en un artículo de referencia obligada por su visión autocrítica de las Humanidades Digitales.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
91
la misma línea que lleva el movimiento que aboga por una ciencia lenta, que
denuncia los errores y “las precipitaciones de la ciencia rápida” (Carlos Eduardo
Maldonado, 2021).
Volvamos a plantearnos la legitimidad de los resultados cuantitativos de
baja calidad en aras de alimentar a la máquina (parafraseo, no cito: “necesitamos
un gran volumen de datos, o sea, muchos textos, aunque sean de baja calidad,
para realizar nuestras investigaciones y esa cantidad de textos implicará mayor
calidad en nuestros resultados”). Una autoridad del calibre de Christoph Schöch,
conocedor profundo de las necesidades y de las dificultades de la investigación
en las Humanidades Digitales, llegaba a la conclusión y hacía a la vez un llamamiento sobre la necesidad de atender no solo a los Big data (la estilometría maneja Big data)27 sino también los Smart data. En este sentido, la urgencia de
alimentar a la máquina para acometer proyectos que involucran Big data no se
debería (aunque se pueda) hacer sobre la base de datos sucios, desestructurados,
crudos, sino que también para esos proyectos, siempre será mejor contar con
datos limpios, estructurados, cuidados, fiables. Por eso, Schöch (2013) propone
el concepto de Smart big data:
we need smart big data because it can not only adequately represent a sufficient number of relevant features of humanistic objects of inquiry to enable the level of precision and nuance scholars in the humanities need, but it can also provide us with a
sufficient amount of data to enable quantitative methods of inquiry that help us
transgress the limitations inherent in methods based on close reading strategies. To
put it in a nutshell: only smart big data enables intelligent quantitative methods.
En definitiva, y aunque valoremos como ganancia desde alguna perspectiva
la cantidad de textos de Lope y otros autores a pesar de ser textos no fiables que
se han procesado informáticamente y publicado en la red, de cara al futuro sería
conveniente, tal vez, domar esta ciencia “desbocada”28 y actuar con prudencia y
responsabilidad filológica (lo es ya que los directores de TEXORO decidan no
publicar en línea los textos transcritos automáticamente, sino que solo informe
sobre su existencia y permita lanzar búsquedas sobre ellos). En la medida de lo
posible, deberíamos elaborar programas escalables de trabajo que impliquen un
avance ordenado y sobre fundamentos sólidos, para alcanzar Bigger & Smarter
data. Y a la vez, y a partir de ahora, en la medida de lo posible, respetar, abogar,
promover e incluso luchar por la dignidad del texto clásico en la red.
27. Una de las muchas definiciones posibles de qué son Big data alude a las necesidades de procesamiento de dichos datos por superordenadores, como es el caso en el proyecto ETSO, no solo por la
estilometría, sino también por las transcripciones automáticas masivas de textos con Transkribus que
han requerido. Téngase presente que hablamos no solo de miles de obras y autores, sino del procesamiento y comparación en múltiples planos o dimensiones de millones de versos y de “tokens”.
28. Tomo la imagen de Carlos Eduardo Maldonado (2021).
Editar el Siglo de Oro en la era digital
92
Ramón Valdés Gázquez
El asedio al texto y al rigor filológico en el contexto digital:
el atropello de la realidad práctica y el embate teórico
Frente a los deseos recién expresados de cara al futuro, tenemos ya, como decíamos, una realidad práctica que nos ha atropellado, se nos ha echado encima, y
es la que hemos descrito y valorado desde distintas perspectivas (incluso positivas) y que conviene asumir. Pero no solo nos ha atropellado esa realidad práctica, sino que podríamos hablar incluso de cierto “embate” teórico. Tanto desde
la realidad práctica que implica la difusión y multiplicación de textos no fiables
en la red, como, incluso, desde la teoría actual de la edición en un contexto digital parece cuestionarse la pertinencia y necesidad de la edición crítica, la exigencia de un rigor textual filológico.
Los tiempos digitales han aportado debates, planteamientos y propuestas de
edición de indudable interés: desde la edición colaborativa y “social” a la “paradigmática” o la “documental”; la fluidez del texto frente a la propuesta de un único
texto crítico; valoraciones tan diversas como que estamos ante una “revolución” o
que solamente cambia el medio de presentación y visualización de los mismos
productos y datos (las ediciones, los textos) de siempre realizados con distinta
tecnología y posibilidades, sí, pero, a fin de cuentas, con el mismo método.29
Así, por ejemplo, Patrick Sahle (2016), autoridad donde las haya sobre lo que
es una edición académica digital, exalta su valor documental y las facilidades que
ofrece para presentar el texto —y su presentación en la propia edición como pu-
29. Una de las falacias sostenidas por Eduardo Aibar (2018) es la acusación a las Humanidades
Digitales de una escasa y, cuando la hay, endeble, reflexión teórica y crítica sobre la materia; siendo una falacia en lo que respecta a las Humanidades Digitales en general (basta recordar toda la
web y línea de estudios Debates in Digital Humanities, entre otras muchísimas publicaciones que
no tengo lugar para listar), también lo es y afectaría esto específicamente a los distintos ámbitos de
aplicación, como el nuestro: la edición digital. Desde luego, las reflexiones teóricas sobre qué
implica la digitalidad en el ámbito de la teoría y la práctica ecdótica han sido numerosísimas y
muchas de extremo interés, incluyendo también aproximaciones escépticas o autocríticas. Por
recordar solo a unos pocos estudiosos e hitos, y ahora sí nos detenemos, por ser nuestra materia
específica, mencionaremos Charles B. Faulhaber (1991), Peter Shillingsburg (1996) y (2006);
Domenico Fiormonte (2003); Hans Walter Gabler (2010); Peter Robinson (2012); el monográfico de la revista Ecdotica coordinado por Bárbara Bordalejo (2013), con las aportaciones de
Bordalejo misma, Paul Eggert, Hans Walter Gabler, y, de nuevo, P. Robinson y P. Shillingsburg;
Patrick Sahle (2013); los artículos de Andrews, Fischer, y de nuevo Robinson en el vol. X (2013)
de la revista Variants; el colectivo de Daniel Apollon et al. (2014); el número monográfico del
Anuario Lope de Vega coordinado por Ramón Valdés (2014), especialmente con las intervenciones
de Paul Spence y Francesca Tomasi; Alexandra Haehnert (2015), Elena Pierazzo (2015); el colectivo de James Matthew Driscoll y Elena Pierazzo (2016), que recoge contribuciones de Marina
Buzzoni y de nuevo P. Sahle; P. Robinson (2016), Dirk Van Hulle (2016), Susanna Allés-Torrent
(2017), Roman Bleier et al. (2018), B. Bordalejo (2018), A. Rojas Castro (2018), de nuevo S.
Allés-Torrent (2020), Paola Italia (2020), Baillot y Busch (2021) y M. L. Alvite y A. Rojas Castro
(2022), así como las guías e informes emitidos por la MLA (2011), (2012) y (2016). Y son solo
unos pocos, o poquísimos, de los que se podría y debería citar.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
93
blicación— como un proceso fluido y una “empresa abierta” a través de sus testimonios más que de un texto autorizado e impuesto por el especialista. Sin embargo, ante tales propuestas, sin duda arriesgadas si se llevan a sus últimos términos,
Alexandra Haehnert (2015: 14-15) advertía, recordando a Robinson y Fraistat,
del peligro de convertir los proyectos de edición de las obras en meros silos de
datos, imágenes o testimonios; difícilmente vastos archivos o repositorios de imágenes y transcripciones diversas serán útiles para el lector (subrayo, lector), que
rara vez se acercará a la obra con un conocimiento ni curiosidad ecdótica suficientes para digerir y entender toda la información.30 Esto venía a plantearse también
Susanna Allés-Torrent en (2020) cuando preguntaba, provocadora, desde el título
de su artículo “¿dónde está la crítica en las ediciones digitales?”. Podemos admitir
que determinados contextos de investigación y difusión científica hagan ideal subrayar la fluidez del texto y el acceso a los testimonios primarios (recordemos que
Patrick Sahle es historiador, no filólogo), pero es necesario reivindicar la responsabilidad del editor ante el lector que, salvo casos de versiones creadas por el propio
autor o testimonios de especial interés histórico (ediciones “históricas”),31 debe
ofrecer un texto, uno, lo más depurado y autorizado posible, pues no le vamos a
pedir al lector que lea y conozca todos y cada uno de los testimonios de la tradición
textual de una obra. No es su obligación ni su capacidad ni su tarea; ni siquiera,
diríamos, la del investigador no interesado o formado en Crítica Textual.
Efectivamente, la edición crítica y el método riguroso de establecimiento de
textos siguen siendo, en nuestra era digital, tan necesarios como siempre y en cualquiera de los casos no podremos decir que textos que han sido marcados en XMLTEI sin un rigor filológico, por mucho que sean digitales y hayan emanado en
proyectos académicos son “ediciones digitales académicas”, pues (y por eso decíamos antes que parece, engañosamente, que la palabra “académica” permita una
relajación del método y rigor filológico) si acudimos al propio Patrick Sahle (tan
poco sospechoso de estar anclado en viejos métodos y conceptos de edición), veremos que una edición que no sea “crítica” no merecerá la categoría de “edición digital académica”. Dos de las cuatro preguntas que Sahle se planteaba al hacer su catálogo de ediciones digitales académicas, previas y definitorias por tanto del objeto y
requisitos para considerarlas como tales, son las siguientes, en sus palabras:
2. Is it critical? Have rules for the processing of the material been stated and substantiated? Have these rules been applied in the light of the relevant scholarly
30. Haehnert (2015: 14-15): “vast archives of images and transcriptions are hardly useful for the
reader who does not approach the work they represent with an in-depth understanding in the first
place. Not that such archives and digital facsimile editions are useless —on the contrary— but
they are hardly critical”.
31. Más allá del debate digital, desde una óptica puramente filológica, véase al respecto las interesantísimas aportaciones y reflexiones de Claudio Giunta (1997) sobre las “ediciones históricas”;
y sobre estas, con alguna consideración digital, Valdés (2012: 414-417).
Editar el Siglo de Oro en la era digital
94
Ramón Valdés Gázquez
knowledge on the material, its genesis, its contexts and its reception? Does the
edition add information to the representation making it more accessible, understandable and usable?
3. Is the edition of academic quality? Have the rules been applied rigorously and
in a transparent manner? Are the responsibilities stated clearly? Does the edition
suffice as a substitute for the previous editions or primary documents making it
unnecessary to go back to them in most cases? Does it enable further scholarly
research on a reliable and trustworthy basis?
Así pues, si no es sobre unas bases metodológicas ecdóticas sólidas y confiables y sobre el conocimiento y discusión de la tradición textual de una obra, no
podremos considerar una edición digital —ni tanto menos un texto digital—
como una “edición crítica digital”, claro, pero tampoco, porque en parte es lo
mismo, ni siquiera una “edición digital académica” (pongo el ni siquiera en
cursiva porque lo utilizo aquí irónicamente, frente a los que piensan que una
edición digital académica tiene menos requisitos de rigor u obligaciones de método filológico). Y solo con ese método se pueden alcanzar textos y propuestas
(hipótesis de trabajo) sólidos académica y científicamente. Fin de la cuestión.
¿Significa eso que solo es posible hacer ediciones digitales rigurosas según un
único método, que es el nuestro? Obviamente, no seremos tan presuntuosos ni
estúpidos como para mantener tal cosa. Los métodos rigurosos para realizar ediciones siempre han sido diversos y, podríamos decir, se han “ensanchado” incluso,
como veíamos, en la era digital. Y pueden ofrecer un texto crítico a través del estudio de distintos testimonios, o, por el contrario, ediciones históricas o documentales (según la preferencia de denominación de Sahle) según el interés científico de
esos testimonios; las ediciones podrán ser más especializadas o más divulgativas,
sociales, colaborativas, dinámicas, sinópticas, paradigmáticas, etc. Y todo ello puede hacerse de manera rigurosa y tremendamente útil dependiendo de nuestro
objeto de trabajo, nuestra declaración honesta de objetivos y propósitos y nuestro
interés. Pero no podremos considerarlas ediciones digitales académicas si no se
hacen según métodos establecidos por la Crítica Textual ni, en ningún caso, convendrá difundir textos deficientes o insuficientemente documentados.
Conclusiones (I).
Ilustración, defensa y propuesta de una Biblioteca digital
PROLOPE de ediciones críticas en línea
Por supuesto, si nos dedicamos a la edición del teatro del Siglo de Oro, lo que
se encuentre o no en la red a estas alturas es una responsabilidad también nuestra. Si en el grupo PROLOPE hemos editado y disponemos de más de doscientas cincuenta ediciones críticas de comedias de Lope publicadas en papel a lo
largo de nuestra trayectoria de más de treinta años, es nuestra responsabilidad
también ahora hacer lo posible por ponerlas en la red. Ahí cabe entonar un mea
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
95
culpa por el tiempo que nos está llevando lograrlo, pues desde 2012 ya nos marcamos ese objetivo, aunque ese mea culpa lo podemos entonar al mismo tiempo
que defendemos y destacamos los logros, ya realidades, de, sobre todo, La dama
boba dirigida por Marco Presotto (2015), pero también de la edición divulgativa y multimedia en línea de Mujeres y criados coordinada por Sònia Boadas y
Ramón Valdés, en 2014. Sin embargo, el gran reto asumido por PROLOPE y
pendiente desde 2012, obviamente, era poner en la red su producción principal,
el corpus completo de las ediciones críticas de las comedias, y para ello ha diseñado la Biblioteca digital PROLOPE, una web que ofrecerá la oportunidad de
leer en ediciones críticas solventes el corpus del teatro de Lope, además de la
descarga de los archivos en diversos formatos, instrumentos de búsqueda y de
análisis. Esta Biblioteca, cuya realización ha implicado un importante y sostenido esfuerzo en los últimos años, responde a un proceso de transformación digital (no una mera digitalización o escaneado y puesta en línea en PDF)32 a través
del cual pretendemos ofrecer en acceso abierto y con sus funciones y potencialidades digitales esas ediciones críticas que hemos venido publicando en papel en
toda su extensión, riqueza y complejidad, textos, prólogos, notas, aparatos, etc.
En lo que venimos observando, serán ediciones más extensas y completas que las
de otras bibliotecas digitales porque entendemos que el medio de publicación,
la red, no obliga a una abreviación o aligeramiento (empobrecimiento, “tuiterización”) de contenidos y nuestro público objetivo no va a cambiar: un lector
especializado. Por contra, ofrecerlas en toda su riqueza filológica y con su funcionalidad digital implica una ganancia en términos de eficiencia en su uso con
posibilidades de lectura, consulta y realización de búsquedas y descarga y reutilización por otros investigadores. Por otro lado, aunque no se conciba como
proyecto divulgativo, sino de difusión, la publicación en acceso abierto también
32. Respecto a la diferencia entre “digitalización” (por influencia del inglés muy asociada a procesos de escaneado y 3D) y “transformación digital” en un contexto humanístico y de edición
digital, véase Baillot (2023: sección 2), aunque en realidad el concepto de “transformación digital” es de aplicación para el reto que, en cualquier ámbito, supone la aplicación de la tecnología
digital para la humanidad; la “transformación digital” implica repensar lo que el ámbito digital de
publicación ofrece a nuestro objeto de estudio y procurar explotarlo en todas sus posibilidades.
Digamos que, en términos de economía y comercio, una transformación digital implica exactamente lo mismo y por eso el concepto no es de aplicación solo en el ámbito de las Humanidades
Digitales. En términos ecdóticos se podría hablar de la distancia que hay entre el mero escaneado
de una edición en papel y todas las funcionalidades que la tecnología digital puede ofrecer en el
nuevo ámbito de estudio y presentación. Por eso, como bien dice Sahle, otro de los rasgos definitorios de una edición digital es que no se puede convertir en libro (o sencillamente escanear,
captar y estabilizar en un PDF) sin una pérdida fundamental e importante del valor y funcionalidades que aporta, precisamente, su tecnología digital (“A digital edition cannot be given in print
without significant loss of content and functionality”, s. p.; es algo que ha costado hacer entender
a los bibliotecarios en una fase en que solo nos ofrecían repositorios de documentos estables). Por
supuesto, aquí son también de aplicación todas las reflexiones y debates sobre el advenimiento de
lo digital en el terreno ecdótico, que ya hemos mencionado en la nota 21.
Editar el Siglo de Oro en la era digital
96
Ramón Valdés Gázquez
permite de por sí que se acerque el público general (y más amplio que el de la
publicación en papel), que junto al especialista tendrá, como en otras bibliotecas
digitales, el texto a su disposición con el apoyo de esas notas y detallados prólogos ya mencionados.33 En la sección de “Presentación” de la Biblioteca se explican todos los principios y criterios que rigen el proyecto, y que son, fundamentalmente, los ya asumidos en un escenario de Humanidades Digitales y de
Ciencia y Cultura Abiertas de uso de lenguajes de marcado difundidos (prácticamente estándares), es decir XML-TEI, cumpliendo con sus directrices y recomendaciones de buenas prácticas, así como los principios FAIR (Findable, Accesible, Interoperable, Reutilizable). Todo ello, sin rebajar un ápice las exigencias
filológicas, sino más bien reforzándolas con nuevas fases de revisión, además de
complementar el resultado con las potencialidades y funcionalidades digitales
(visualización opcional e intuitiva de notas y variantes, posibilidades de búsqueda en prólogos, texto o notas, generación automática de aparato crítico, descarga de archivos en distintos formatos, hiperenlaces a testimonios, etc.).
Esto implica también todo un posicionamiento, una defensa y declaración
de principios ecdóticos frente a esa realidad de una ciencia rápida que nos atropella y que inunda la red con textos poco fiables, y frente a posturas teóricas
ambiguas sobre lo que significa la edición y el texto en el ámbito digital y en la
red. Un ámbito que merece tanto respeto y un trabajo tan serio como el ámbito
“analógico” o el formato libro (donde difícilmente se publicarían resultados
provisionales o con conciencia de contener errores). Defendemos la pertinencia
de la edición crítica digital y su difusión en la red con textos críticos filológicamente fiables, definitivos, en tanto que conclusión y plasmación de un proceso
de investigación riguroso. Esto conviene aclararlo y defenderlo especialmente
ahora, ante la realidad de los textos que se han publicado en la red y en momentos de cierta confusión o pérdida de respeto a nuestro principal objeto de trabajo y materia prima, el texto, y a lo que la “edición crítica digital” o “edición
académica digital” implican.34 Independientemente de si vamos por vías neola-
33. PROLOPE no descarta, más bien al contrario, ya está pensando y se está involucrando en
acciones de investigación y transferencia dirigidas a otros públicos, pero no es este el lugar para
explicarlo. Con todo, aparte de recordar la edición de Mujeres y criados en línea y las exposiciones
(ya tres) en que se ha involucrado o ha promovido el grupo, sí podemos anunciar ya una edición
social y archivo digital de Fuenteovejuna a cargo de David Merino Recalde (se trata de su proyecto doctoral). Para una inteligente reflexión sobre la consecuencia de la mera puesta en línea y la
interactividad y adaptabilidad de las pantallas a diferentes posibilidades de lectura y públicos más
allá del especialista, véase Baillot y Busch (2021).
34. En la tradición anglosajona la “scholar/scholarly edition” era una etiqueta abarcadora que
permitía aludir a lo que podríamos llamar ediciones realizadas con un método riguroso, fuera el
que fuera, como el de la bibliografía material, la crítica textual neolachmaniana o enfoques eclécticos. Sin embargo, ahora, en ámbito hispánico y tiempos digitales (antes nunca había tenido
fortuna), se está imponiendo su uso, pero vacío de significado, como si una edición académica
pudiera responder a muchas modalidades e inquietudes (que sí), incluso sin un requisito de rigor
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
97
chmanianas, o de la edición ecléctica, o tenemos muy presentes a la crítica genética o la bibliografía material, o las nuevas modalidades de edición surgidas con
la era digital y las reflexiones que ha comportado, si realizamos ediciones críticas
o de testimonios únicos por su especial interés, hay unas exigencias mínimas de
rigor que nos permiten decir que hemos editado un texto fiable de una obra en
un ámbito académico, científico, filológico. Solamente si procedemos a una recensio, a la localización, estudio y análisis de los testimonios de la tradición de
una obra y su collatio, su análisis y estudio, podremos realizar luego la selectio o
la emendatio, la constitutio textus de manera rigurosa y, al menos, estos pasos son
imprescindibles. Podremos adoptar o no un texto base, utilizar enfoques neolachmanianos, eclécticos u otros, realizar ediciones críticas o documentales, según
la situación textual y nuestros objetivos, pero siempre unas bases teóricas y metodológicas ecdóticas y un conocimiento riguroso de la tradición textual para
alcanzar y ofrecer un texto filológicamente riguroso y fiable.
Conclusiones (II).
Una estrategia de Minimal Computing para poner textos
en la red compatibilizando calidad, cantidad y velocidad
Con todo, por claros que tengamos nuestros posicionamientos teóricos y el valor
científico de nuestros logros, la realidad práctica, como hemos visto, insistimos, nos
atropella. Como veíamos, la realización de ediciones críticas digitales, más aún, de
bibliotecas o repositorios de ediciones críticas digitales resulta lenta y laboriosa.
Tras varios años de trabajo, la Biblioteca Digital PROLOPE se publica con tres títulos, como veíamos que pasaba con las bibliotecas digitales similares en ambición de
Calderón o Gondomar. Cabe esperar que, tras el costoso proceso de diseño, creación y puesta en marcha de la web, los procesos de codificación se aceleren, pero
aún así, seguirá siendo un trabajo lento. Por eso, no parece que esa vía pueda revertir a corto plazo la cuestión de la calidad deplorable de los textos de Lope y la escasez de textos fiables que hoy encontramos en la red. Frente a esta urgencia, tal vez
las soluciones de Minimal Computing ofrezcan una alternativa viable.35
científico ni metodológico en el específico ámbito del establecimiento del texto (que no). Véase
especialmente Paul Spence (2014) y Susanna Allés-Torrent (2020).
35. Sobre el Minimal Computing como una vía estratégica, abierta y accesible, altamente preservable, robusta e interoperable que cumple los principios FAIR y puede ser la respuesta más adecuada para algunos proyectos, véase Gil y Ortega (2016) así como Liviu Pop (2017) y la webgrupo de trabajo Minimal Computing con sus “Thought Pieces”. Aparte de estas referencias de
carácter teórico, se pueden tomar como modelos punteros que utilizan estas tecnologías, el curso
Programming Historian, la revista Archipelas. A journal of Caribbean Digital Praxis, o ediciones y
colecciones textuales (como el The CLiGS textbox) y los proyectos de Ediciones digitales con Minimal Computing o el Mini Lazarillo.
Editar el Siglo de Oro en la era digital
98
Ramón Valdés Gázquez
Dado que uno de los formatos más interoperativos y que más se está utilizando (y demandando por colegas investigadores) es el .txt, además de seguir adelante con la Biblioteca Digital PROLOPE en el formato XML-TEI y el desarrollo de
sus potencialidades digitales, nuestro grupo de investigación se ha planteado la
digitalización masiva de los textos editados en simples archivos .txt, en texto plano, con el diseño de interfaces básicas para su descarga, lectura y la realización de
búsquedas simples sobre cada uno de los archivos o sobre el conjunto o corpus.
Tal vez el mayor reto, en esta ocasión, sea la fiabilidad y fidelidad de esa conversión
en que, partiendo de los soportes en que conservamos nuestras ediciones (o bien
los documentos Word en los que se enviaron a la editorial los textos, o bien PDF
de maquetación, o bien el escaneado y procesamiento por OCR de nuestros libros), el texto obtenido sea absolutamente fiable, y en eso estamos poniendo todos
nuestros esfuerzos iniciales. Tras la nueva revisión de los editores, podremos ofrecer nuestros textos en la web con la calidad filológica requerida, pero también satisfaciendo, esperamos, las necesidades de la cantidad y la rapidez.
Está claro que unos meros archivos .txt, aunque sumaran todos los datos
(podríamos digitalizar incluso el prólogo, las notas y el aparato crítico en archivos estancos, separados; ya se verá), no serán nunca ediciones críticas digitales,
pues la suma de los archivos .txt y los datos en archivos estancos carecerá precisamente de la funcionalidad digital y posibilidades de visualización y generación
que ofrece la Biblioteca digital PROLOPE con sus archivos XML-TEI. Es bonito
pensar hasta qué punto Gianfranco Contini estaba presagiando en 1939 lo que
implica una edición crítica digital con su famosa simple, breve y elegante definición de lo que es una edición crítica: “Un’edizione critica é, come ogni atto
scientifico, una mera ipotesi di lavoro, la piú soddisfacente (ossia economica)
che colleghi in sistema i dati” (Contini, 1939, 369; subrayado mío). Ciertamente, si nosotros ofrecemos en archivos estancos los datos, pero no los relacionamos entre sí, no estamos ofreciendo, a pesar de esa suma de archivos y datos, una
edición crítica. Y conviene ser conscientes de ello y de la distancia que hay entre
los resultados de la Biblioteca digital PROLOPE y el nuevo repositorio de archivos .txt que estamos ahora concibiendo.
En este sentido, podríamos decir que los archivos .txt y su repositorio serán
un producto de menor calidad digital y filológica que la Biblioteca digital PROLOPE, pues limitará sus funciones y posibilidades, y ofrecerá la información
fragmentada. Pero al menos permitirá poner en la red textos críticos fiables en un
formato legible con mayor velocidad y ofrecerá un producto de sumo interés y
gran interoperabilidad para proyectos donde el formato de trabajo ideal sea el
.txt (los hay: por ejemplo, ETSO). También ofrecerá, en los términos propuestos por Schöch, Smart data, lo cual no es poco. Porque el texto, como tal, y
aunque sea desnudo, conserva todo su valor filológico y la calidad de los datos,
pues será un texto fiable filológicamente producto de un procedimiento riguroso. Así, estaremos ofreciendo textos (datos) fiables a la comunidad científica y la
ciudadanía para su reutilización en otros proyectos o incluso para la lectura.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
99
Conclusiones (III).
Sobre la dignidad del texto en la red
Nos hemos dilatado más de lo conveniente. Brevemente, ahora, podríamos recapitular unos principios filológicos y de Humanidades Digitales y algunas advertencias.
Desde la creación de Internet y de la World Wide Web los textos del teatro
del Siglo de Oro se han ido poniendo en la red en diferentes formatos, en imágenes (una multitud de testimonios de enorme interés) y en transcripciones
procesadas y publicadas en HTML. En cuanto a los textos procesados, la calidad
ecdótica es variada, pero han llegado a la red demasiados textos provisionales o
editados con poco rigor o con criterios incluso decimonónicos, frente al excelente panorama que ofrece hoy la edición crítica en papel; por lo que se refiere a las
obras de Lope de Vega, hay que celebrar la cantidad ya puesta en línea, casi la
totalidad del corpus de su producción conocida, consultable además con herramientas de búsqueda; aunque también hay que lamentar que, por razones que
han quedado explicadas, se trate en su gran mayoría de textos no fiables. Aunque
esos textos no fiables pueden ser útiles para realizar algunas investigaciones necesitadas de big data, deben utilizarse con prudencia para acometer otras o para su
simple lectura. Es importante que desde el ámbito de la investigación y de los
implicados en la edición digital y la difusión de textos de nuestro patrimonio
literario y dramático en la red se asumieran algunas conclusiones y principios:
1. Es un logro haber alcanzado la cantidad de miles de textos del teatro del
Siglo de Oro y el corpus casi completo de Lope, y podemos contar con
lo hecho, pero con prudencia y conciencia del lector/usuario/investigador de la calidad de los textos que lee y maneja.
2. Sería deseable, en el futuro, que los textos que se ponen en acceso abierto en la red tengan calidad ecdótica e informar muy claramente al usuario y lector del trabajo filológico realizado para el establecimiento de esos
textos.
3. Sería deseable que, tras la gran tarea de edición crítica que diversos grupos de investigación hemos acometido en el ámbito del teatro del Siglo
de Oro, esas ediciones críticas, o al menos los textos críticos alcanzados,
se pongan en línea.
4. Sería deseable no renunciar a la línea de las ediciones críticas digitales en
XML-TEI, por laboriosas que resulten, pues este lenguaje de marcación
es la única tecnología y estrategia suficientemente probada, robusta y
extendida.36
36. En nota al pie, y en el último momento, para no darle más relevancia, aunque la tiene,
añado: dadas las dificultades y la lentitud, tal vez sea bueno estar muy atentos a tecnologías de
Editar el Siglo de Oro en la era digital
100
Ramón Valdés Gázquez
5. En la medida de lo posible, es deseable explorar e idear estrategias de
digitalización y difusión rápida de textos fiables que permitan ponerlos
al alcance de la ciudadanía y la comunidad investigadora en un contexto
de Cultura y Ciencia abiertas.
tratamiento del texto alternativas a la marcación XML-TEI, aunque no querría que esta advertencia se convierta en una objeción o un cuestionamiento de una decisión que por ahora parece
clara: XML-TEI es por ahora la única vía posible y tecnología más difundida, robusta, interoperable por la comunidad de los editores digitales. Véanse, por ejemplo, las investigaciones de
Martina Dello Buono y Francesca Tomasi (2023) basadas en tecnología CMS, HTML y Graph
Data Structure. Digamos que también las ediciones críticas de Calderón se han concebido en
tecnología alternativa, XML con esquema XSD, pero se marcan el objetivo, precisamente, de
convertir a XML-TEI (Casais y Fernández Mosquera 2022: 378-380 y 383). No puede haber
estrategia buena con diseños ad hoc a medida del proyecto, porque implica la renuncia a la interoperabilidad (principio básico informático y de las Humanidades Digitales). Si se descubriera o
inventara una tecnología o estrategia alternativa más sencilla para la edición digital, debería extenderse tanto como la actualmente vigente entre la comunidad e incluir sistemas de conversión
sencilla y fiable desde XML-TEI.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
101
Bibliografía
Abraham, James T., “Obituary, Vern Williamsen”, Laberinto Journal, 8 (2015),
p. 1, 20-09-23, <https://acmrspress.com/laberinto-journal-volume-8/>.
Aibar Puentes, Eduard, “La transformación neoliberal de la ciencia: el caso de
las Humanidades Digitales” ArtefaCToS Revista de estudios sobre la ciencia y
la tecnología, VII (2018), pp. 13-28, 20-09-23, <https://doi.org/10.14201/
art2018711328>.
Allés-Torrent, Susanna, “‘Tiempos hay de acometer y tiempos de retirar’: literatura áurea y edición digital”, Studia aurea: revista de literatura española y
teoría literaria del Renacimiento y Siglo de Oro, XI (2017), pp. 13-30, 20-0923, <https://doi.org/10.5565/rev/studiaaurea.261>.
Allés-Torrent, Susanna, “Crítica textual y edición digital o ¿dónde está la
crítica en las ediciones digitales?”, Studia aurea: revista de literatura española
y teoría literaria del Renacimiento y Siglo de Oro, XIV (2020), pp. 63-98,
20-09-23, <https://doi.org/10.5565/rev/studiaaurea.395>.
Alvite, María Luisa y Antonio Rojas Castro, “Ediciones digitales académicas:
concepto, estándares de calidad y software de publicación”, Profesional de la
información, XXXI (2022), pp. 1-19, 20-09-23, <https://doi.org/10.3145/
epi.2022.mar.16>.
Apollon, Daniel, Claire Bélisle y Philippe Régnier (eds.), Digital Critical
Editions, Urbana-Chicago-Springfield, University of Illinois Press, 2014.
Atarés, Luisa, “Piratería editorial. Cervantes se enfrenta a los molinos en Internet”, Nueva Economía, suplemento del diario EL MUNDO, número 306
(Madrid, domingo 8 de enero de 2006), 20-09-23, <https://www.elmundo.es/suplementos/nuevaeconomia/2005/306/1136674804.html>.
Baillot, Anne, y Anna Busch, “Editing for Man and Machine. Digital Scholarly Editions and their Users”, Variants. The Journal of the European Society
for Textual Scholarship, XV-XVI (2021), pp. 175-187, 20-09-23, <https://
doi.org/10.4000/variants.1220>.
Baillot, Anne, From Handwriting to Footprinting. Text and Heritage in the Age
of Climate Crisis, Cambridge, Open Book Publishers, 2023, 20-09-23,
<https://doi.org/10.11647/OBP.0355>.
Bleier, Roman, Martina Bürgermeister, Helmut W. Klug, Frederike Neuber y Gerlinde Schneider (eds.), Digital scholarly editions as interfaces,
Norderstedt, Books on Demand, 2018, 20-09-23, <https://kups.ub.unikoeln.de/9085/>.
Bordalejo, Bárbara (ed.), Work and document, sección monográfica de la revista Ecdotica, X (2013), pp. 7-93.
Bordalejo, Bárbara, “Digital versus Analogue Textual Scholarship or the Revolution is just in the Title”, Digital Philology, VII (2018), pp. 52-73.
Burgos Segarra, Gemma, ed., 2019: véase Vega Carpio, La discreta enamorada.
Casais Vila, Verónica, y Santiago Fernández Mosquera, “Hacia una biblioteca
Editar el Siglo de Oro en la era digital
102
Ramón Valdés Gázquez
digital de las comedias de Calderón: el proceso del GIC”, Hipogrifo, X (2022),
pp. 373-384, 20-09-23, <https://doi.org/10.13035/H.2022.10.01.25>.
Cervantes Saavedra, Miguel de, La entretenida: véase. John O’Neill, ed., 2013.
Contini, Gianfranco, “Ricordo di Joseph Bédier”, Letteratura, III (1939), pp.
145-152. Se cita por la edición en Esercizî di lettura sopra autori contemporanei, Turín, Einaudi, 1982, pp. 359-371.
Cuéllar, Álvaro, “La Inteligencia Artificial al rescate del Siglo de Oro. Transcripción y modernización automática de mil trescientos impresos y manuscritos
teatrales”, Hipogrifo. Revista de literatura y cultura del Siglo de Oro, XI (2023),
pp. 101-115, 20-09-23, <https://doi.org/10.13035/H.2023.11.01.08>.
Cuéllar, Álvaro y Germán Vega García-Luengos, “La francesa Laura. El hallazgo de una nueva comedia del Lope de Vega último”, Anuario Lope de
Vega. Texto, literatura, cultura, XXIX (2023), pp. 131-198, 20-09-23,
<https://doi.org/10.5565/rev/anuariolopedevega.492>.
Darnton, Robert, Digitalitzar és democratitzar? El cas dels llibres, Barcelona,
Arcàdia, 2010.
Dello Buono, Martina, y Francesca Tomasi, “Śivadharma Database CMS.
HTML and graph as a starting point for digital editions”, en Emanuela
Carbé, G. Lo Piccolo, A. Valenti y S. Francesco (eds.), La memoria digitale
forme del texto e organizzazione della conoscenza. Atti del XII Convegno
Annuale AIUCD, Siena, 5-7 giugno 2023, Siena, Università degli Studi di
Siena, 2023, 20-09-23, <http://www.aiucd.it/wp-content/uploads/2023/06/
2023_aiucd_la_memoria_digitale_v1.pdf>.
Driscoll, Matthew James y Elena Pierazzo, eds., Digital Scholarly Editing.
Theories and Practices, Cambridge, Open Book Publishers, 2016, 20-09-23,
<https://www.openbookpublishers.com/books/10.11647/obp.0095>.
Eder, Maciej, “Mind your corpus: systematic errors in authorship attribution”
Literary and linguistic computing, XXVIII (2013), pp. 603-614.
La Estrella de Sevilla: véase Revenga (2021).
Faulhaber, Charles B., “Textual criticism in the 21st century”, Romance Philology, XLV (1991), pp. 123-148.
Faulhaber, Charles B., “Philobiblon. Information Technology and Medieval
Spanish Literature: A Balance Sheet”, en Humanitats a la xarxa: Món medieval. Humanities on the Web: the Medieval World, ed. Lourdes Soriano, Helen Rovira, Marion Coderch y Gloria Sabaté, Berna, Peter Lang, 2014, pp.
15-43, 20-09-23, <https://escholarship.org/uc/item/8kj505xd>.
Ferrer Valls, Teresa, ed., 2015: véase Zayas, La traición en la amistad.
Fiormonte, Domenico, Scrittura e filologia nell’era digitale, Turín, Bollati Boringhieri, 2003.
Fradejas Rueda, José Manuel, “Lingüística forense y crítica textual. El caso
Ayala-Cervantes”, Signa: Revista de la Asociación Española de Semiótica,
XXV (2016), pp. 193-220, 20-09-23, <https://doi.org/10.5944/signa.
vol25.2016.16927>.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
103
Gabler, Hans Walter, “Theorizing the Digital Scholarly Edition”, Literature
Compass, VII (2010), pp. 43-56, 20-09-23, <https://doi.org/10.1111/j.17414113.2009.00675.x>.
Gil, Alex, y Élika Ortega. “Global outlooks in digital humanities. Multilingual
Practices and Minimal Computing”, en Doing Digital Humanities. Practice,
Training, Research, ed. Constance Crompton, Richard J. Lane y Ray Siemens,
Londres – Nueva York, Routledge, 2016, pp. 22-33, 20-09-23, <https://
handsonhumanities.files.wordpress.com/2016/12/globaloutlooksindigital
humanities.pdf>.
Giunta, Claudio, “Prestigio storico dei testimoni e ultima volontà dell’autore”,
Anticomoderno, III (1997), pp. 169-198, 20-09-23, <https://heyjoe.fbk.eu/
index.php/antmod>. <www.claudiogiunta.it>.
Haehnert, Alexandra, “Critical Editions and the Promise of the Digital: The
Development and Limitations of Markup”, Book Publishing Final Research Paper (trabajo de fin de master), repositorio PDXScholar, University
Library, Portland State University, 2015. https://pdxscholar.library.pdx.
edu/eng_bookpubpaper/1
Italia, Paola, Editing Duemila. Per una filologia dei testi digitali, Roma, Salerno
Editrice, 2020.
Liu, Alan, “Where is Cultural Criticism in the Digital Humanities”, en Debates
in the Digital Humanities, ed. Matthew K. Gold, Minneapolis, University
of Minnesota Press, 2012.
Lucía Megías, José Manuel, “Enredando con el teatro de los Siglos de oro en la
web: de los materiales actuales a las plataformas de edición”, Signa, 17
(2008), pp. 85-129. https://doi.org/10.5944/signa.vol17.2008.6195
Lucía Megías, José Manuel, “La edición crítica hipertextual: hacia la superación del incunable del hipertexto”, en C. Castillo Martínez y J. L. Ramírez
Luengo (eds.), Lecturas y textos en el siglo XXI: Nuevos caminos en la edición
textual, Lugo, Axac, 2009, pp. 11-74.
Lucía Megías, José Manuel, Elogio del texto digital: claves para interpretar el
nuevo paradigma, Madrid, Fórcola, 2012.
Magán Wals, José Antonio, y Eugenio Tardón González, “Google Libros y la
digitalización masiva: La aportación de la Universidad Complutense de Madrid”, Revista General de Información y Documentación, XXIV (2014), pp.
9-24, 20-09-23, <https://revistas.ucm.es/index.php/RGID/issue/view/2520>.
Mateos Frühbeck, Nicolás, “Las ediciones digitales de PROLOPE, entre la
edición digital y la edición digitalizada”, Revista de Humanidades Digitales,
6 (2021), pp. 236-251, 20-09-23, <https://doi.org/10.5944/rhd.
vol.6.2021.30658>.
Modern Language Association, Guidelines for Editors of Scholarly Editions,
redacción de 29-06-2011, 20-09-23, <http://mla.org/cse_guidelines>.
—, Guidelines for Evaluating Work in Digital Humanities and Digital Media,
2012, 20-09-23, <https://www.mla.org/About-Us/Governance/Committees/
Editar el Siglo de Oro en la era digital
104
Ramón Valdés Gázquez
Committee-Listings/Professional-Issues/Committee-on-Information-Technology/Guidelines-for-Evaluating-Work-in-Digital-Humanities-andDigital-Media>.
—, Statement on the Scholarly Edition in the Digital Age, MLA Commitee on
Scholarly Editions, Mayo 2016, 20-09-23, <https://www.mla.org/content/
download/52050/file/rptCSE16.pdf>.
Monzó Ribes, Clara, y Daniel Fernández Rodríguez, eds., Vega Carpio,
Lope de, Los bandos de Sena, en Comedias de Lope de Vega. Parte XXI, coord.
Gonzalo Pontón y Ramón Valdés Gázquez, Barcelona, Gredos, 2022, 2
vols, I, pp. 1019-1206.
Muñoz Pons, Carlos, “El proceso de edición digital en Artelope y CTCE”,
Teatro de Palabras. Revista sobre teatro áureo, VII (2013), pp. 483-496,
20-09-23, <https://oraprdnt.uqtr.uquebec.ca/pls/public/docs/FWG/GSC/
Publication/5478/122/10128/1/215131/6/O0000525071_27Munoz
Carlos.pdf>.
Navarro Durán, Rosa, ed., véase Lope de Vega Carpio, El perro del hortelano.
O’Neill, John, La entretenida by Miguel de Cervantes: A Digital, Annotated Edition and an English Translation (The Diversion), Londres, King’s College
London, 2013, 20-09-23, <https://entretenida.outofthewings.org/aboutproject/index.html>.
Pierazzo, Elena. Digital Scholarly Editing: Theories, Models and Methods, Farnham (Surrey), Ashgate, 2015.
Pop, Liviu, “A low te(a)ch approach to Digital Humanities”, Digitalia, LXII (2017),
pp. 83-88, 20-09-23, <https://doi.org/10.24193/subbdigitalia.2017.1.06>.
Presotto, Marco (ed.), 2015: véase Vega Carpio, La dama boba.
Presotto, Marco, “La edición crítica digital del teatro del Siglo de Oro”, Cuadernos de AISPI, XI (2018), pp. 31-46, 20-09-23, <https://dx.doi.org/10.14672/
0.2018.1426>.
Presotto, Marco, “Ecdótica y Humanidades Digitales en el estudio del Teatro
clásico español: una experiencia”, Cuadernos Revista de Humanidades Digitales,
VIII (2023), 2-03-24, <// https://doi.org/10.5944/rhd.vol.8.2023.37267>.
Profeti, Maria Grazia, “La obra dramática de Lope de Vega”, en Francisco
Rico, coord., Historia y crítica de la Literatura Española, vol. III/1, primer
suplemento: Siglos de Oro: Barroco, coord. por Aurora Egido, Editorial Crítica, Barcelona, 1992, pp. 172-184.
Revenga, Nadia, ed., La estrella de Sevilla, edición crítica digital (en La Estrella de
Sevilla y las potencialidades de la edición digital, tesis doctoral dir. por Teresa
Ferrer Valls) y multilingüe (con las traducciones de Henry Thomas, 1935, al
inglés; Eugène Baret, 1869, al francés, y Gherardo Marone, 1969, al italiano), Biblioteca Digital EMOTHE, Universitat de València, Valencia, 2021,
20-09-23, <https://mobiroderic.uv.es/bitstream/handle/10550/79924/tesis_
nrevenga_EstrelladeSevilla_EdicionDigital.pdf?sequence=1&isAllowed=y>.
<https://emothe.uv.es/biblioteca/editions.php?n=4>.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
105
Robinson, Peter, “Towards a Theory of Digital Editions”, Variants, X (2013),
pp. 105-131.
Robinson, Peter, “The Digital Revolution in Scholarly Editing”, en Ars Edendi
Lecture Series, vol. IV, eds. B. Crostini, G. Iversen y B. M. Jensen, Estocolmo, Stockholm University Press, vol. IV, pp. 181-207, 20-09-23, <http://
dx.doi.org/10.16993/baj.h>.
Rodríguez Rodríguez, José Javier, ed., Lope de Vega Carpio, El blasón de los
Chaves de Villalba, en Lope de Vega Carpio, Comedias de Lope de Vega.
Parte X, coord. Ramón Valdés Gázquez y María Morrás, Lérida, MilenioUniversitat Autònoma de Barcelona, 2010, tomo III, pp. 1187-1361.
Rojas Castro, Antonio, “Lope de Vega’s La Dama Boba. Critical edition and
digital archive”, RIDE – A review journal for digital editions and resources, V
(2017), 20-09-23, <https://ride.i-d-e.de/issues/issue-5/damaboba/>. <https://
doi.org/10.18716/ride.a.5.3>.
Rojas Castro, Antonio, “La edición académica digital. De las teorías del texto
a la visualización de la información”, en eds. Isabel Galina-Russell, José
Francisco Barrón-Tovar, Miriam Peña-Pimentel, David Domínguez-Herbón, Ernesto Priani-Saisó, Adriana Álvarez-Sánchez, Humanidades digitales:
edición, literatura y arte, México D.F., Bonilla Artigas, 2018, pp. 47-80,
20-09-23, <https://doi.org/10.17613/tef7-bx87>.
Rosselli Del Turco, Roberto, «After the Editing is Done: Designing a Graphic User Interface for Digital Editions», Digital Medievalist, VII (2011),
20-09-23, <http://doi.org/10.16995/dm.30>.
Sabido, Vicente, “La Biblioteca Virtual Miguel de Cervantes”, El Profesional de
la Informacion, X (2001), pp. 15-18. DOI: 10.1076/epri.10.11.15.6773
Sahle, Patrick, Digitale Editionsformen: Zum Umgang mit der Überlieferung unter den Bedingungen des Medienwandels, Norderstedt, Books on Demand, 3
volúmenes, 2013.
Sahle, Patrick, A Catalog of Digital Scholarly Editions, v. 3.0, snapshot 2008ff,
compiled by , última actualización del 28/09/2020; 20-09-23, <https://
v3.digitale-edition.de/>.
Schöch, Christoph, “Big? Smart? Clean? Messy? Data in the Humanities”,
Journal of Digital Humanities, II (2013), sin número de página, 20-09-23,
<https://journalofdigitalhumanities.org/2-3/big-smart-clean-messy-datain-the-humanities/>. <https://zenodo.org/record/8432>.
Shillingsburg, Peter, Scholarly Editing in the Computer Age: Theory and Practice, Ann Arbor, University of Michigan Press, 1996.
Shillingsburg, Peter, From Gutenberg to Google: Electronic Representations of
Literary Texts, Cambridge, Cambridge University Press, 2006.
Simón Palmer, Carmen (dir.), Teatro Español del Siglo de Oro. Base de datos a
texto completo [TESO], versión 3.0, Chadwyck-Healey España, Madrid,
1998. Actualmente en línea (véanse Recursos).
Spence, Paul, “Edición académica en la era digital: modelos, difusión y proceso
Editar el Siglo de Oro en la era digital
106
Ramón Valdés Gázquez
de investigación”, Anuario Lope de Vega. Texto. Literatura. Cultura, XX
(2014), págs. 47-83.
Stroud, Matthew D., “Obituary, Vern Williamsen”, Laberinto Journal, VIII
(2015), pp. 2-3, 20-09-23, <https://acmrs.asu.edu/sites/default/files/2020-01/
laberinto_v8.pdf>.
Valdés, Ramón, “Los sueños de Quevedo: variantes, versiones y estrategias de
edición”, en Eugenia Fosalba y Gonzalo Pontón, eds., La escondida senda:
estudios en homenaje a Alberto Blecua, Madrid, Castalia, 2012, pp. 383-421.
Valdés, Ramón (ed.), Edición digital y edición crítica, sección monográfica de la
revisa Anuario Lope de Vega. Texto, literatura, cultura , XX (2014), pp. 1-121,
20-09-23, <https://revistes.uab.cat/anuariolopedevega/issue/view/v20>.
Van Hulle, Dirk, “Modelling a Digital Scholarly Edition for Genetic Criticism: A Rapprochement”, Variants. The Journal of the European Society for
Textual Scholarship, XII-XIII (2016), pp. 34-56, 20-09-23, <https://doi.
org/10.4000/variants.293>.
Variants. The Journal of the European Society for Textual Scholarship, X (2013).
Vega Carpio, Lope de, La dama boba, edición crítica y archivo digital de Marco Presotto con colaboración de Sònia Boadas, Eugenio Maggi y Aurèlia
Pessarrodona, Barcelona – Bolonia, PROLOPE – Alma Mater Studiorum
– Università di Bologna, Centro di Risorse Multimediali, 2015. DOI:
10.6092/UNIBO/LADAMABOBA
Vega Carpio, Lope de [autoría discutida], La estrella de Sevilla: véase Nadia
Revenga, ed.
Vega Carpio, Lope de, La discreta enamorada, edición crítica digital de Gemma
Burgos Sagarra, Biblioteca digital ARTELOPE – Colección EMOTHE,
Valencia, Universitat de València, 2019, 20-09-23, <https://emothe.uv.es/
biblioteca/editions.php?n=1>.
Vega Carpio, Lope de, Mujeres y criados, edición en línea coordinada por Sònia Boadas y Ramón Valdés, Biblioteca virtual PROLOPE, Bellaterra, Universitat Autònoma de Barcelona, 2014, 27-01-24, <https://prolope.uab.cat/obras/index.html>
Vega Carpio, Lope de, El perro del hortelano, edición de Rosa Navarro Durán,
Centro Virtual Cervantes (Obras de referencia: Clásicos Hispánicos), Madrid, Instituto Cervantes, 2004, 20-09-23, <https://cvc.cervantes.es/obref/
perro_hortelano/default.htm>.
Vega García-Luengos, Germán, “Planos y planes de un escenario privilegiado
para el teatro clásico español: el macroportal TCE de la Cervantes Virtual”,
Cuadernos de Teatro Clásico, número monográfico editado por Héctor Urzáiz y Mar Zubieta, Renovación en el Siglo de Oro: repertorio e instrumentos
de investigación, XXIX (2014), pp. 369-394.
Vega García-Luengos, Germán, “Las comedias de Lope de Vega: confirmaciones de autoría y nuevas atribuciones desde la estilometría (I)”, Talía.
Revista de Estudios Teatrales, III (2021), pp. 91-108, 20-09-23, <https://
doi.org/10.5209/tret.74625>.
Editar el Siglo de Oro en la era digital
Por la dignidad del texto. El teatro del Siglo de Oro y Lope de Vega en la red
107
Vega García-Luengos, Germán, “Para la delimitación del repertorio de comedias
auténticas de Lope: confirmaciones de autoría y nuevas atribuciones desde la estilometría (II)”, Anuario Lope de Vega. Texto. Literatura. Cultura, XXIX (2023),
pp. 469-544, 20-09-23, <https://doi.org/10.5565/rev/anuariolopedevega.477>.
Zayas, María de, La traición en la amistad, edición a cargo del grupo TEADOC
dirigida por Teresa Ferrer Valls, Valencia, Universitat de València, 2015.
<https://dicat.uv.es/latraicionenlaamistad>.
WEBS, EDICIONES, RECURSOS Y PROYECTOS CITADOS
Archipelas. A journal of Caribbean Digital Praxis, 20-09-23,
<https://archipelagosjournal.org/>.
Biblioteca Digital ARTELOPE, 20-09-23,
<https://artelope.uv.es/biblioteca/>.
Biblioteca Digital PROLOPE, (de próxima publicación),
<https://prolope.uab.cat/biblioteca>.
Biblioteca Virtual Miguel de Cervantes, 20-09-23,
<http://www.cervantesvirtual.com/>.
Biblioteca Virtual Universal, 20-09-23,
<https://www.biblioteca.org.ar/>.
Canon 60, 27-01-24,
<https://www.cervantesvirtual.com/partes/682072/canon-60-la-coleccionesencial-del-tc12-teatro-clasico-espanol >.
Cibertextos interactivos, 20-09-23,
<https://people.duke.edu/~garci/cybertexts/>.
Comedias.org (The Association for Hispanic Classical Theater), 20-09-23,
<http://www.wordpress.comedias.org/>
Ediciones digitales con Minimal Computing, 20-09-23,
<https://raffazizzi.gitlab.io/minimaldigipub/es/proyectos/>.
Estilometría aplicada al Teatro del Siglo de Oro (ETSO), 27-01-24,
<https://etso.es/>.
The CLiGS textbox, 20-09-23, <https://github.com/cligs/textbox>.
Editar el Siglo de Oro en la era digital
108
Ramón Valdés Gázquez
Gondomar Digital. La colección teatral del conde de Gondomar, 20-09-23,
<http://gondomar.tespasiglodeoro.it/>.
Grupo de Investigación Calderón de la Barca: Ediciones críticas, 27-01,24,
<https://www.calderondelabarca.org/ediciones_criticas>.
Intratext Digital Library, 20-09-23, <http://www.intratext.com/>.
Mini Lazarillo, edición mínima del Lazarillo de Tormes, 20-09-23,
<https://minilazarillo.github.io/>.
Minimal Computing, “Thougth pieces”, 20-09-23,
<http://go-dh.github.io/mincomp/thoughts/>.
Programming Historian, 20-09-23, <https://programminghistorian.org/>.
TC/12 Red del Patrimonio Teatral Clásico Español, 27-01-24,
<https://tc12.uv.es>.
Teatro Clásico Español, portal de la Biblioteca Virtual Miguel de Cervantes, 2009-23,
<https://www.cervantesvirtual.com/portales/teatro_clasico_espanol/>.
Teatro Español del Siglo de Oro (TESO), 20-09-23,
<https://www.proquest.com/legacyredirect/teso>. Vid. Simón Palmer (1998).
Teatro de los siglos de Oro, 20-09-23,
<https://www.uqtr.ca/teatro/entrada/t.html>.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción.
El caso de Góngora
Mercedes Blanco
Sorbonne Université
[email protected]
Aude Plagnard
Université Paul-Valéry, Montpellier 3
[email protected]
ORCID 0000-0001-5107-4921
Resumen
Reflexionamos acerca del trabajo realizado en ∏ólemos, un proyecto de humanidades digitales que se propone la edición y estudio de los documentos relativos a la recepción de Góngora en su siglo. Mostramos que el objeto mismo se
prestaba a un tratamiento digital, lo que nos lleva a una reflexión sobre la naturaleza de la edición digital. Esta no es una transformación optimizada de la
edición filológica, sino una creación de objetos nuevos a partir de materiales
textuales diversos, lo que ha llevado a hablar de “nuevo paradigma” o “paradigma digital” opuesto al “paradigma tipográfico”. Con la experiencia limitada de
∏ólemos y con un par de ejemplos más, podemos intuir que estos objetos ponen de manifiesto la historicidad de los textos, tanto en su génesis (tradición
material), como en su interpretación y valoración históricamente variables (recepción). Este acercamiento se completa en la segunda parte con una consideración detenida de un aspecto técnico tan importante como el lenguaje XMLTEI, y el modo en que aprendimos a utilizarlo para conjugar la edición misma,
bien definida por Sahle como una representación crítica de documentos históricos, junto con los medios de su comprensión y contextualización. Por otro lado,
describimos formas de lectura distante de este corpus derivadas del etiquetado
TEI, como la construcción de herramientas que permiten visualizar redes de
relaciones entre textos y entre agentes.
Palabras clave
Edición digital; Proyecto ∏ólemos; etiquetado TEI; minería de datos; análisis
de redes.
Editar el Siglo de Oro en la era digital
110
Mercedes Blanco - Aude Plagnard
Abstract
Editing a Work and the Documents of its Reception. The Case of Góngora.
We reflect upon the work undertaken in ∏ólemos, a Digital Humanities
project focused on the editing and analysis of the Gongorine polemic, specifically delving into the documents of Góngora’s reception in his century. In the
first part, we elucidate the rational behind the selection of this subject for digital treatment, prompting a consideration of the essence of digital editing,
which is not merely an optimized transformation of philological editing, but
rather a creation of novel entities derived from the textual sources. Drawing
insights from the limited experience of ∏ólemos and a few other examples, we
surmise that these entities compel us to emphasize the historical dimension of
texts, both in their genesis (material tradition) and in their subsequent reception and interpretation. This perspective is further developed in the second
part, with a detailed consideration of such an important technical aspect, as the
XML-TEI language. We expound upon our acquisition of proficiency in using
this language, elucidating how it serves as a tool for intertwining the act of
editing —defined by Sahle as a critical representation of historical documents— with the production of means for comprehending and contextualizing these documents. We delineate diverse methods for constructing a distant
reading of this corpus through TEI encoding, including such the development
of tools that facilitate the visualization of networks of relationships among texts
and agents.
Keywords
Digital scholarly editing; ∏ólemos project; TEI markup; data mining; network
analysis; data mining.
Este artículo se propone dos cometidos distintos, aunque conectados: el primero
es dar una idea del proyecto ∏ólemos,1 edición colectiva, filológica y digital de
la obra completa de Góngora y de los numerosos testimonios de su accidentada
y polémica recepción en el siglo xvii; el segundo consiste en explicar el tipo de
1. https://obvil.sorbonne-universite.fr/projets/gongora-et-les-querelles-litteraires-de-la-renaissance
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
111
análisis específico que las herramientas digitales, y especialmente el lenguaje de
marcado de la Textual Encoding Initiative,2 nos permitieron desarrollar. En el
marco de este proyecto, nuestra relación con la edición digital se desarrolló de
una forma más bien empírica. Si algo podemos aportar a la empresa colectiva
que supone este monográfico, será partiendo de la reflexión sobre una práctica
limitada a este proyecto y no de un aparato teórico a priori, cuya adquisición se
superpuso a nuestra vocación y formación de filólogas, críticas e historiadoras.
Formulamos, a guisa de preámbulo, ciertas observaciones sobre la naturaleza
misma de la edición digital, tal como la hemos practicado y como hemos observado que funciona en otros proyectos, relativos también a la literatura del Siglo
de Oro, aun a riesgo de que sean evidencias o truismos para quienes están mejor
armados en esta materia.
I. Reflexión sobre la naturaleza de la edición digital
mediante un par de ejemplos
Partimos de la constatación siguiente: la edición digital tal vez no sea igualmente
relevante y oportuna, o en todo caso igualmente necesaria, para cualquier texto o
cualquier corpus. Existen obras literarias que han circulado y circulan en ediciones
destinadas a la imprenta y al papel, las cuales cumplen perfectamente con sus objetivos, tanto científicos, como de divulgación y difusión. En cambio, se dan objetos textuales para los cuales la edición digital es en cierto modo insustituible:
aunque en teoría podrían editarse en papel, en la práctica son inabarcables por este
método tradicional, por razones económicas y también lógicas, derivadas de su
carácter múltiple, disperso, complejo o evolutivo —este es el caso del corpus gongorino, que editamos en ∏ólemos. Para decirlo de otro modo, y aunque esto no
suponga novedad para quienes conocen bien este campo, la edición digital no es
solo una manera de interpretar, codificar y difundir un objeto textual, ni una simple alternativa u optimización de un tratamiento tradicionalmente filológico.
Es más, no solo el método para realizar y presentar la edición de un objeto
textual (texto o corpus) X cambia si sometemos X a un tratamiento digital, produciendo una oposición entre su edición filológica tradicional (EFT) y su edición filológica digital (EFD),3 sino que es el mismo objeto el que cambia: en vez
de una oposición simple entre EFT(X) y EFD(X) —la edición filológica tradicional de X contra su edición digital—, tenemos una oposición en dos dimen2. La Text Encoding Initiative (TEI) es un consorcio que desarrolla y mantiene de manera colaborativa un estándar web para la representación de textos en formato digital, tal y como se especifica en su página web, https://tei-c.org/.
3. Hay quien, mejor que de “edición filológica” prefiere hablar de “edición académica”, traduciendo “scholarly edition”, como muy bien explica Susanna Allés-Torrent (2020: 90), pero confesamos que encontramos algo nebuloso el concepto.
Editar el Siglo de Oro en la era digital
112
Mercedes Blanco - Aude Plagnard
siones entre EFT(X) y EFD (Xd), siendo Xd una nueva versión del texto inicial
y una especie de mutante, un avatar de X en el mundo digital. Por ejemplo, la
edición digital de La dama boba de Lope por Marco Presotto4 no es, obviamente, una variante de la edición en papel de la misma comedia, con un traje un
poco distinto (pantalla en lugar de papel, notas que pueden verse no a pie de
página sino pulsando el número de nota, etc.). Al pasar de una a otra, cambia la
naturaleza del objeto editado.5
Como se sabe, la edición filológica tradicional, destinada al impreso o, lo que
es lo mismo, a establecer un patrón destinado a la reproducción en tantos ejemplares idénticos como se desee, tiende a contemplar el texto como una unidad, y
a convertirlo idealmente en una entidad invariable y definitiva. Claro que se trata
de una tendencia, y que en la práctica existen tantas ediciones impresas distintas
como editores de un texto dado. Con esa salvedad, cada persona que emprende
un trabajo filológico de edición destinada al impreso, llevada por la lógica y tradición de su labor, supone a la obra literaria una identidad única y se propone
ofrecer un texto óptimo, el que más se acerque a la voluntad definitiva del autor.
Se consignan las variantes, fruto, por lo común, de errores o de interferencias
debidos a accidentes de transmisión, o bien residuos del proceso de elaboración
del texto conservados en versiones primitivas o borradores. Pero el llamado ‘aparato crítico’ es relegado a una posición marginal, y casi solo sirve de garantía
científica, puesto que permite comprobar a quien lo desee que la tarea de cotejar
los testimonios y de basar en ellos el texto ha sido ejecutada de acuerdo con las
reglas del arte (aunque no haya un consenso perfecto sobre dichas reglas).
La edición digital, en cambio, incluso cuando tiene por punto de partida
una edición crítica hecha según esas famosas reglas del arte, como sucede en el
caso del mencionado trabajo del equipo de Marco Presotto, la presenta no rara
vez junto con un archivo de documentos representativos de la denominada ‘tradición textual’, lo que convierte el texto en una entidad plural, un haz de textos
sin jerarquía unívoca. En otras palabras, el dispositivo editorial impone, o al
menos sugiere, la idea de que no hay una Dama boba de Lope de Vega sino varias o muchas: 1. la del autógrafo original digitalizado, 2. la del mismo autógrafo transcrito, 3. la del impreso de la comedia en una de las Partes (princeps) cuya
impresión tuvo a cargo Lope, digitalizado también, 4. la de una copia manuscri-
4. http://damaboba.unibo.it/.
5. Para todo esto, y lo que sigue, véase Allés-Torrent, 2020, que expone en una brillante síntesis
el conjunto de las ideas y debates sobre la naturaleza de la edición digital a partir de principios de
siglo hasta la fecha del artículo. Resume en estos términos el modo en que la edición digital se hace
abogada de lo múltiple frente a lo unitario: “La idea de texto, en los últimos decenios, ha ido
evolucionando, y se ha cuestionado la cultura del texto ‘único’ abogando por su fluidez, el valor
de la variante y su dimensión social. Así también lo ha hecho el concepto de edición digital, vista
hoy como una especie de archivo digital donde tienen cabida todos aquellos materiales relacionados con el texto”(p. 64).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
113
ta llamada M que se considera derivada de la memorización por un espectador,
digitalizada, 5. la de la transcripción de esta copia, 6. y, por fin, la de la edición
moderna dicha ‘crítica’.6 Aunque en este trabajo, con toda su prudencia y seriedad italianas, esa posibilidad no se contemple, podría imaginarse la introducción en este dispositivo editorial de las reescrituras de la comedia para montajes
teatrales de hoy, como la que ofrece Juan Mayorga (Molanes 2011). Esta multiplicidad es consecuencia de una atención a los aspectos materiales de la tradición, que sin los medios digitales no habría sido posible restituir al lector de
forma tan exhaustiva, colocando además cada estado del texto en un mismo
nivel.7 Como escribe Marco Presotto:
La edición no anotada, o hasta la edición crítica tradicional con sus exigencias y
limitaciones también derivadas del soporte en papel, por lo común reduce mucho
la atención a todos estos aspectos materiales de la tradición textual, relegándolos
generalmente a un apéndice o a una síntesis introductiva.8
El objeto editado tiende, pues, a difractarse en varias facetas, varios documentos, y posiblemente esta multiplicidad tenga su correlato en la pluralidad de
investigadores que colaboran para establecer la edición, un trabajo de equipo
donde el responsable principal, Marco Presotto, actúa respaldado nada menos
que por tres colegas: Sònia Boadas, Eugenio Maggi y Aurèlia Pessarrodona. No
solo es posible consultar estos múltiples avatares de La Dama boba desde la misma página web, con solo escoger uno de los hipervínculos o bifurcaciones que
aparecen en la portada y en las páginas siguientes, sino que se facilita al “usuario” la posibilidad de leerlas en paralelo, como una partitura polifónica, escogiendo entre varias combinaciones (por ejemplo, edición crítica junto al autógrafo, o el autógrafo junto al impreso o su transcripción).9 La metáfora musical
6. Así se explica al respecto Marco Presotto en la presentación del proyecto editorial: “Dada la
importancia de los testimonios de La dama boba y del diferente ámbito de realización (O = manuscrito autógrafo; A = edición autorizada por el autor; M = copia derivada supuestamente de un
proceso de memorización ilegal), el proyecto se ha focalizado en la transcripción de los documentos y en el objetivo de ofrecer tales transcripciones de manera sinóptica, para poderlas comparar
entre ellas y con la edición crítica” (http://damaboba.unibo.it/proyecto).
7. De esta idea, Patrick Sahle ofrece una expresión particularmente enérgica: “Of course, the
content of digital editions can —in theory— be printed out. And, of course, the text of digital
editions could still be read on paper. However, a main characteristic of a digital edition is its representation of a potentially large number of documents in a potentially limitless number of different views, such as facsimile, diplomatic transcription and reading versions” (Sahle 2016: 27).
8. Marco Presotto, “¿Por qué una edición digital?”, http://damaboba.unibo.it/proyecto.
9. “El usuario tendrá así a disposición la edición crítica y los tres testimonios transcritos, que
podrá comparar entre ellos gracias a una organización de la pantalla repartida en módulos distintos (hasta 3) para dar cabida a las distintas selecciones elegidas. Asimismo, las opciones de búsqueda podrán referirse al texto crítico pero también a todos los testimonios o a la selección de documentos que se consideren oportunos” (http://damaboba.unibo.it/proyecto).
Editar el Siglo de Oro en la era digital
114
Mercedes Blanco - Aude Plagnard
tiene desde luego un valor meramente heurístico, y es tan inadecuada como
sugerente, puesto que al lector y espectador interesado por la intriga dramática
y por los personajes y sensible a la poesía que se desprende de esta bonita comedia no le es posible, a fin de cuentas, escuchar más que una línea melódica a la
vez, y la interferencia de las demás impediría el pleno disfrute de la gracia y el
ingenio de la obra: en cambio para el estudioso, este despliegue de versiones
diferentes tiene la virtud de exhibir el carácter poliédrico del texto, lo que produce un valor añadido, cognitivo y práctico, innegable.10
En este caso, parecerá quizá abusivo hablar de un objeto textual X convertido
en Xd, o sea en un objeto que es digital por esencia y no solo por el modo de su
presentación, puesto que nada impide, incluso con los medios tradicionales, leer
en paralelo varios testimonios de un texto: de hecho, esa lectura comparada o
cotejo es la condición previa del trabajo crítico del filólogo, la primera etapa del
procesamiento ecdótico. Pero se trata de una especie de andamio destinado a
desaparecer o a ser relegado al desván o la bodega del “aparato crítico”, a beneficio del resultado final, la edición crítica tal como se concibe al menos desde el
humanismo y la imprenta (aunque el término y la formalización de la técnica
aparecieron en el siglo xix, los principios esenciales son muy anteriores). En cambio, en ediciones digitales como la que tomamos por ejemplo, y a la que se ha
dado, de hecho, un valor de modelo, puesto que ha sido muy citada y reseñada,
la distancia entre lector y editor tiende a esfumarse, al menos a perder nitidez,
invitando al “usuario” a un papel activo aunque ocasional de filólogo aficionado.
Y es que, de modo bastante lógico, para quienes entran como receptores en esta
clase de edición, se habla de “usuario” más que de lector. La lectura, tal como se
entiende desde la era de la imprenta, es solo una parte, y quizá no la más importante del uso de estas ediciones, que más que tales, se llaman a sí mismas proyectos. Es decir que el usuario tiende a consultar los textos, a saltar de un punto a
otro más que a leerlos, o sea recorrerlos linealmente del principio al fin; o, si los
lee, es asunto suyo, pero no exactamente lo que prevé el dispositivo.
Más radical es la novedad del objeto producido por el trabajo editorial en
un proyecto como PRESOLO. Prácticas editoriales y sociabilidad literaria, alojado en la universidad de Córdoba, y debido a un equipo formado por Ignacio
García Aguilar, Pedro Ruiz Pérez, Rafael Bonilla Cerezo y Victoria Aranda Arribas, además de colaboradores ocasionales.11 PRESOLO tiene, según propia de-
10. Como indica Allés-Torrent, 2020, p. 72, este tipo de edición que suma todos los testimonios
ha sido realizado en el caso de obras fundamentales, como el Quijote y la Celestina, o con textos
medievales, como en el Corpus electrónico de manuscritos del cancionero castellano del siglo XV, dirigido por Dorothy Severin. En general, a estos testimonios, no se suma una edición crítica, como
sucede con La dama boba. Otro caso excepcional, que asocia edición crítica y transcripción de los
testimonios es el de Luís de Góngora, Soledades. Edición crítica digital, ed. Antonio Rojas Castro,
<http///soledades.uni-koeln.de/>.
11. https://www.uco.es/presolo/
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
115
claración, tres objetivos. El primero es “recopilar y editar todos los paratextos
compuestos por el Fénix”, junto con los que redactaron otros autores para obras
de Lope de Vega, lo que da lugar a una “biblioteca de paratextos”: un conjunto
muy amplio de textos breves (543 documentos, según García Aguilar 2023)
consultable en línea. El segundo objetivo perseguido es el marcado TEI del corpus, ideado para realizar búsquedas combinadas (y no solo por palabras sueltas,
como en un texto desprovisto de marcado conceptual) atendiendo al sentido
“pragmático, literario y discursivo de todas las piezas”. Naturalmente tanto ese
marcado como el buscador se basan en ciertas hipótesis previas, puesto que hacen hincapié en el sentido “pragmático” de los textos. O sea, contemplan estos
textos como palabras en acción destinadas a revestir la figura del autor de ciertos
valores, construyendo lo que llaman estos investigadores “identidad autorial” y
haciendo visibles “las tensiones y vínculos más o menos clientelares que influyeron en la actividad literaria del Fénix”. Sin embargo, el carácter sesgado de la
interpretación así sugerida al usuario de esta página web queda compensado por
la índole abierta y provisional del proyecto, compartida por todos los de este
tipo, que pueden verse como llamadas (pocas veces atendidas, bien es verdad) a
una discusión y una crítica constructiva. El tercer objetivo consiste en “la visualización” mediante el software Gephi,12 de las relaciones bilaterales o reticulares
en las cuales se inserta Lope de Vega. Nótese que el concepto mismo puede
verse como una proyección del funcionamiento actual de las llamadas redes sociales en la web de la era digital.
Baste para nuestro presente objetivo mencionar que, en este caso de PRESOLO, se construye, bajo el nombre de biblioteca, un conjunto de documentos
literarios y administrativos —puesto que entre ellos figuran no solo los prólogos,
dedicatorias y aprobaciones sino también las licencias y tasas—, que no existió
como tal históricamente. Por supuesto, se puede recorrer con cierta fruición esta
biblioteca de paratextos al modo de herbolario de ejercicios retóricos (dados el
ingenio y la destreza en el manejo del castellano de Lope y de los demás autores
de muchas de estas piezas) pero su propósito y naturaleza son típicamente científicos: reunir documentos como materiales de un protocolo experimental, la
llamada “búsqueda avanzada”, para poner a prueba ciertas hipótesis de sociología literaria. Así concebido, lo que en PRESOLO se propone no es un texto X
que hubiera podido editarse por medios tradicionales: lo que se edita es un objeto Xd, un objeto de la era digital, irrealizable y tal vez inconcebible fuera de
ella. Otro ejemplo, más limitado en lo que pretende abarcar, y quizá, por ello
mismo, más convincente (de momento) de este tipo de método se produce
cuando se someten textos teatrales a un marcado destinado a cartografiar las
interacciones entre los personajes: ¿quién habla, qué número de versos se adjudican a cada personaje, a quién habla, durante cuantos versos y en qué momen12. https://gephi.org/
Editar el Siglo de Oro en la era digital
116
Mercedes Blanco - Aude Plagnard
to de la obra? La visualización de los datos a modo de redes (con nodos o vértices, y enlaces o aristas) mediante el programa Gephi puede permitir, en casos
ideales, comprobar una hipótesis de gran alcance sobre la poética y el proceso de
escritura de un autor.13 Es lo que hicimos nosotros en el teatro de Góngora en
el seno del proyecto ∏ólemos, pero sin interpretar los resultados:
14
Fig. 1. Gráfico de interlocución en la comedia Las firmezas de Isabela
(proyecto ∏ólemos).14
13. Véase, como ejemplo brillante, Carmona, 2021: la comparación de las redes de interacción
en dos comedias muy afines temáticamente, El mayordomo de la duquesa de Amalfi y El perro del
hortelano, permite a la autora demostrar que Lope “escribe con falsilla” o sea que la segunda de las
comedias es en cierto modo una reescritura de la primera, aunque nadie lo diría fijándose únicamente en los textos, y solo se comprueba al hacer aparecer la estructura subyacente.
14. https://obvil.sorbonne-universite.fr/corpus/gongora/gongora_firmezasisabela.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
117
Como se comprobará, en nuestro proyecto, Góngora también tiende a difractarse y multiplicarse y, por ello mismo, la naturaleza digital de la edición
influye no solo en nuestra manera de proceder, sino también en los postulados
iniciales y los resultados de la investigación.
II. El proyecto ∏ólemos: Góngora con los testimonios
de su recepción
II.1 Objetivos y definición del corpus
El proyecto Góngora del Labex OBVIL, que de modo informal también llamamos ∏ólemos, se asigna por objetivo editar el conjunto de los testimonios de la
polémica gongorina. Nació en 2014 y aunque ha dado lugar a muchísimo trabajo y a resultados que creemos interesantes, dista de estar terminado. En este
caso, la idea surgió de consideraciones filológicas y hermenéuticas. Si bien en su
inicio, razones de oportunidades institucionales y de curiosidad por nuestra parte nos llevaron a adoptar la forma de ediciones digitales, alojadas en un macroproyecto de investigación de humanidades digitales literarias, llamado Labex
OBVIL (Laboratoire d’Excellence «Observatoire de la Vie Littéraire»),15 sin embargo, esta dimensión digital fue determinante y, en algunos aspectos, imprescindible para alcanzar el resultado provisional al que hoy hemos llegado.
Antes de señalar brevemente las mencionadas consideraciones filológicas y hermenéuticas que nos llevaron a diseñar este proyecto editorial, es necesario aclarar lo
que entendemos por testimonios de la polémica gongorina. No nos propusimos
editar tan solo los escritos cuyo objeto único o principal fue atacar a Góngora o
defenderlo frente a quienes lo atacaban, sino el conjunto de los testimonios de su
recepción, incluyendo los comentarios, y los debates más o menos serenos o de
apariencia objetiva. En efecto, la polarización radical de las reacciones de los lectores ante los dos largos poemas dados a conocer entre 1612 y 1617, el Polifemo y las
Soledades, entusiastas muchos y algunos malhumorados o indignados, condicionaron la recepción del poeta y todo lo que tiene que ver con ella, impregnando de
sesgo polémico todo cuanto se dijo no solo de estos poemas sino de todo lo escrito
por Góngora o por quienes fueron percibidos como de su misma casta o secta estética y literaria. Así sucedió incluso en géneros ajenos a la obra del poeta cordobés,
como la predicación, no solo en su tiempo sino hasta mucho más tarde, y en parte
hasta hoy. De modo que, por un proceso de progresiva ampliación, decidimos
considerar como testimonio de la polémica cualquier escrito que diera testimonio
de la lectura de Góngora en su tiempo y cualquier tipo de apreciación crítica acerca
de él o de sus presuntos discípulos y admiradores, a los que se solía llamar cultos.
15. https://obvil.sorbonne-universite.fr/.
Editar el Siglo de Oro en la era digital
118
Mercedes Blanco - Aude Plagnard
II.1. El terreno movedizo y las fronteras elásticas
de la polémica gongorina
La importancia que cobra esta recepción polémica dentro del conjunto del sistema literario del siglo xvii confiere a sus fronteras una elasticidad peculiar. Por
dar aquí solo un ejemplo, pero significativo, vale la pena recordar que la obra de
Lope de Vega, en sus últimos veinte años de vida y tal vez antes, está fuertemente condicionada por los deseos contradictorios de afirmarse como el antagonista
de Góngora, su contrario, y el de hacer lo mismo que el poeta cordobés, pero
mejor. Dicha actitud generó un puñado de escritos críticos y polémicos que son
abiertamente tales y, por otro lado, obras de apariencia neutra (comedias, novelas, poesías líricas) que, además de otros objetivos, contienen alusiones crípticas
a este debate, y, en su calidad de imitaciones encubiertas o emulaciones ostentosas, dan testimonio de la recepción de Góngora.16 Lo interesante en el caso de
Lope es que en parte se trata de un debate consigo mismo, una especie de monólogo dramatizado. Lo mismo, hasta cierto punto, sucede con los demás poetas
ambiciosos de esos años, de modo evidente con Francisco de Quevedo17 y Juan
de Jáuregui.18 Los temas y las posiciones expresadas, los enfrentamientos y las
alianzas entre poetas y escritores, durante buena parte del siglo, tienen a Góngora como referente, explícito o implícito.
Por ello, nos ha parecido oportuno incluir en el ámbito del proyecto textos
como el opúsculo titulado Anti-Jáuregui del licenciado Luis de la Carrera al reformador de los poetas castellanos. El texto así llamado, conservado en un manuscrito
misceláneo de la Real Biblioteca del Monasterio del Escorial, era respuesta acerada
a otro texto polémico, la Carta del licenciado Claros de la Plaza al maestro Lisarte
de la Llana. Esta Carta, que circuló sin autoría a finales de 1624, denunciaba los
atentados a la pureza de la lengua castellana supuestamente cometidos por Lope
en su epopeya Jerusalén conquistada, y permaneció inédita hasta su publicación
por Antonio Paz y Meliá en Sales españolas, a principios del xix.19 Aunque el texto
no iba firmado, quienes lo leyeron en su tiempo lo atribuyeron sin vacilar al poeta
sevillano Juan de Jáuregui, el mismo que ya se había señalado como crítico agudo,
agrio y lenguaraz, unos diez años antes, con el famoso Antídoto contra la pestilente
poesía de las Soledades. Poco antes de redactar la tal carta satírica contra Lope de
Vega, había reavivado la polémica gongorina con un hermoso y bronco poema, el
Orfeo, y con un sesudo Discurso poético que sin nombrar a nadie, se pronunciaba
tanto contra Lope como contra Góngora (Jáuregui 2016). Pues bien, el AntiJáuregui, que responde agresivamente a la Carta del licenciado Claros de la Plaza,
16.
17.
18.
19.
Véase Blanco (2008) y Gutiérrez Valencia (2021).
Cacho Casal (2004); Carreira (2014); Conde Parrado (2021).
Véase Blanco (2008) y Gutiérrez Valencia (2021).
Jáuregui (1902).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
119
es, como ha demostrado Juan Montero,20 obra del mismo Lope de Vega, que actúa
bajo la máscara de un seudónimo, Luis de la Carrera, dirigiendo tiros a Jáuregui
pero también defendiéndose a sí mismo en tercera persona y, lo que es más curioso, defendiendo al mismo Góngora. En este escrito (presumiblemente, pues, de
Lope), los dos encarnizados adversarios, el popularísimo poeta madrileño, y el
andaluz Góngora, son presentados como dos genios poéticos, que vuelan a la misma altura sublime, atacados insolente y estúpidamente por un gozque, un perro
ladrador envidioso y de mente estrecha, Jáuregui. Es decir que esta polémica encubierta o enmascarada entre el Fénix de los ingenios y el dotado y neurótico
Jáuregui carece de independencia con respecto a la polémica gongorina. Puede
considerarse como un apéndice de la misma, no solo porque en ella se enfrentan
dos de los principales actores de dicha polémica, Lope y Jáuregui, sino porque sus
argumentos apelan a los esgrimidos a favor o en contra de Góngora.
Por estas razones, aceptamos con entusiasmo la propuesta de Juan Montero
y Cipriano López Lorenzo de alojar en nuestra plataforma de ∏ólemos la edición
del Anti-Jáuregui (o más bien reedición, puesto que ya habían editado esta pieza,
con un grado menor de rigor y atención, Miguel Artigas y Julián Zarco Cuevas
en 1925 y en 2007 Krystof Sliwa). Además de la edición propiamente dicha del
texto, incumbe a los editores determinar los metadatos que figurarán en el encabezamiento de la edición en XML-TEI, según una lista compartida por todos los
textos publicados por el proyecto: el identificador del texto,21 la identificación de
los editores científicos, el autor (Lope de Vega, atribuido), el destinatario o dedicatario (Juan de Jáuregui), el título (Anti-Jáuregui), la fecha (1624-1625), las
fuentes o en este caso la fuente única, el manuscrito del Escorial;22 las ediciones
modernas;23 el texto de Jáuregui al que el Anti-Jáuregui responde;24 otros textos
20. Montero (2008). La demostración es reiterada y completada en la introducción del AntiJáuregui por Cipriano López Lorenzo (véase Vega, 2023).
21. Muy en los primeros tiempos del proyecto e incitado por los ingenieros del OBVIL, Jaime
Galbarro García realizó una compleja hoja de cálculo donde aparecían todas las piezas del corpus
que nos proponíamos editar (en línea, designados por un identificador) y en columnas una serie
de datos: autor, fecha, título, fuentes (en el sentido de testimonios del texto, manuscritos e impresos), ediciones, destinatario o dedicatario, texto al que respondía, referencias a otros textos. La
lista fue más adelante progresivamente aumentada por textos nuevos que iban apareciendo. Los
identificadores con una configuración fija (en este caso, Blanco, Elvira y Plagnard, 2021, núm. 79.
#lopeatribuido_anti-jáuregui), permitían definir los nodos de la red, y la columna encabezada por
“Responde a otro texto” las aristas de la red. Esta parte de la hoja de cálculo, una vez convertida
por un software adecuado, permite pues generar estas famosas redes. Véase Elvira y Plagnard,
2021 y Pezzini y Ruiz Soto 2017.
22. Real Biblioteca del Monasterio del Escorial, ms. L-1-15, f. 222r-230v, Anti-Jáuregui del licenciado don Luis de la Carrera al reformador de los poetas castellanos.
23. Artigas (1925: 587-605), Zarco Cuevas (1925: 272-290), Sliwa (2004: 322-336 y 2007:
112-124).
24. Juan de Jáuregui, Carta del licenciado Claros de la Plaza al maestro Lisarte de la Llana, en
Jáuregui, 2022.
Editar el Siglo de Oro en la era digital
120
Mercedes Blanco - Aude Plagnard
del corpus al cual hace referencia.25 Todo ello ha sido codificado en TEI y puede
servir, como comentamos más abajo, para la exploración informática del corpus,
mediante el etiquetado, de manera similar al caso del proyecto PRESOLO que
hemos descrito.
En definitiva, al decidir editar las piezas de la polémica gongorina, nos metimos tal vez inadvertidamente en una red de escritos tupida y compleja, estrechamente conectada con textos que, a pesar de tratar temas distintos, demuestran un grado variable de relación con las piezas polémicas más explícitas sobre
la poesía de Góngora.
Los textos ya publicados en línea, que dependen de una serie de contingencias
—encontrar a los editores dispuestos a trabajar según el patrón que les indicamos,
esperar la entrega de sus ediciones, buscar tiempo y mano de obra para tratarlas
(corregir, regularizar, codificar)— representan solo una pequeña parte de lo que
está en curso o lo que sería deseable hacer. Parece necesario precisar que al decir
“nosotros” nos estamos refiriendo a un grupo también plural y abierto; si la iniciativa fue de Mercedes Blanco, la idea tomó forma conversando con varias personas,
como Roland Béhar y Begoña López Bueno; entre quienes lanzaron el proyecto,
hay que mencionar a Jaime Galbarro y Sara Pezzini; entre quienes generosamente
contribuyeron a él, a Héctor Ruiz Soto, Antonio Rojas y Marie-Églantine Lescasse y quien hoy contribuye a hacerlo vivir, es ante todo Aude Plagnard. La lista de
textos publicados aparece en la captura de pantalla siguiente (Fig. 2):
25. Blanco, Elvira, Plagnard (2021: núms. 25 [#jauregui_antidoto], 55 [#lope_justa-isidro], 61
[#lope_filomena-jardin], 74. [#lope_relacion-isidro], 77 [#jauregui_discurso-poetico], 78 [#estrada_papel], 81 [gongora_soneto-orfeo] y 84 [#lope_montalban-orfeo-cancion]).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
121
26
Fig. 2. Índice del proyecto ∏ólemos.26
26. Véase la paleta de proyectos desarrollados en el OBVIL: https://obvil.sorbonne-universite.fr/
projets, así como el índice del proyecto reproducido en la figura 1: https://obvil.sorbonne-universite.fr/corpus/gongora/polemos/.
Editar el Siglo de Oro en la era digital
122
Mercedes Blanco - Aude Plagnard
II.2. Razones hermenéuticas e históricas de ∏ólemos.
Más allá de la edición, la construcción de un objeto de conocimiento
Las razones de nuestro interés por editar estos textos eran, como apuntamos, de
índole filológica y hermenéutica. La obra de Góngora nos ha llegado envuelta en la
fama de haber suscitado, desde el inicio, adhesiones casi fanáticas y rechazos brutales, o pérfidamente cachazudos como el de Cascales.27 El rumor de escándalo se
prolonga durante siglos y sus ecos siguen alimentando las proclamas de los ilustrados presuntamente clásicos contra la decadencia de nuestras letras en el siglo barroco. No hay historia de la literatura, trasnochada o puesta al día, que no nos hable
de cosas como el cultismo y el culteranismo, supuestos movimientos o tendencias
características de una parte sustancial de la literatura española. Ahora bien, estos
términos, inexistentes en el siglo xvii, que sí habló de cultos y de culteranos pero no
acuñó sus derivados abstractos cultismo y culteranismo, remiten a conceptos o
seudo-conceptos que se interponen entre Góngora y nuestras lecturas de él y de
otros escritores de su tiempo. Aunque estos conceptos nos alejan de lo que fue la
recepción de Góngora durante su vida y en las décadas inmediatamente posteriores,
hay que reconocer que estos no existirían si no hubiera habido una polémica coetánea del poeta que tocó a casi todos los literatos y eruditos de algún renombre, e
incluso se convirtió en la máxima referencia crítica y teórica en materia literaria
durante la época áurea de nuestras letras. En la segunda década del siglo xxi, cuando lanzamos el proyecto ∏ólemos, la polvareda levantada por detractores y aficionados no se había depositado del todo y seguía orientando, para bien o para mal,
nuestra percepción de aquella lejana literatura que para nosotros hace oficio de
clásico, en el sentido de que sigue parcialmente viviendo o siendo capaz de revivir.
La convicción que nos movió a constituir un corpus editable con los documentos de la polémica fue que ante esta situación solo cabían dos posibilidades. O bien
se hace tabla rasa de todo lo dicho acerca de Góngora en su siglo y en los siguientes,
y nos dirigimos a los textos con mirada virgen y cándida, o lo que es lo mismo,
desde nuestros gustos y saberes, ignorancias y prejuicios de hoy (algo ajeno a los
principios fundamentales de la filología, que no han sido superados ni lo serán
nunca, mientras exista esta disciplina). O bien intentábamos historiar la polémica
sin prejuicios y simplificando lo menos posible, para invertir precisamente el proceso de comprensión perentoria pero rudimentaria a la cual estábamos abocados los
críticos y los lectores en general, quien más o quien menos, por un seudo-conocimiento apresurado y parcial del fenómeno. Esta segunda vía exigía reunir el mayor
número posible de textos y tratarlos con absoluta seriedad, sin precipitación, sin
jerarquizarlos a priori, sin pensar que ya sabíamos de antemano lo que tenían que
decirnos. Cada uno de esos textos debía ser objeto de una lectura atenta, demorada,
que pusiese de relieve y resolviera las muchas dificultades que planteaban. Además
27. Véase la edición de Mercedes Blanco y Margherita Mulas (2018).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
123
de la dificultad propia de cualquier texto del xvii, con su manejo de una lengua rica
y de una retórica compleja, hoy fuera de uso, los escritos que nos interesan presentan una dificultad que procede de dos características de distinto signo: por un lado,
la erudición humanística, las incesantes referencias a los clásicos griegos y latinos, y
por otro el carácter jocoso y malicioso, chistoso y retorcido, alusivo e ingenioso de
todo texto de combate, sobre todo en materia poética.
De ahí que buscáramos ediciones muy cuidadosamente anotadas que resolvieran en lo posible estas dificultades, desplegaran lo que en los textos estaba expresado
en forma de insinuación o alusión, ayudaran a seguir la argumentación y aclararan
sus presuposiciones, así como tradujeran conceptos ajenos a la cultura de hoy. Por
otra parte, se trataba de situar cada texto en una red intertextual de la mayor riqueza posible. Sin encerrarnos en la cuestión debatida en todo el corpus de la validez
de Góngora como modelo, afirmada o negada, nos proponíamos examinar la hipótesis de que en estos textos se discuten ciertos conceptos importantes para la definición de la literatura, como su relación con la lengua, y con la evolución histórica del
idioma, o el carácter irreductible o idiosincrático que reviste el estilo en los poetas y
escritores de primer orden. Pensábamos que la noción de oscuridad poética y el
debate sobre si debe ser promovida y condenada, ciertamente importante (Roses
1994), no agota la riqueza conceptual y doctrinal de este puñado de escritos.
Por supuesto, se trataba también de averiguar cuánto fuera posible sobre el
contexto en que se compusieron los textos, sobre la cronología, el perfil de cada
autor, su relación con Góngora o con los demás polemistas, la cultura o la biblioteca que moviliza, los fines que persigue, su personalidad y sus hábitos como
intelectual o como miembro de la República de las letras.
Nuestro objetivo era, pues, de orden estético y de teoría literaria (nueva
interrogación de los fundamentos de la literatura, pero no en abstracto sino
como parte de una tradición y realidad histórica), y, por otro lado, también de
historia social de hechos literarios o paraliterarios, similar en ello a la de PRESOLO, que estudia las “prácticas editoriales y sociabilidad literaria en torno a
Lope de Vega” o, de modo más amplio, a las investigaciones llevadas a cabo en
el SILEM, Sujeto e institución literaria en la Edad Moderna —federación, en
realidad, de varios proyectos y equipos importantes—.28
II.3. Cuestiones de método y medios
Para acercarse a la consecución de este objetivo, había que crear una plataforma
digital que funcionara como un escenario donde todas esas voces se hicieran oír
como conjunto o concierto (a veces cacofónico). Las escasas visibilidad y remuneración de este trabajo tan arduo, hicieron necesario movilizar a muchas perso28. https://www.uco.es/redvoces/
Editar el Siglo de Oro en la era digital
124
Mercedes Blanco - Aude Plagnard
nas, a muchos editores y dedicar un denodado esfuerzo a la relectura, corrección, y uniformización de las ediciones en Word por ellos entregadas y a la
codificación en XML-TEI de los archivos que nos remitían.
La empresa se reveló más espinosa de lo que creíamos, pero también, o así lo
esperamos, más interesante, aunque solo sea por razones de método. En efecto, nos
propusimos poner al mismo nivel los textos y dedicarles el mismo grado de atención, a pesar de su heterogeneidad en múltiples aspectos. Dispares, los textos que
editamos lo son en la calidad de su escritura (desde la banalidad hasta la originalidad y los destellos más brillantes), así como también por su extensión, por su grado
de notoriedad y accesibilidad. Acerca de esto último, los hay que tienen hasta cuatro o cinco ediciones modernas, como el Apologético de Espinosa Medrano, y otros
que nadie ha leído, por encontrarse en manuscritos de propiedad privada, como la
Silva de Manuel Ponce, o incluso en apariencia perdidos, como el inmenso Antifaristarco de Angulo y Pulgar, que acaba de aparecer.29 También hay otros prácticamente vírgenes por la dificultad misma del documento, como las notas sueltas a
Góngora de Martín Vázquez Siruela (1600-1664), escolios a fragmentos gongorinos que se suceden en completo desorden, a través de dos centenares de folios cubiertos por una escritura diminuta. Este borrador inacabado, que se encontró entre
los papeles por el erudito granadino después de su muerte, es una mina de ideas y
de datos, en la que están trabajando Pedro Conde Parrado y Mercedes Blanco.
Publicar textos tan numerosos y dispares no hubiera sido posible por razones
logísticas y económicas en una edición tradicional. En primer lugar, porque era
necesario mantener abierto el proyecto durante bastantes años —ya llevamos casi
diez, y hay tela cortada para otros cinco más como mínimo—, no solo para añadir
textos y corregir los textos existentes a la luz de las nuevas publicaciones, sino
también para introducir nuevas funcionalidades que permitan enriquecer el trabajo editorial. Esa conciencia de que nada se acaba nunca de verdad en cuestiones de
investigación y de trabajo, en especial en proyectos editoriales, tiene grandes ventajas, porque permite darse objetivos ambiciosos. Como escribe Susanna AllésTorrent, la edición se convierte “en un proceso y no tanto en un producto”.30
También tiene, por supuesto, inconvenientes, y puede ser tachada de irrealista.
Por otra parte, nuestra intención fue hacer posible una lectura conectada de
los textos, para lo cual impusimos una serie de normas homogéneas que hicieran
posible circular de varias maneras dentro del corpus. El sentido del proyecto
consistía, en efecto, en volver accesibles y visibles el mayor número de conexiones, tanto de contigüidad como de similitud, entre los diferentes textos. Por
29. Este último manuscrito se creía perdido y acaba de aparecer a raíz de una sucesión en Córdoba; lo ha comprado hace pocos meses la Biblioteca de la Universidad de Sevilla por mediación de
Begoña López Bueno.
30. Allés-Torrent (2020), de hecho, cita a Patrick Sahle (2016: 29), quien habla elegantemente
de “fluid publication”.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
125
ello, nos esforzamos en crear toda clase de paralelismos y pasarelas entre ellos.
Solo citaré tres aspectos de esta homogeneización.
31 32
A. Las introducciones
Las introducciones se formalizaron siguiendo un patrón único, como puede observarse en estos dos ejemplos, lo cual facilita una lectura transversal y la comparación
de las características de los textos gracias a los distintos epígrafes (cf. Fig. 3):
Fig. 3. Estructuras de las introducciones: ejemplos del Examen del Antídoto
(ed. Matteo Mancinelli)31 y del Anti-Jáuregui (ed. Juan Montero
et Cipriano López Lorenzo).32
31. https://obvil.sorbonne-universite.fr/corpus/gongora/1617_examen.
32. https://obvil.sorbonne-universite.fr/corpus/gongora/1624_anti-jauregui.
Editar el Siglo de Oro en la era digital
126
Mercedes Blanco - Aude Plagnard
B. Ecdótica y modernización
No hemos aplicado métodos de la ecdótica renovados por la herramienta digital;
en este aspecto hemos dejado plena libertad a los editores, por lo general no
formados en esta herramienta o no especialmente interesados por ella. Muchas
veces el texto se ha transmitido por un solo testimonio (manuscrito o impreso).
Cuando son varios, se han cotejado para establecer un texto crítico. El proceso
ha sido ejemplarmente riguroso en el caso de la edición del Examen del Antídoto
de Matteo Mancinelli, con ocho testimonios manuscritos, lo que ha dado lugar
a proponer un stemma y a aplicarlo al texto crítico.
Lo que ha sido en cambio condicionado por el medio digital han sido las
normas de modernización, bastante drásticas, según el principio de imponer
una homogeneidad que permita las búsquedas y que de otro modo sería imposible o mucho más complicada.33
Esta modernización consiste en la regularización, de acuerdo con la norma actual, de todas las fluctuaciones grafémicas: s/ss; ç/c/z; x/j/g; u/v; v/b; r/
rr; qu/cu; m/n delante de p/b; la supresión de los grupos consonánticos cultos
ph, th y ch, y la modernización de los grupos cultos con pertinencia fonológica (pt, ct, gn, bst, nct, sc); la eliminación del vocalismo átono, la separación
de las aglutinaciones (desta > de esta; esotra > esa otra; estotros > estos otros;
della > de ella; dél > de él); el desarrollo de las abreviaturas sin indicarlo (V.
M. > vuestra merced); la restauración de la h- etimológica, y la modernización
de la puntuación y acentuación. Se conserva, en cambio, la estructura de vocablos como aquesto o aquese que no tienen equivalente exacto. También hay
que modernizar por completo los nombres propios, desechando en ellos todo
tipo de grafías antiguas. Sin embargo, para la edición de los versos castellanos
(de Luis de Góngora o de otros autores, ya sean originales o traducidos), aplicamos una modernización moderada con el fin de respetar la configuración
rítmica del verso.
C. Anotación
La perspectiva de una publicación digital de los textos nos permitió, por otra
parte, idear un sistema de anotación con varios niveles, en función de la calidad
de la información anotada. Concretamente, introdujimos tres niveles de notas:
las “de autor”, las de “edición crítica” y las de “edición”.
Las notas de autor tienen como función presentar las anotaciones que los
autores (o en algunos casos los editores) introdujeron en sus propios textos, gene33. No deja de haber una tensión (que puede ser contradictoria) entre el carácter plural, fluido y
dinámico del texto que induce el tratamiento digital (en el que, según dicen ingeniosamente algunos,
Heráclito y su materialismo han desplazado el idealismo platónico) y la necesaria estabilidad e incluso rigidez que exigen los sistemas automáticos de búsqueda, la estilometría, la minería de datos, y
todos los acercamientos cuantitativos a textos o corpus. Véase Pierazzo (2016: 56). Las matemáticas
siempre han sido platónicas.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
127
ralmente con referencias eruditas. Decidimos presentar estas notas por eskeumorfismo, es decir imitando, visualmente, los marginalia del texto editado (cf. Fig. 4):
34
Fig. 4. Notas de autor: el ejemplo del Discurso poético de Juan de Jáuregui (2016)
en la edición de Mercedes Blanco34
Las notas de edición crítica dan un aparato positivo de variantes o informan
sobre algún accidente del testimonio y alguna decisión del editor para compensarlo. Las correspondientes llamadas de notas son números romanos.
Las notas de edición, las más abundantes y corrientes, son notas explicativas del
editor, y cumplen con varios propósitos: aclarar dificultades léxicas o sintácticas,
desplegar las referencias eruditas, dar traducciones de los textos latinos o en otras
lenguas extranjeras, suplir el carácter elíptico o alusivo del texto, proporcionar datos
contextuales imprescindibles para la comprensión de determinado fragmento.
III. Características de la edición XML-TEI
Las ediciones que proponemos en el marco del proyecto ∏ólemos no solo se
ajustan a la gramática de la Text Encoding Initiative. También, por insertarse en
el Labex OBVIL, arriba descrito, siguen una serie de pautas y herramientas creadas en el marco de dicho Labex. Empezaremos por describir este marco colectivo, en la medida en que determina algunos aspectos de la estructura de las ediciones, antes de presentar las adaptaciones que hicimos para dotar a ∏ólemos de
unas herramientas específicas.35
34. https://obvil.sorbonne-universite.fr/corpus/gongora/1624_discurso-poetico.
35. Sobre estas cuestiones, véase la luminosa síntesis de Susanna Allés-Torrent (2015).
Editar el Siglo de Oro en la era digital
128
Mercedes Blanco - Aude Plagnard
III.1. Los límites de la conversión automática
En la primera fase del proyecto, nuestro equipo trabajaba en ficheros .docx y la
conversión al TEI corría a cargo de los informáticos del OBVIL. Frédéric Glorieux había creado dos tipos de programas para semi-automatizar la conversión
del formato editorial (.doc) a los distintos formatos de publicación que ofrecía
el OBVIL (tei, html, epub, kindle, txt e iramuteq):
1. Odette,36 un programa que convierte los documentos del formato ODT
al formato TEI;
2. Una librería de programas libres XSLT/PHP titulada Teinte suite destinada al conjunto del proyecto y que aseguraba la conversión al html y a
los demás formatos.
Esta opción metodológica y estas herramientas estaban pensadas para disociar las competencias de edición científica y las de edición digital. Traduzco a
continuación la presentación que Frédéric Glorieux hizo de esta herramienta:
Odette le garantiza al LABEX OBVIL el control de una de las etapas decisivas en su
cadena de producción de textos. En un contexto universitario, existe la posibilidad de
movilizar a muchos colaboradores bien formados (estudiantes, doctorandos, investigadores) de forma puntual. Enseñarles el lenguaje XML-TEI representa una formación a
largo plazo, para la que suelen estar poco motivados porque es una competencia que
raramente podrán volver a movilizar. El OBVIL invirtió entonces en un uso avanzado
del tratamiento de textos (creación y aplicación de estilos) [...] [para] que un colaborador se vuelva operativo de modo más rápido, en base a una competencia que le resultará necesaria en un futuro, de forma que perfecciona sus prácticas. [...] El propósito es
hacer entender que la estructuración informática de un texto no es un artesanado subalterno, reductible a un trabajo de secretaría editorial cosmética, sino que constituye una
responsabilidad intelectual de la que debe hacerse cargo un autor o un editor.37
Se trataba pues de optimizar la operatividad de los editores científicos, aunque reduciendo su intervención al ámbito del tratamiento de texto, y apostando
por la conversión automática del texto del .doc al .xml
Los programas de conversión estaban destinados a satisfacer las necesidades
de ediciones aplicadas a corpus muy distintos entre sí,38 con la idea de simplificar el proceso de conversión a la escala del Labex. Esta práctica, que funcionaba
hasta cierto punto a dicha escala, pronto demostró sus límites en la medida en
que tuvimos que solicitar una serie de funcionalidades específicas que implicaban diseñar un etiquetado propio para nuestro proyecto.
36. https://obvil.sorbonne-universite.fr/developpements/odette.
37. Traducimos a Glorieux (2018).
38. Véase la paleta de proyectos desarrollados en el OBVIL: https://obvil.sorbonne-universite.fr/projets.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
129
Frente a esta situación, decidimos asumir un trabajo de edición y de etiquetado
XML-TEI más fino que el que nos permitían estos programas de conversión y seguir
colaborando con los ingenieros para que adaptaran las hojas .xsl a nuestro proyecto,
tanto para la publicación en HTML como para la extracción de datos. Dominar el
TEI supuso un salto cualitativo para nuestras ediciones, aunque nos vemos todavía
limitados por el hecho de no no ser autónomos en el manejo de la escritura en .xsl.
III.2. Estructura general de nuestras ediciones
Nuestras ediciones siguen la estructura clásica de los documentos TEI: un encabezado, o <teiheader>, que recoge los metadatos, seguido por el cuerpo (o
<body>) de la edición. Este último se subdivide a su vez en dos partes principales, la primera para la introducción —con su arborescencia de apartados y subapartados que reflejan la estructura común a todas nuestras ediciones, tal y como
la describimos más arriba— y la segunda para el texto de la edición —con divisiones variables, en función de la propia estructura del texto—. El índice de las
Epístolas satisfactorias de Martín de Angulo y Pulgar, visto en edición TEI, proporciona un buen ejemplo de esta estructura:
39
Fig. 5. Índice en TEI de la edición por Juan Manuel Daza las Epístolas satisfactorias
de Martín de Angulo y Pulgar (2018).39
39. https://github.com/gongoradigital/polemos/blob/gh-pages/1635_epistolas.xml.
Editar el Siglo de Oro en la era digital
130
Mercedes Blanco - Aude Plagnard
El TEI-header de nuestras ediciones consta de los siguientes elementos: <fileDesc>, <encodingDesc> y <profileDesc>.
<fileDesc> describe las características del texto editado (título o <titleStmt>
y fuentes en las que se basa la edición, descritas en el <sourceDesc>) y de la edición (<editionStmt> y <publicationStmt>).
<encodingDesc> recapitula a su vez los tres niveles de notas que identificamos anteriormente:
L’édition comporte trois niveaux de notes. note[@place=”bottom”] : notes d’éditeur
(décimal par défaut) note[@place=”margin”] : notes marginales de l’auteur (pas de
numérotation) note[@type=”app” rend=”I”] : notes d’apparat (I = romain).40
En la edición en Word proporcionada por los editores, las notas a pie de
página iban precedidas de una marca que indicaba su categoría ([NDA],
[NDEC], [NDE]) diferencias que son traducidas automáticamente al lenguaje
de marcado XML-TEI y su procesamiento y presentación resultan mucho más
ágiles y cómodos que en los métodos tradicionales.
Finalmente, <profileDesc> recapitula la fecha de creación del documento y
su idioma.
41
Fig. 6. TEI-header de la Carta de Juan de Espinosa a Juan de Arguijo (2021),
editada por Héctor Ruiz.41
40. Esta mención se encuentra en el <encodingDesc> de todas nuestras ediciones.
41. https://github.com/gongoradigital/polemos/blob/gh-pages/1662_apologetico.xml.
Editar el Siglo de Oro en la era digital
131
Editar una obra y los testimonios de su recepción. El caso de Góngora
III.3. Editar la obra de Góngora
Nuestra idea, cuyo desarrollo presenta todavía bastantes deficiencias, fue utilizar el
corpus de textos polémicos y comentarios como una caja de resonancia para el
texto mismo de Góngora, algo que permitiera pasar de sus versos a las prosas de
sus comentaristas, detractores y defensores. Para ello editamos la obra completa de
Góngora, codificando en TEI una versión de la edición de esta obra por Antonio
Carreira, revisada por el editor: o sea las poesías de atribución segura o muy probable, el teatro y el epistolario. En esta edición se pueden realizar búsquedas en la
obra de Góngora con mayor comodidad y exhaustividad que cualquier otro método disponible, puesto que pueden buscarse grupos de palabras, palabras cercanas, o cualquier otro tipo de cadena de signos. Por lo demás, aparecen al margen
de la edición de cada poema llamadas de nota a lugares en que estos versos son
comentados. Por ejemplo, pueden leerse, al margen del texto de Góngora las anotaciones de Díaz de Rivas a modo de llamadas de notas marginales. En el marco
de este trabajo, nos centraremos exclusivamente en el etiquetado de la poesía, que
es la parte del corpus que más conexiones presenta con la polémica.
Para la poesía, publicada en 2016, compusimos un documento formado de una
división (<div>) por poema y numeramos con un identificador único (<xml:id>)
cada poema y cada verso. Los poemas fueron numerados conforme al modelo de
la edición (de 1 a 418 para los poemas de atribución segura, y 419 a 477 para
aquellos de atribución probable) e introdujimos subdivisiones para distinguir las
subpartes formadas por la dedicatoria y el texto de la Soledad primera y el texto de
la Soledad segunda (respectivamente, xml:id=”poem264A”, xml:id=”poem264B”
y xml:id=”poem264C”). En efecto, estas tres piezas, reunidas bajo el mismo número
264 en la edición de referencia, quedan generalmente identificadas por separado en
los discursos de los polemistas. A su vez, los versos se numeraron (xml:id=”l264A.1”),
permitiendo las referencias concretas a cada uno de ellos. Finalmente, identificamos,
aunque sin numerarlas, las estrofas que componen cada poema (cf. Fig. 7). Este último etiquetado podría servir de base, en un futuro, para la identificación automática
de las secuencias métricas, tarea en la que no nos hemos lanzado todavía.
42
Fig. 7. Luis de Góngora, Dedicatoria de la Soledad primera (2016) – versión TEI.42
42. https://github.com/gongoradigital/gongoraobra/blob/gh-pages/gongora_obra-poetica.xml.
Editar el Siglo de Oro en la era digital
132
Mercedes Blanco - Aude Plagnard
IV. Hacia una lectura distante del corpus
Las ediciones XML-TEI así establecidas nos permitieron desarrollar herramientas para explorar el corpus en su conjunto. Para guiar esta exploración, nos
planteamos tres preguntas:
— ¿Qué textos de Góngora fueron objeto de debate en el marco de la polémica?
— ¿Qué obras y autoridades (antiguas o modernas), fueron convocadas
para argumentar en estos debates?
— ¿A qué autores contemporáneos, también involucrados en la polémica,
se responde en cada texto? ¿A quién se apoya y defiende o contra quién
se argumenta?
Para responder estas preguntas, desarrollamos varias herramientas apoyadas
en la misma cadena de codificación y recolección de los datos, según cuatro
etapas sucesivas:
1.
2.
3.
4.
Anotación filológica
Etiquetado en TEI
Escenario de transformación para la recolección de los datos etiquetados
Puesta en base de los datos recolectados para la constitución de tablas
relacionales y gráficos.
IV.1. De la anotación al etiquetado
La anotación filológica de las ediciones permite descifrar las alusiones, referencias y citas contenidas en el discurso del polemista, que nuestros editores anotan,
y comentan en el apartado “Fuentes” de la introducción. Si bien las indicaciones
bibliográficas representan un primer grado de homogeneización de la información, el etiquetado nos permite sistematizar la identificación de estos datos y
recopilarlos de forma automática. Ya lo hemos realizado para dos casos concretos: los versos de Góngora citados en la polémica y las autoridades alegadas para
respaldar la argumentación.
En cuanto a los primeros, identificamos, en la anotación, las referencias a
poemas o versos de Góngora que son objeto de un debate mediante un identificador: las mayúsculas “OC” seguidas por el número de poema y de verso tal y
como aparecen numerados en la Obra poética completa de Góngora editada por
Carreira que nos sirvió de edición de referencia. Esta información fue luego
etiquetada parcialmente en las ediciones TEI, limitándonos a los versos citados
textualmente. En este caso concreto, incluimos una etiqueta <ref> dentro de la
etiqueta de cita (<quote>), con la doble finalidad de marcar la información para
Editar el Siglo de Oro en la era digital
133
Editar una obra y los testimonios de su recepción. El caso de Góngora
su futura extracción y crear un enlace que permite navegar de la edición del
texto polémico a la de la obra poética de Góngora. Este tipo de etiquetado es
especialmente valioso para los textos que citan mucho a Góngora, máxime
cuando su propia estructura depende de estas citas, como es el caso de los comentarios, generalmente estructurados poema por poema, estrofa por estrofa y
verso por verso. Damos a continuación el ejemplo del etiquetado de las Anotaciones a la Segunda Soledad de Pedro Díaz de Rivas, editado por Melchora Romanos y Patricia Festini, en TEI (Fig. 8) y en HTML (Fig. 9):
43 44
Fig. 8. Pedro Díaz de Rivas (2017) anotando la Soledad segunda,
editada por Melchora Romanos y Patricia Festini – versión TEI.43
Fig. 9 Pedro Díaz de Rivas (2017) anotando la Soledad segunda,
editada por Melchora Romanos y Patricia Festini – versión HTML.44
43. https://github.com/gongoradigital/polemos/blob/gh-pages/1617_soledad-segunda-diaz.xml
44. https://obvil.sorbonne-universite.fr/corpus/gongora/1617_soledad-segunda-diaz.
Editar el Siglo de Oro en la era digital
134
Mercedes Blanco - Aude Plagnard
En el ejemplo arriba ilustrado, pasamos de la mención “OC264C.1”, que
identifica el primer verso de la Soledad segunda, al enlace https://obvil.sorbonneuniversite.fr/corpus/gongora/gongora_obra-poetica/poem264C#l264C.1, que
remite directamente al mismo en nuestra edición.
También decidimos sistematizar el etiquetado en lo que toca a los autores
referidos en los textos. Estos pueden ser de dos tipos: por un lado, autoridades
antiguas, medievales o contemporáneas, traídas a colación para apoyar un argumento; o bien, y por otro lado, contemporáneos de la República de las Letras
involucrados en la polémica y citados en los textos como aliados o como antagonistas. Las autoridades forman una parte esencial de la anotación filológica. Son
objeto de una detenida atención en las notas de edición (NDE) que identifican
las citas o alusiones, en el apartado “Fuentes” de la introducción que las analiza,
y también en lo que denominamos la “biblioteca hipotética del polemista”. Llamamos así el primer apartado de la bibliografía, donde aparecen las “Obras citadas o consultadas por el polemista”. En cuanto a los contemporáneos, más o
menos involucrados en la polémica, sus menciones son menos frecuentes, aunque altamente significativas.
Para identificar a uno y otro tipo de autores, utilizamos la etiqueta <persName>,
completada por una serie de atributos:
— @authority o @polemist, para especificar si se trata de una autoridad o
de un personaje implicado en la polémica;
— @key, para identificar de forma unívoca al autor citado, que en el texto
puede encontrarse designado por una multitud de nombres, pronombres o perífrasis;
— en el caso de las autoridades, añadimos el atributo @precision, que nos
permitió establecer una casuística para distinguir las autoridades citadas
de aquellas simplemente mencionadas o aludidas, entre las citadas, las
que lo son directa o indirectamente, es decir, de primera mano, o mediante polianteas u obras de divulgación; son muchas las citas de este
último tipo, como lo vemos en el caso de Manuel de Faria e Sousa que,
en las Noches claras, a partir de un puñado de libros de tipo enciclopédico despliega en boca de sus personajes una erudición de pura fachada.45
— de nuevo, en el caso de las autoridades citadas textualmente, añadimos
los atributos @unit=”quotes” y @quantity para ponderar estas citas.
Con este etiquetado, obtuvimos una identificación unívoca, homogénea y
sistemática de los fenómenos aquí descritos, que traduce el detallado análisis de
los filólogos editores al lenguaje de las etiquetas XML.
45. Faria e Sousa (2019).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
135
IV. 2. Escenario de transformación y análisis de redes
Este etiquetado nos permitió cartografiar, en base a un análisis de redes, estos
fenómenos y analizarlos de manera cuantitativa y cualitativa.
Construimos ciertas herramientas artesanales para la minería de datos y la
lectura distante de este amplio corpus, que figuran en la sección “gongotools” de
nuestro github:46 las hojas .xsl “polemos2nodes” y “polemos2edges” forman un
escenario de transformación que permite extraer los metadatos relativos a los
poemas de Góngora citados, a las autoridades y a los polemistas, con el fin de
circular en el corpus mediante el análisis de redes.47 Los xsl compilan automáticamente dos tablas, “graph-to-gongora” y “graph-to-authorities”, adaptadas
para el programa de análisis de redes Gephi. A partir de estas tablas y aplicando
Gephi, cartografiamos por un lado los poemas de Góngora citados por los textos
de la polémica, y por otro las autoridades citadas. A partir de ahí, ha sido posible
construir una red de citas para situar los textos unos respecto a otros, en función
de su grado de centralidad, como ya hicimos en un artículo del 2018.48
El gráfico relacional de textos polémicos y autoridades mencionadas permite distinguir entre las autoridades más citadas, que pertenecen a la cultura común —Virgilio, Horacio, Homero, Marcial, Quintiliano, Cicerón o Garcilaso—, y las que, por el contrario, manifiestan una erudición más recóndita y
especializada. Como indicábamos en otro lugar, constatamos que Francisco del
Villar (Compendio poético) y Lope de Vega (en su correspondencia con Colmenares y en la Filomena) comparten un mismo plantel de autoridades humanistas:
Justo Lipsio, Cipriano Suárez y Francisco Sánchez de la Brozas.49
Evidentemente, estas herramientas son solo una pequeña muestra de las
posibilidades de exploración de este riquísimo corpus digital. Aunque su estado
actual de desarrollo es limitado, nos permiten medir la utilidad hermenéutica de
navegar entre estos textos mediante distintas vías.
46. Nuestro repertorio Github, “gongoradigital” (https://github.com/gongoradigital) recoge
todo el material actualmente disponible del proyecto ∏ólemos. Consta de once repositorios. Tres
de ellos contienen los textos publicados en la página del Labex OBVIL: “polemos” reúne las ediciones de la polémica; “gongoraobra”, el conjunto de la polémica gongorina; y “salviati-tasso”
alberga un proyecto afín al nuestro, la edición de uno de los testimonios de la polémica tassiana
por Chris Geekie. Otros cuatro contienen herramientas de trabajo: “img” almacena las imágenes
publicadas por el proyecto; “gongotools” reúne las herramientas de exploración distante del corpus; mientras que “polemos-naked” propone una versión sin etiquetas del corpus, para su exploración por programas de textometría; “teinte” contiene los programas de transformación que
usamos en el proyecto. Los otros tres son dedicadas a la formación interna o a la comunicación del
proyecto.
47. Otra herramienta de Gongotools: una serie de xsl que prepara el corpus para su exploración
en programas de textometría (iramuteq o txm). Se trataba, en este caso, de suprimir toda la información editorial. El tema ha sido explorado por Lescasse (2018).
48. Plagnard y Ruiz Soto (2018).
49. Elvira y Plagnard (2021: 53 y ss).
Editar el Siglo de Oro en la era digital
136
Mercedes Blanco - Aude Plagnard
IV. 3. Navegar en el corpus
Para terminar, nos centraremos en este último aspecto, pensando tanto en la
perspectiva del editor digital como del lector de la edición frente a su pantalla.
Construimos dos herramientas sencillas para este propósito: por un lado, la retrolectura de la polémica a partir de la poesía de Góngora; por otro, una reflexión sobre la intertextualidad en la polémica.
El “graph-to-gongora” descrito arriba (que recapitula las citas del corpus gongorino en los textos polémicos) nos permite reconstituir la red de los poemas de
Góngora citados por los polemistas a lo largo del tiempo, es decir, leer a Góngora
en función del desarrollo de la polémica. Procediendo al revés, empezamos a construir una versión de la obra de Góngora —organizada cronológicamente, como el
manuscrito Chacón y la Obra completa editada por Carreira— que sirviera de
punto de partida para la lectura de la polémica. Al margen de cada poema o de
cada verso, introdujimos enlaces que remiten a los lugares de textos polémicos que
citan o comentan dicho fragmento. La herramienta es de las más sencillas y tan
solo estamos iniciando este proceso —véase Fig. 10—, que merecería beneficiarse
de la edición de los comentarios, piezas inseparables de la polémica.
50
Fig. 10. Luis de Góngora, “Soledad primera”, anotada por los polemistas, 2016.50
50. https://obvil.sorbonne-universite.fr/corpus/gongora/gongora_obra-poetica#poem264B.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
137
Esta herramienta ofrece, sin embargo, un observatorio útil sobre los debates, que sistematiza el que ya encontrábamos —aunque de forma muy fragmentaria— en algunas ediciones del poeta, por ejemplo en la de las Soledades por
Robert Jammes, que remite con frecuencia a distintos lugares de los comentarios
y de las piezas polémicas.
Para cerrar esta reflexión, queremos explorar —aunque sea, de momento,
en términos bastante especulativos— la modelización de la intertextualidad en
la polémica gongorina. Tal es, en efecto, la cuestión central para la exploración
de los debates: ¿quién responde a quién, qué texto a qué texto, en base a qué
argumentos y acerca de qué poemas?
Evidentemente, el etiquetado de los polemistas mencionados al hilo de los
textos ya proporciona algunas pistas. Este método tiene interés limitado, sin
embargo, para abarcar el fenómeno, porque reduce la intertextualidad a los ataques ad hominem, sin tomar en cuenta el texto concreto al que responden. Si
bien es cierto que tales ataques, muy explícitos y deliberadamente violentos,
existieron y constituyen una de las modalidades de la polémica —pensemos en
el Anti-Jáuregui atribuido a Lope de Vega o en el Anti-faristarco de Martín de
Angulo y Pulgar—, el carácter anónimo de muchos textos, por razones de censura o de estrategia, complica el proceso.
Por otra parte, las relaciones de intertextualidad son muchas veces más difíciles de describir e implican recurrir a matices más finos. Tomemos el ejemplo
de la llamada “Carta echadiza”: esta carta anónima “defiende a Lope de presuntos ataques de Góngora, presentando al primero como inocente y al segundo
como malicioso e injusto. Se suele atribuir al mismo Lope [ ]”.51
Ahora bien, dicha misiva está conectada con una amplia red de textos. En
ella, Lope (suponiendo que sea él el autor) reacciona a un Góngora que se
quejaba, en una carta perdida a Almansa difundida por este en la corte,52 de
las acusaciones lanzadas por el Fénix en el soneto “Tus bellos ya me matan
ojos”.53 En respuesta, Lope sostiene que el soneto no apuntaba a Góngora sino
a sus malos imitadores y alega como prueba de su admiración por don Luis
otro soneto, “Canta, cisne andaluz, que el verde coro”.54 Este intercambio se
inscribe en la continuidad de la anterior correspondencia entre el círculo de
Lope y el de Góngora55 y describe con sorna la conmoción que el “Antídoto”
de Jáuregui56 provocó entre los defensores de Góngora, burlándose una vez
más de las “Advertencias” de Andrés de Almansa y Mendoza.57 Por la fecha,
51.
52.
53.
54.
55.
56.
57.
Ibid., núm. 34, 575.
Ibid., núm. 33, 574.
Ibid., núm. 32, 574.
Ibid., núm. 30, 573.
Ibid., núms. 9-12, 564-566.
Ibid., núm. 25, 571.
Blanco, Elvira y Plagnard (2021: núm. 8, 564).
Editar el Siglo de Oro en la era digital
138
Mercedes Blanco - Aude Plagnard
puede que Lope ya tenga en mente las defensas de Amaya58 y del Abad de
Rute.59 Como vemos, son muy variados los tipos de relaciones establecidos
entre la “Carta echadiza” y esta amplia red de textos. Este acercamiento sutil a
la intertextualidad se presta sin duda más a una lectura cercana, cualitativa,
que a una lectura cuantitativa.
Con todo, Muriel Elvira y Aude Plagnard han generado un primer intento
de modelizar las relaciones intertextuales a escala de toda la polémica —por lo
menos, tal y como se conoce en la actualidad—, seleccionando un único fenómeno intertextual: el de “los textos que suscitaron respuestas críticas directas o
merecieron apoyo y defensa por parte de sus contemporáneos”,60 es decir, aquellos que desempeñaron un papel motor en la polémica. De este modo, conseguimos identificar redes de textos que dialogan entre sí de forma inequívoca y
constituyen etapas de mayor o menor duración en el desarrollo de la polémica,
tal y como podemos observar en la siguiente figura (11): en azul, la polémica
epistolar que constituye el episodio más temprano del que tenemos noticia; en
rojo, los debates en torno a los textos de Jáuregui, algo más tardíos; en celeste,
las respuestas de Lope al soneto “Patos del aguachirle”; en naranja, los grandes
textos del decenio de 1630.
Fig. 11. “Intertextualidad directa en la polémica en función del tiempo”,
apud Elvira y Plagnard, 2021, p. 58.
58. El ya mencionado Antiantídoto, in Blanco, Elvira y Plagnard (2021: núm. 27, 572).
59. La Apología, in Blanco, Elvira y Plagnard (2021: núm. 28, 572).
60. Elvira y Plagnard (2021: 53).
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
139
Conclusión
Sometiéndonos a un proceso de auto-análisis a posteriori, hemos tratado de
extraer algunas enseñanzas del proyecto ∏ólemos —en el que llevamos trabajando unos diez años—, con la esperanza de que puedan aplicarse a otros casos. Vimos que su programa ha consistido y consiste en la edición y estudio de la polémica gongorina, y en general, de los documentos de recepción de Góngora en
su siglo. Esperamos que haya quedado claro por qué este material se prestaba a
un tratamiento digital y por qué hubiera sido difícil no solo realizar el proyecto
por los medios tradicionales, sino incluso concebirlo.
En base a ello, propusimos resaltar la naturaleza de la edición digital, que no
es una transformación optimizada de la edición filológica, sino una creación de
objetos nuevos a partir de los textos. Con la experiencia limitada de ∏ólemos y
con un par de ejemplos más, ya se puede intuir que estos objetos renuevan nuestra atención por la historicidad de los textos, tanto en su génesis (tradición material), como en su recepción e interpretación (caso de nuestra polémica). A su
manera, la construcción de tales objetos textuales implica una renovación y redefinición de la filología.
En el caso de nuestro proyecto, la herramienta clave para la edición digital
fue el lenguaje XML-TEI. Su aprendizaje y uso fue la condición para realizar la
edición misma, en cuanto operación que se compromete a actualizar de modo
óptimo un corpus, poniendo a disposición de quienes lo consulten los medios
de su comprensión y contextualización. Por otro lado, nos permitió, mediante
métodos como los escenarios de transformación, construir herramientas para
leer el corpus en su totalidad, sin hipótesis previas. En especial, construimos una
serie de redes de relaciones entre textos y entre agentes de la polémica que constituyen, como lo sugiere el OBVIL (Observatorio de la Vida Literaria), la vida
observable de la literatura.
Editar el Siglo de Oro en la era digital
140
Mercedes Blanco - Aude Plagnard
Bibliografía
Allés-Torrent, Susanna, “Edición digital y algunas tecnologías aliadas: codificación TEI y transformaciones XSLT”, Ínsula. Revista de Letras y Ciencias
Humanas, 822 (junio de 2015), pp. 1-30.
Allés-Torrent, Susanna, “Crítica textual y edición digital o ¿dónde está la
crítica en las ediciones digitales”, Studia aurea, 14, 2020, pp. 63-98.
Angulo y Pulgar, Martín de, Epístolas satisfactorias, ed. Juan Manuel Daza,
Paris, Sorbonne Université – Labex OBVIL, 2018 https://obvil.sorbonneuniversite.fr/corpus/gongora/1635_epistolas, https://github.com/gongoradigital/polemos/blob/gh-pages/1635_epistolas.xml.
Artigas, Miguel, “Un opúsculo inédito de Lope de Vega. El Anti-Jáuregui del
Liz. D. Luis de la Carrera”, Boletín de la Real Academia Española, XII, 1925,
pp. 587-605.
Blanco, Mercedes, “La polémica como fermento creativo en el Lope de la vejez”, Anuario Lope de Vega, n°14 (2008), pp. 37-66.
Blanco, Mercedes, Elvira, Muriel, y Plagnard, Aude “La recepción polémica
de la poesía gongorina: propuesta de catalogación (1612-1692)”, El universo
de una polémica. Góngora y la cultura del siglo XVII, coords. Mercedes Blanco
y Aude Plagnard, Madrid, Iberoamericana-Vervuert, 2021, pp. 557-680.
Blanco, Mercedes y Mulas, Margherita, Carta sobre la poesía nueva de don Luis
de Góngora, Paris, Sorbonne Université – Labex OBVIL, 2018 https://obvil.
sorbonne-universite.fr/corpus/gongora/1634_cartas-cascales, https://github.
com/gongoradigital/polemos/blob/gh-pages/1634_cartas-cascales.xml.
Cacho Casal, Rodrigo, “¿Qué captas, nocturnal, en tus canciones...?. Edición y estudio de un soneto antigongorino de Quevedo”, Calíope, 10.2, 2004, pp. 51-71.
Carmona, Alba, “¿Escribía Lope de Vega con falsilla? Aproximación a El mayordomo de la duquesa de Amalfi y El perro del hortelano desde el análisis de las
redes sociales”, Bulletin of Hispanic Studies, XCVIII/6 (2021), pp. 839-856.
Carreira, Antonio, “Presencia de Góngora en la poesía de Quevedo”, en El
universo de Góngora. Orígenes, textos y representaciones, ed. Joaquín Roses,
Córdoba, Diputación de Córdoba, 2014, pp. 473-494.
Conde Parrado, Pedro, “Antagonistas de Góngora: Quevedo”, en El universo
de una polémica. Góngora y la cultura española del siglo XVII, eds. Mercedes
Blanco y Aude Plagnard, Madrid, Iberoamericana, 2021, pp. 201-214.
Díaz de Rivas, Pedro, Anotaciones a la Segunda Soledad, eds. Melchora Romanos y Patricia Festini, Paris, Sorbonne Université – Labex OBVIL, 2017,
https://obvil.sorbonne-universite.fr/corpus/gongora/1617_soledad-segunda-diaz.
Elvira, Muriel y Plagnard, Aude, “Analizar y cartografiar la polémica gongorina: base de datos, catálogo y análisis de redes”, El universo de una polémica.
Góngora y la cultura española del siglo XVII, coords. Mercedes Blanco y Aude
Plagnard, Madrid, Iberoamericana, 2021, pp. 29-64.
Editar el Siglo de Oro en la era digital
Editar una obra y los testimonios de su recepción. El caso de Góngora
141
Espinosa, Juan de, Carta... a Juan de Arguijo, ed. Héctor Ruiz Soto, Paris, Sorbonne Université – Labex OBVIL, 2021, https://obvil.sorbonne-universite.
fr/corpus/gongora/1613_carta-espinosa,
Faria e Sousa, Manuel de, Noches claras (fragmentos), ed. Aude Plagnard, Paris, Sorbonne Université – Labex OBVIL, 2019, http://obvil.sorbonneuniversite.site/corpus/gongora/1624_nochesclaras,
https://github.com/
gongoradigital/polemos/blob/gh-pages/1624_nochesclaras.xml.
Fernández de Córdoba, Francisco, Examen del Antídoto o Apología por las
Soledades de don Luis de Góngora contra el autor del Antídoto, ed. Matteo
Mancinelli, Paris, Sorbonne Université – Labex OBVIL, 2019, https://obvil.sorbonne-universite.fr/corpus/gongora/1617_examen, http://gongoradigital.github.io/polemos/1617_examen.xml.
García Aguilar, Ignacio, “Una nueva herramienta para el estudio de los paratextos de Lope mediante la edición digital y el etiquetado semántico TEI:
PRESOLO”, Anuario Lope de Vega. Texto, literatura, cultura, XXIX (2023),
pp. 224-286.
Glorieux, Frédéric, “Odette”, Sorbonne Université – Labex OBVIL, 2015,
https://obvil.sorbonne-universite.fr/developpements/odette.
Góngora, Luis de, Poesía, ed. Antonio Carreira, Sorbonne Université — Labex
OBVIL, 2016, https://obvil.sorbonne-universite.fr/corpus/gongora/gongora_obra-poetica, https://github.com/gongoradigital/gongoraobra/blob/
gh-pages/gongora_obra-poetica.xml.
Gutiérrez Valencia, Cristina, “Estos días lo he pasado mal con los de la nueva poesía, Lope como antagonista de Góngora” en, El universo de una polémica. Góngora y la cultura española del siglo XVII, coords. Mercedes Blanco
y Aude Plagnard Madrid, Iberoamericana, 2021, pp. 215-238.
Jáuregui, Juan de, “Carta del licenciado Claros de la Plaza al maestro Lisarte de
la Llana” en Sales españolas o agudezas del ingenio nacional (Segunda Serie),
ed. Paz y Meliá, Madrid, Sucesores de Rivadeneyra, 1902, pp. 277-296.
Jáuregui, Juan de, Discurso poético [1624], ed. Mercedes Blanco, Paris, Sorbonne Université – Labex OBVIL, 2016, http://obvil.sorbonne-universite.site/
corpus/gongora/1624_discurso-poetico, https://github.com/gongoradigital/polemos/blob/gh-pages/1624_discurso-poetico.xml.
Lescasse, Marie-Églantine, “L’emploi du concept de propiedad dans la polémique gongorine”, Nouvelles méthodes pour une nouvelle poésie : Góngora et les
humanités numériques, Mercedes Blanco (éd.), e-Spania, n° 29, février 2018,
https://doi.org/10.4000/e-spania.27486
Matas Caballero, Juan, Juan de Jáuregui: poesía y poética, Sevilla, Diputación
Provincial de Sevilla, 1990.
Molanes, Mónica y Candelas, Manuel Ángel. “Las adaptaciones lopescas de
Juan Mayorga: La dama boba en el siglo xxi”. Anuario Lope de Vega. Texto,
literatura, cultura, 2011, Vol. 17, pp. 66-84, https://raco.cat/index.php/
anuariolopedevega/article/view/286225.
Editar el Siglo de Oro en la era digital
142
Mercedes Blanco - Aude Plagnard
Montero, Juan, “La rivalidad literaria entre Lope y Jáuregui”, Anuario Lope de
Vega, vol. 14, núm. 2, 2008, pp. 181-212.
Pezzini, Sara y Ruiz Soto, Héctor, “Editar a Gongora con instrumentos digitales: bases metodológicas y teóricas para un hipertexto de la polémica gongorina”, Revista de Humanidades Digitales, n°1, 2017, pp. 35-56, https://
revistas.uned.es/index.php/RHD/issue/view/1096.
Pierazzo, Elena, “Modelling Digital Scholarly Editing: From Plato to Heraclitus”, en Digital Scholarly Editing: Theories and Practices, ed. Elena Pierazzo y Matthew James Discroll, Open Book Publishers, 2016, pp. 41-58.
<https://doi. org/10.11647/OBP.0095.03>.
Plagnard, Aude y Ruiz Soto, Héctor, “Polemos2nodes/polemos2edges : première lecture de la polémique gongorine par l’analyse de réseau”, Nouvelles
méthodes pour une nouvelle poésie : Góngora et les humanités numériques,
Mercedes Blanco (éd.), e-Spania, n° 29, février 2018, https://doi.org/10.4000/
e-spania.27470.
Presotto, Marco, “Hacia un modelo de edición crítica digital del teatro de Lope”,
Anuario Lope de Vega. Texto, literatura, cultura, XXI (2015), pp.79-94.
Rojas Castro, Antonio, Luís de Góngora, Soledades. Edición crítica digital, ed.
Antonio Rojas Castro, <http///soledades.uni-koeln.de/>.
Roses Lozano, Joaquín, Una poética de la oscuridad. La recepción crítica de las
“Soledades” en el siglo XVII, Londres, Tamesis Books, 1994.
Sahle, Patrick, “What Is a Scholarly Digital Edition”, en Digital Scholarly Editing: Theories and Practices, ed. Matthew James Discroll y Elena Pierazzo,
Open Book Publishers, 2016, <https://doi.org/10.11647/OBP.0095>.
Sliwa, Krysztof, Cartas, documentos y escrituras de Luis de Góngora y Argote
(1561-1627) y de sus parientes, Córdoba, Universiad de Córdoba – Ayuntamiento de Córdoba, 2004, I, pp. 322-336.
—, Cartas, Documentos y Escrituras del Dr. Frey Lope Félix de Vega Carpio (15621635), Newark, Delaware, Juan de la Cuesta, 2007, I, pp. 112-124.
Vega, Lope de, La dama boba: edición crítica y archivo digital. Bajo la dirección
de Marco Presotto y con la colaboración de Sònia Boadas, Eugenio Maggi
y Aurèlia Pessarrodona. PROLOPE, Barcelona; Alma Mater Studiorum –
Università di Bologna, CRR-MM, Bologna, 2015.
Vega, Lope de (atribuido), Anti-Jáuregui, eds. Juan Montero y Cipriano López
Lorenzo, Paris, Sorbonne Université – Labex OBVIL, 2023, https://obvil.
sorbonne-universite.fr/corpus/gongora/1624_anti-jauregui, https://github.
com/gongoradigital/polemos/blob/gh-pages/1624_anti-jauregui.xml.
Zarco Cuevas, Julian, “Las contiendas literarias en el siglo xvii. – III. Una réplica de Lope de Vega contra don Juan de Jáuregui”, La ciudad de Dios,
CXLIII, núm. 1260, 1925, pp. 272-290.
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética
de Garcilaso de la Vega
Eugenia Fosalba
Universitat de Girona
[email protected]
ORCID: 0000-0002-8204-8563
Susanna Allés-Torrent
University of Miami
[email protected]
ORCID: 0000-0002-3616-2285
Resumen
Pronapoli es un proyecto con dos objetivos primordiales: por un lado, estudiar la
estancia italiana del poeta Garcilaso de la Vega, llevada a cabo en Nápoles a intervalos, desde el verano de 1529 hasta la primavera de 1536; por el otro, publicar
una nueva edición crítica digital de su obra poética. Este capítulo aborda las fases
generales por las que ha transcurrido la investigación del equipo; a continuación,
se presenta la plataforma web que se concibe simultáneamente como instrumento
de difusión de los resultados científicos y una herramienta de trabajo; y en fin, y
como tema central, se ofrece una visión genérica de la edición crítica digital de la
obra poética garcilasiana en curso de elaboración y publicación, reflexionando
sobre el proceso ecdótico, el flujo digital filológico, y la presentación final en línea.
Palabras clave
Garcilaso de la Vega; edición crítica digital; modelado de datos, Pronapoli.
Abstract
The Digital Critical Edition of the Poetic Works of Garcilaso de la Vega.
Pronapoli is a project with two main objectives: firstly, to delve into the Italian
stay of the poet Garcilaso de la Vega, spanning from the summer of 1529 to the
spring of 1536 in Naples; secondly, to release a novel digital critical edition of his
poetic oeuvre. This chapter elucidates the overarching phases traversed by the research
team; subsequently, it introduces the web platform, conceived concurrently as a conduit for disseminating scientific findings and as a workspace; lastly, it offers a comprehensive outlook on the ongoing digital critical edition of Garcilaso's poetry, delving
into the ecdotic process, philological digital flow, and ultimate online presentation.
Keywords
Garcilaso de la Vega; scholarly digital edition; data modeling, Pronapoli.
Editar el Siglo de Oro en la era digital
144
Eugenia Fosalba - Susanna Allés-Torrent
1. Garcilaso de la Vega y la estancia italiana:
nuevos puntos de partida y el proyecto Pronapoli
Aunque Garcilaso sea sin duda uno de los autores más representativos del canon
del Siglo de Oro, y que por consiguiente cuente con una muy extensa bibliografía, hay todavía amplias lagunas de conocimiento acerca de su vida y obra. Estas
carencias crecen en torno a su estancia italiana, definitiva en el cosmopolitismo
que va adquiriendo su poesía, y que se prolongó, a intervalos, desde el verano de
1529, y de forma más permanente, a partir de agosto de 1532, hasta la primavera de 1536, poco antes de su muerte en La Provenza.
Con el fin de estudiar la estancia italiana de Garcilaso surgió, así, hacia
2016, la iniciativa Pronapoli,1 en cuyo seno se aglutina un equipo de expertos,
procedente de tradiciones filológicas y literarias distintas, que aspira a llevar a
cabo, desde una óptica interdisciplinar, un acercamiento a la obra de Garcilaso
de la Vega a partir de la recuperación de las coordenadas históricas y literarias de
la estancia del gran poeta en Italia. Desde Pronapoli se ha profundizado durante
los últimos años, en la reconstrucción de los círculos literarios que frecuentó el
poeta, desenterrando academias literarias que permanecían en el olvido, resituando en el tiempo la composición de obras publicadas decenios más tarde
(como el De Poeta de Minturno), revisando las relaciones de Garcilaso con otros
humanistas a través de deudas literarias (mutuas, bidireccionales), nunca atendidas, con poetas contemporáneos, a través de relaciones epistolares clave, poco o
nada analizadas, indagando siempre a través de crónicas de la época y la documentación de archivo. Solo así se va perfilando de forma cabal la figura y la obra
de uno de los personajes más significativos y relevantes del panorama literario,
cultural y político del siglo xvi.
En este capítulo nos centraremos en las fases generales por las que ha transcurrido la investigación del equipo, prestando especial atención a la plataforma web
que alberga los resultados científicos más relevantes, y sirve a su vez de nodo de
información para la comunidad científica, facilita el camino a los futuros investigadores, y funciona como espacio colaborativo de trabajo. Además, ofrecemos
aquí una visión de conjunto de la edición crítica digital de la obra poética garcilasiana que se encuentra en curso de elaboración y publicación, y reflexionamos
sobre el proceso ecdótico, el flujo digital filológico, y el resultado final en línea.
1.1. Garcilaso de la Vega en Italia: Estancia en Nápoles (Fase 1)
Algunos esfuerzos que venían ya llevándose a cabo desde la última década de los
2000, confluyeron en el 2016 en la primera financiación del proyecto “Garcilaso
1. Pronapoli, https://pronapoli.com/
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
145
de la Vega en Italia: Estancia en Nápoles”.2 Un equipo internacional procedente
de filologías latina, italiana e hispánica conformaron la base de un proyecto que
desde el principio se presentaba con vocación interdisciplinar (colaborando las
distintas filologías española, italiana, clásica, así como uno de los mejores historiadores especialistas en el período napolitano e italiano en general).3 En esta primera
ronda de trabajo colectivo, se analizaron de primera mano los textos literarios y
epistolares escritos o dirigidos a Garcilaso, así como la bibliografía secundaria publicada recientemente tanto sobre el propio Garcilaso como sobre los poetas de su
entorno cultural napolitano. El objetivo consistió en revisar algunos matices de sus
presupuestos y abrir nuevas vías de búsqueda en los intersticios de las disciplinas,
indagando en las relaciones personales para determinar las mutuas influencias, los
canales en que llegaron las posibles fuentes a manos del poeta, y ajustar mejor así
el proceso de creación y su timing.4
A lo largo de estos años, ha habido tres líneas de trabajo que se alimentan y
complementan al paso de nuevas investigaciones, con su pertinente reflejo directo en la plataforma en línea colectiva:5
a. Con el fin de reconstruir el ambiente cultural que rodeó a Garcilaso, se
creó una Galería de autores con fichas identificativas de poetas y humanistas. Estos personajes, en algunas ocasiones, son autores de referencia
que residieron en Nápoles en tiempos de nuestro poeta, o que precedieron su estancia, como es el caso de Pontano o Sannazaro; en otros, se
trata de autores a quienes nuestro poeta trató e intercambió con ellos
impresiones y experiencias poéticas, como con Antonio Sebastiano Minturno, Bernardo Tasso o Luigi Tansillo. Así, se han publicado varias fichas bio-bibliográficas gracias a los datos que han ido surgiendo al paso
de las nuevas precisiones en nuestros trabajos: Pietro Bembo, Juan Boscán, Vittoria Colonna, Onorato Fascitelli, Miquel Mai, Antonio Sebas-
2. Proyecto FFI2015-65093-P (2016-2020), financiado por el Ministerio de Economía y Competitividad. Los resultados de esta primera fase pueden verse en: https://pronapoli.com/
3. Véase la sección Equipo en la web, https://pronapoli.com/equipo/
4. Véanse algunos de estos resultados bajo forma de monografías colectivas e individuales: La
égloga renacentista en el reino de Nápoles, ed. E. Fosalba y G. de la Torre, Bulletin Hispanique,
Presses Universitaires de Bordeaux, 2017; Contexto latino y vulgar de Garcilaso en Nápoles: redes de
relaciones de humanistas y poetas (manuscritos, cartas, academias), Peter Lang Verlag, 2018; “Di qui
Spagna et Italia han mostro chiaro l’onor”. Estudios dedicados a Tobia R. Toscano sobre Nápoles en
tiempos de Garcilaso, Studia Aurea Monográfica, Publicaciones Universitat Autònoma de Barcelona, 2019; Clasicismo horaciano en tiempos de Garcilaso de la Vega,ed. E. Fosalba, Bulletin Hispanique, 125-1, 2023.
5. La plataforma de Pronapoli, en su estado actual, se ha construido con uno de los CMS más
utilizados hasta el momento, Wordpress, https://wordpress.org/. A partir de una plantilla genérica se ha ido adaptado el diseño para responder así a las necesidades de presentación concebidas por
el equipo.
Editar el Siglo de Oro en la era digital
146
Eugenia Fosalba - Susanna Allés-Torrent
tiano Minturno, Luigi Tansillo, Bernardo Tasso, Ludovico Ariosto,
Jacopo Sannazaro, Baldassare Castiglione, Alfonso D’Avalos (en proceso), son solo algunos nombres de entre los más conocidos. En la mayoría
de las fichas, además de recoger la información más destacada de fuentes
ya canónicas como el Dizionario Biografico degli Italiani, se allegan datos
dispersos en bibliografía más o menos remota, y se van corrigiendo, ampliando y actualizando otros datos.6
b. A la reconstrucción cultural, se ha sumado una sección sobre las Academias, espacios de reunión de humanistas que seguramente debió frecuentar Garcilaso. Con este objetivo, se han señalado una serie de localizaciones que ayudan a dar una idea de la variedad de cenáculos y tertulias, más
o menos formales, que en esos años reunían a los poetas de la época.7 De
esta manera, se ha ofrecido información que había quedado sólo consignada en nuestras publicaciones de forma, a veces, algo marginal, como por
ejemplo en notas a pie de página, mientras que el geolocalizador visualiza
la ubicación precisa de las mismas.
c. Una tercera sección corresponde a la Biblioteca digital que tiene por
objetivo la reconstrucción de las reproducciones o referencias a los textos manuscritos que hasta la fecha eran desconocidos o simplemente
resultaban poco accesibles, mientras que ahora se ofrecen en un único
espacio virtual.8 Por ejemplo, se han editado y traducido los epigramas
griegos de Giovanni Andrea Gesualdo, pariente de Minturno y autor
de una edición comentada del Canzoniere de Petrarca que se publicó en
Venecia en 1533. Así, en la mayoría de los casos ofrecemos reproducciones, traducciones y transcripciones de manuscritos, de textos hasta
ahora inéditos y estudiados por primera vez, pertenecientes al volumen
facticio (Biblioteca Nacional de Nápoles XIII AA 63), que hasta hace
poco había sido el principal testimonio de dos de las odas latinas de
Garcilaso de la Vega.9
Estas tres líneas de trabajo —con sección propia en la misma web del proyecto (Galería de autores, Academias, Biblioteca digital)— han corrido de forma
paralela a otros esfuerzos destinados a recoger diferentes fuentes primarias correspondientes a ediciones de obras de autores italianos de los primeros cuarenta años del siglo xvi. Además, se ha recopilado bibliografía secundaria, de aportaciones de la crítica tanto hispanista como italianista, útil para llevar a cabo la
investigación en torno a Garcilaso y clasificada por materias y formatos (artícu6. La Galería de autores puede consultarse en, https://pronapoli.com/autores/
7. Para la creación del mapa, se utilizó Google Maps, y se ha añadido a la plataforma de Wordpress, https://pronapoli.com/academias/.
8. La Biblioteca digital se encuentra disponible en: https://pronapoli.com/biblioteca-digital/
9. Para una descripción detallada de este manuscrito, véase el apéndice en Fosalba (2018: 297-328).
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
147
los, capítulos, libros, etc.). En fin, se ha añadido también un Catálogo de impresos en el Regno di Napoli aparecidos también durante la primera mitad del
siglo xvi.10
A lo largo de estos primeros años, además, el equipo ha ido publicando
diferentes volúmenes relativos a la estancia italiana de Garcilaso, así como un
listado de Centros de documentación donde los miembros del equipo desarrollan sus investigaciones. Estos trabajos preliminares proporcionaron un bagaje
sobre el contexto napolitano en el seno del cual Garcilaso desarrolló la parte
más relevante de su obra. Asimismo, esta labor previa nos permitió empezar a
ahondar en aspectos clave que constituirán las fases sucesivas del proyecto,
como el estudio del horacianismo por el que Garcilaso fue tan valorado en
Nápoles, y el plan de edición de las obras de corte más o menos horaciano
(latinas y castellanas) extrayendo el máximo partido de las posibilidades que
ofrece la tecnología digital.
1.2. Garcilaso de la Vega en Italia: Clasicismo horaciano (Fase 2)
En la segunda fase de financiación del proyecto nos propusimos un doble
objetivo:11 por un lado, profundizar en el estudio de su neoclasicismo horaciano,
latino y vulgar, en el contexto italiano y napolitano de Garcilaso, y, por el otro,
en estrecha vinculación con lo anterior, editar digitalmente las odas latinas y las
obras de este sesgo en castellano. Fueron afirmaciones sobre la poesía de Garcilaso como las de Pietro Bembo, seguidas por Paolo Giovio y Girolamo Seripando acerca de la excelencia del horacianismo de sus odas, las que decidieron el
rumbo de esta segunda edición del proyecto, a medida que fue surgiendo la
pregunta acerca del porqué de este elogio compartido, a la que se trata de contestar desde el estudio y edición de la obra latina, y también castellana, escrita
bajo el influjo del venusino.
Pero no solo nos centramos en el estudio filológico: el sistema de investigación que empleamos en Pronapoli trata de poner en relación todos los aspectos del contexto (literarios, históricos, acerca de las relaciones interpersonales descubiertas en poemas y en epistolarios o en los archivos), para
reconstruir la red intelectual en la que el poeta desarrollaba su obra. Esta nueva senda investigadora, que avanza de forma radial, ya ha dado numerosos
frutos y se promete fecunda y extensible a otros tantos poetas siglodoristas que
10. Toda esta información bibliográfica está de momento en la base de datos del Wordpress, pero
en un futuro se espera que pueda exportarse a un gestor bibliográfico, como Zotero, para poder
compartir más fácilmente los metadatos y facilitar la creación de bibliografías específicas.
11. Proyecto PID2019-107928GB-I00 (2020-2024), financiado el Ministerio de Ciencia, Innovación y Universidades (MCIU).
Editar el Siglo de Oro en la era digital
148
Eugenia Fosalba - Susanna Allés-Torrent
residieron largas temporadas en Italia o Europa y que merecerían otros tantos
proyectos al estilo de Pronapoli. Baste recordar a Juan del Encina, Torres Naharro, Cristóbal de Castillejo, Gutierre Cetina, Hernando de Acuña, Jerónimo de Urrea, Diego Hurtado de Mendoza, Jorge de Montemayor, Francisco
de Aldana, Luis Gálvez de Montalvo, Miguel de Cervantes, Juan de Tassis y
Peralta, Francisco de Quevedo, entre tantos otros. Se trata de superar los vetustos límites establecidos por los compartimentos estancos de las actuales
disciplinas, que separa las filologías en autores que componen en latín o en
vulgar, y que aparta la historia y la biografía de las circunstancias de la composición. En definitiva, tratamos de descubrir lo que ha quedado en ángulos
muertos y que arroja una luz nueva, muy reveladora, sobre la interpretación
de la obra en relación con las vicisitudes de su autor.
La consecuencia lógica de la primera etapa de recolección y análisis de datos, así como publicación de los resultados de las primeras vinculaciones entre
ellos, fue la necesidad de una nueva edición crítica y anotada que, por el volumen de trabajo y la gran cantidad de materiales paratextuales, así como por el
equipo multidisciplinar que implicaba, debía ser concebida, creada y publicada
en formato digital y de manera colaborativa. Se decidió así recopilar los textos
que participan con mayor o menor intensidad de esta influencia capital de Horacio, compuestos en la última etapa de la vida de nuestro poeta, para ofrecer
una renovada edición y estudio de los mismos. Entre los textos seleccionados
figura la compleja Égloga II (con rasgos típicamente horacianos solo en la estancia dedicada al beatus ille), y otras obras de factura más decididamente horaciana, como la Epístola a Boscán, la Elegía II, y la Ode ad Florem Gnidi. Por lo que
respecta a sus odas latinas, se editan las tres odas conocidas del poeta, I Ad Antonium Thylesium Ode; II Garsiae Lasi Ode ad Genesium Sepulvedam, y III Sedes
ad Cyprias Venus. Y a estas se han sumado dos más que han aparecido por el
camino, redescubiertas por María Czepiel, miembro del equipo Pronapoli;
obras relevantísimas, antes desconocidas, que, además, están transcritas en un
nuevo testimonio, de factura alcalaína, muy valioso para las demás odas latinas
ya conocidas, que también transcribe. Las nuevas odas son las siguientes: IV
Intentos humilis, Bembe, sonus lyrae, y V Brasicane, meis iure sodalibus.12 Este
carácter multidisciplinar de nuestras indagaciones ha beneficiado también en
gran medida la anotación de las fuentes en su variada extensión de influencias
clásicas, neolatinas e italianas, de obras que están en el centro de ese laboratorio
de experimentación que fue la Nápoles renacentista y, a la vez, se han podido
fijar los textos latinos, en una edición por primera vez crítica, y muy ampliamente anotada, de los mismos.
12. Manuscrito conservado en la Biblioteca Nacional de la República Checa, con la signatura E
IX 1 (Czepiel 2022).
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
149
1.3. Estudio y edición de la obra poética castellana
de Garcilaso de la Vega (Fase 3)
La siguiente fase del proyecto todavía en curso de elaboración (previsiblemente
2024-2028) abarca el estudio y la edición de la obra poética castellana producida por Garcilaso, proponiendo tres líneas de acción. En primer lugar, se pretende ampliar el radio de las investigaciones, incluyendo un estudio más pormenorizado de las fuentes, especialmente gracias al enriquecimiento de la anotación
de la obra castellana que incluirá los estudios llevados a cabo sobre las fuentes
clásicas e italianas. En segundo lugar, se continuará con la edición crítica digital
cubriendo ahora el resto de la obra castellana. Tal empresa no está exenta de
desafíos ecdóticos, pues esta presenta notables problemas textuales aún no revisados (como se verá en el siguiente apartado). El resultado ampliará la edición
crítica que hasta ahora se ha circunscrito a las cinco odas latinas y parte de la
obra castellana seleccionada por su horacianismo, por lo que comprenderá el
resto de la obra castellana: las ocho coplas castellanas, los cuarenta sonetos, las
cuatro canciones petrarquistas, las églogas I y III, y la Elegía I. En fin, también
está prevista la redacción de un nuevo estudio de la biografía del poeta, por
parte de Fosalba, con la colaboración de Adalid Nievas, teniendo en cuenta
trabajos publicados que han arrojado nueva luz sobre el sentido de varios de los
poemas clave, vulgares y latinos, del gran poeta (Oda a Ginés de Sepúlveda, Ode
ad Florem Gnidi, Égloga II, entre otros).
2. ¿Por qué una nueva edición digital de la obra poética
de Garcilaso de la Vega?
En 2021, Joseph Reed, investigador de la Universidad de Brown, perteneciente al proyecto Pronapoli, ya anunció en Studia Aurea, que hacía falta volver
sobre estos textos, en una edición por fin crítica, al tiempo que planteó posibles alternativas a las lecturas aceptadas. Ahora, con el nuevo testimonio para
las tres odas aportado por Czepiel, se han podido revisar los textos con una
nueva mirada. El descubrimiento de Czepiel, relevantísimo, de un nuevo testimonio manuscrito, conservado entre los últimos folios en blanco de un
ejemplar de Doctissimorum nostra aetate Italorum epigrammata, París, Nicolas
le Riche, 1547, aporta las tres odas conocidas en una nueva copia, y dos nuevas odas latinas, una dedicada a Pietro Bembo y otra a Johan Alexander Brassicanus. El libro, editado por Jean de Gagny, es una antología en verso de
composiciones de poetas italianos de finales del siglo xv, como Flaminio,
Molza, Navagero, Cotta, Lampridius y Sadoleto, y dicho ejemplar se encuentra en la Biblioteca Nacional de la República Checa. En las últimas hojas del
libro, una mano probablemente española del siglo xvi ha escrito otra selección
de poemas de Sadoleto, Garcilaso, André de Resende, Jaime Juan Falcó, DieEditar el Siglo de Oro en la era digital
150
Eugenia Fosalba - Susanna Allés-Torrent
go Hurtado de Mendoza, Pietro Gravina, Juan Ramírez, Honorato Juan y
Johannes Secundus. Estos españoles cuyas obras se copian suelen ser posteriores a los poetas impresos en la antología; Czepiel también sospecha que el
copista, o al menos su fuente, procedía de los círculos universitarios de Alcalá.
Por ejemplo, una nota manuscrita al final del libro, aparentemente de la misma mano que la antología poética a la que sigue, da cuenta de cómo Andreas
Navagero estuvo en Alcalá de Henares con el doctor Ramírez (es decir, Juan
Ramírez, catedrático de retórica de la universidad). Además, el nuevo testimonio (D) aporta algunas lecturas más fiables que muestran que no derivan del
manuscrito napolitano (BNN XIII AA 63) como los testimonios ya conocidos
de Ad Antonium Thylesium y Sedes ad Cyprias. En particular, el nuevo testimonio le permite recuperar la línea 53 de Sedes ad Cyprias.13 No obstante, la inclusión de lecturas que necesitan enmienda y que son comunes a XIII AA 63
Mx sugiere que ambas tienen una fuente común, como sugiere Czepiel: “In
particular, the new witness allows us to recover line 53 of ‘Sedes ad Cyprias’,
missing until now (unfortunately disproving my own earlier conjecture of
what the line could have contained). Nevertheless, the inclusion of readings
which need emendation and are common to Mx suggests that both have a
common source” (Czepiel 2022: 746). Joseph Reed, en su edición de la Oda
I, por ejemplo, también observa variantes de autor que refuerzan el lado platónico de la oda.
Urgía asimismo compartir en formato abierto los resultados de esta primera
edición crítica de las odas latinas en la historia de la filología española, con las
dos nuevas incorporadas al elenco neolatino, en un formato digital, que reflejara
sobre la pantalla los avances esenciales de la crítica textual digital, y que permitiera dejar a la vista las aportaciones colectivas sobre cada obra, aunque la responsabilidad sobre cada una de ellas recayera sobre un investigador en especial
(R. Lokaj (Ode I), C. Corfiati (Ode II), J. Reed (Ode III), M. Czepiel (Odes IV
and V)). Joseph Reed, vale también la pena mencionar aquí, se encargó de acabar de pulir la fijación de la totalidad de los cinco textos latinos.
En lo que concierne a la obra poética garcilasiana escrita en castellano,
esta presenta desafíos de mayor alcance todavía. Se ha detectado la necesidad
de llevar a cabo un cotejo exhaustivo de todos los ejemplares conservados de
las primeras ediciones, puesto que una labor así no se ha llevado a cabo desde
Keniston (1925), y aun así tampoco en este caso resulta completa, además de
que presenta un aparato negativo. Se hace a su vez imprescindible ofrecer un
13. Véase la transcripción del manuscrito de la BNN en Pronapoli, con la marca del verso 53 que
falta por medio de puntos discontinuos, ausente en el testimonio napolitano, y por supuesto en
su copia vaticana, a buen seguro de Angelo Colocci (Vat. Lat. 2836, y no Lat. 2836, como suele
transmitirse en las ediciones garcilasianas), https://pronapoli.com/biblioteca-digital/transcripcion/sedes-ad-cyprias-venus/.
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
151
análisis pormenorizado de todos los primeros testimonios para observar los
posibles cambios en las distintas emisiones y estados. Al nuevo y exhaustivo
cotejo se añadirá un estudio completo de la tradición textual de las ediciones
impresas de Garcilaso en las condiciones en que se difundió (tanto en compañía de la obra de Boscán, es decir, tal y como apareció en la princeps de 1543,
como en edición exenta —a partir de 1569, Salamanca, en la edición llamada
de Garcilaso “divorciado de Boscán”—), así como se tendrán presentes los
textos que proporcionan las ediciones de los comentaristas. A este estudio se
adjuntará una lista de descripciones bibliográficas analíticas también exhaustiva; un análisis pormenorizado que además controlará toda la tradición manuscrita, adjuntando sus consiguientes descripciones, sin dejar de buscar nuevos
testimonios, así como, por supuesto, con una colación de primera mano.
También resulta imprescindible una anotación que contemple las recientes
aportaciones de la crítica, y vuelva sobre la huella de los clásicos grecolatinos
y la literatura neolatina del quinientos sin conformarse con las aportaciones de
los comentaristas que no bastan ni mucho menos para una anotación completa de las fuentes clásicas de la obra garcilasiana, como se está echando de ver
recientemente (Fosalba 2021, 2023).
En cuanto a las razones que nos decidieron a concebir una edición crítica
digital, cabe señalar, en primer lugar, que había la necesidad de reconstruir y
ofrecer en un único espacio y con criterios ecdóticos uniformes el corpus poético garcilasiano en su integridad, especialmente después de la aparición de las dos
composiciones latinas desconocidas hasta la fecha. También nos interesaba idear
la edición según el nuevo paradigma digital y siguiendo la idea de archivo donde
tuvieran cabida materiales de diferente naturaleza, como reproducciones o paratextos, o diferentes niveles de anotación crítica, que se desplegaran ante un texto
limpio y de forma simultánea. Un proyecto así planteaba dudas ante una presentación en papel por obvias cuestiones de espacio y economía. En fin, una
edición digital nos abría las puertas a concebir la posibilidad de ofrecer una
edición en varias lenguas europeas.
3. Desiderata filológicos y el modelo para la edición crítica digital
Al inicio de la segunda fase del proyecto se inició el prototipo de la edición digital y para ello se mantuvieron discusiones sobre su naturaleza, acerca de lo que
debería contener y cómo era más aconsejable proceder. Una de las cuestiones
centrales consistió en establecer qué tipo de edición se deseaba ofrecer: se acordó, y por los motivos aducidos más arriba, que debía tratarse de una edición
crítica que revisara de primera mano todos los testimonios disponibles. Otra de
las discusiones giró en torno a las diferentes secciones que debíamos incluir, y
especialmente sobre el tipo de anotación con la que nos parecía más adecuado
acompañar los textos poéticos garcilasianos. Estas y otras cuestiones nos llevaron
Editar el Siglo de Oro en la era digital
152
Eugenia Fosalba - Susanna Allés-Torrent
a la elaboración de un esquema conceptual del modelo de datos que se explica
gráficamente a partir de la Fig. 1.14
Así pues, la reflexión inicial partió del establecimiento del texto y de la estructura concreta de cada una de las composiciones poéticas (odas, églogas, etc.)
con las que debíamos trabajar, así como sus elementos constituyentes (estrofas,
versos, rimas). El texto, además, debía ir acompañado de un aparato crítico que
reflejara el trabajo filológico del equipo y las nuevas colaciones o decisiones editoriales que se iban llevando a cabo a partir de los testimonios manuscritos y las
ediciones antiguas de Garcilaso. En algunas ocasiones, nos hallamos ante un
manuscrito único, mientras que en otros, especialmente en el de las ediciones
quinientistas, se conservan un número elevado de ediciones.
A continuación, se previó un enriquecimiento semántico del texto que podría dividirse en dos grandes grupos.15 Por un lado, necesitábamos una anota14. Para una definición de modelado o modelización de datos, véase: https://www.vocabularyserver.
com/tadirah/es/index.php?tema=35&/, y también a este propósito: Allés-Torrent 2019.
15. Al hablar de anotación semántica nos referimos, en este caso, a la codificación en lenguaje
XML a partir de las guías directrices de la Text Encoding Initiative que se ha aplicado tanto a los
textos poéticos como a los paratextos. Las directrices sobre este sistema de marcado están disponibles en: https://tei-c.org/.
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
153
ción semántica, en el interior del mismo texto, que aclarara los aspectos fundamentales, tipográficos, nombre de personajes y lugares; por el otro, una anotación
que se desplegara en tres niveles conectados directamente con el texto. Así, el
texto poético se relaciona con una serie de anotaciones elaboradas por los investigadores que se distinguen entre “Notas”, aclaraciones breves concebidas como
apoyo a una primera lectura; “Comentarios”, excursos más eruditos que por lo
general reflejan las investigaciones llevadas a cabo por los diferentes miembros
del equipo; y los loci similes, locuciones o citas directas o indirectas de otros autores, con atención a las referencias clásicas pero también contemporáneas, ya
sean en latín o vulgar. Esta última sección resulta imprescindible para estudiar
con más profundidad las fuentes de las que se valió Garcilaso en la elaboración
de su poesía, teniendo en cuenta que a veces las fuentes son intercambiables, y
que no siempre es Garcilaso quien recibe pasivamente el influjo (véase al respecto, Fosalba 2022).
La edición debía ofrecer además dos herramientas básicas que facilitaran la
consulta: una opción de búsqueda con texto libre, y otra a partir de índices extraídos a partir de la codificación en XML-TEI que recogieran básicamente los
nombres de personajes y los nombres de lugar señalados anteriormente, así también como las referencias bibliográficas.
Otra parte esencial de nuestro modelo fue la elaboración de paratextos que
ofrecieran una visión lo más completa posible de cada una de las composiciones
poéticas. En primer lugar, se previó una sección dedicada al Contexto histórico
para entender mejor las circunstancias en las que se gestó el poema y las coordenadas culturales y literarias de la composición. En segundo lugar, se añadió una
sección para la Descripción de los testimonios, tanto de los manuscritos como de
las ediciones cotejadas. Estos detalles codicológicos y bibliográficos se encuentran descritos en el mismo archivo XML-TEI de la sección de descripción de la
fuente (sourceDesc, msDesc).16 El mayor reto, en este sentido, consistió en encontrar un método con el que todo el equipo pudiera trabajar de manera ágil,
pues rápidamente nos dimos cuenta que cada investigador tenía una manera
diferente de describir las fuentes. A ello se le contraponía la estructura bastante
rígida del marcado TEI en la descripción de las fuentes primarias. Por ello, se
decidió establecer un formulario, que respondía a la estructura propuesta por las
Guías directrices de la TEI, a partir del cual los editores pudieran recoger las
informaciones básicas (signatura y datos identificativos de la fuente, la descripción del manuscrito o edición, descripción física, historia de la fuente, origen,
procedencia, adquisición, etc.). Una tercera sección debía ofrecer un comentario
sobre la métrica, aunque este pudiera tener dimensiones desiguales. Algunos
poemas al no presentar innovaciones o particularidades originales métricas se
limitan a un breve comentario, mientras que en otros casos, como en el de la
16. Véase el elemento msDesc, https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-msDesc.html
Editar el Siglo de Oro en la era digital
154
Eugenia Fosalba - Susanna Allés-Torrent
Ode II, editada por Claudia Corfiati, se despliega un sistema métrico más complejo, el asclepiadeo B, compuesto por estrofas de cuatro versos (dos asclepiadeos menores, un ferecrateo y un gliconeo).
Al tratarse de un equipo internacional, por otro lado, se decidió asimismo
que los textos se ofrecerían en diferentes lenguas (por ahora, español, más
adelante, en inglés). Desde el punto de vista de la codificación de XML-TEI,
algunos elementos complican un marcado multilingüe pues no permiten la
repetición del mismo elemento (por ejemplo, si un elemento es repetible, puede distinguirse a través de un atributo @xml:lang con la especificación de
lengua). Tal es el caso, por ejemplo, del elemento “summary”, en la descripción de las fuentes primarias, que no permite su repetición y nos obliga a recurrir a otro elemento descendiente, como por ejemplo una nota, lo cual no
es lo ideal.17 Ahora bien —y sin querer cuestionar la utilidad de una edición
multilingüe—, también podríamos plantearnos por qué los investigadores al
afrontar una edición digital asumimos retos tan laboriosos, como es la publicación de todo el contenido en diferentes lenguas, cuando en una edición en
papel sería básicamente imposible.
Nuestro modelo requería dos aspectos más. Por un lado, y como no podría
ser de otra manera, se debía recopilar y estructurar una serie de bibliografía,
tanto primaria como secundaria. Estas referencias se han ido anotando en el
mismo texto para poder ser recuperadas en las bibliografías específicas.18 Por
otro lado, debíamos redactar una documentación técnica en la que se describiera la codificación en XML-TEI llevada a cabo, para que futuros integrantes del
proyecto puedan efectuar el marcado de manera autónoma.19
4. Sobre el proceso y el modelo de edición digital
El proceso editorial adoptado para llevar a cabo la obra poética garcilasiana se
ha dividido en tres grandes fases: transcripción de la fuente, codificación, y
visualización. Para mostrarlo de forma gráfica, ofrecemos un esquema, en la
siguiente Fig. 2, del proceso editorial que hemos llevado a cabo, basándonos
en el modelo de representación de datos ya propuesto por Rehbein y Fritze
(2015).20
17. Para el elemento “summary”, https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-summary.html
18. El sistema ha consistido en recopilar la bibliografía con el programa Zotero y asignar el identificador que este crea. Así, cada ítem puede ser recuperado con todos sus metadatos a partir de la
API de Zotero.
19. Los documentos de cada una de las composiciones poéticas también estarán disponibles en el
repositorio de GitHub.
20. Para más detalles y bibliografía sobre la descripción del proceso ecdótico digital, véase AllésTorrent (2020).
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
155
En un primer momento, cada uno de los editores inicia el proceso de
análisis filológico y bibliográfico del testimonio base, ya sea que se conserve
la composición en uno o varios manuscritos, o bien que forme parte de la
tradición textual impresa. Paralelamente, cada editor redacta, con la ayuda
del equipo, la serie de paratextos que acompañan la composición y que se
añade a las diferentes secciones (contexto, descripción de los testimonios,
métrica, y anotaciones en notas, comentarios, y loci similes). Para llevar a
cabo este análisis, el equipo se basa en el modelo específico de representación
de datos presentado arriba (véase la Fig. 1). Una vez el editor filológico ha
transcrito la fuente, aplicado los criterios editoriales, y redactado los paratextos, entra en juego el editor “digital” que lleva a cabo la codificación a partir
del estándar web XML y siguiendo las directrices de la Text Encoding Initiative.21 En esta segunda fase, pues, se procede a la codificación del texto. A
continuación, se establece un modelo claro de presentación de datos, es decir,
la presentación web final que el equipo ha concebido para la edición. En
nuestro caso, un diseñador web construye la interfaz web, mientras que el
editor digital se encarga de programar la transformación de los documentos
XML-TEI a través de un script en XSLT, otro lenguaje estándar creado por
el W3C, adaptándolo a la plantilla web.22 En fin, se genera el resultado como
21. Distinguimos aquí entre estos dos tipos de editores, pues cada uno ha llevado a cabo un trabajo
diferente (véase, en este monográfico, la discusión de J. Tronch sobre la terminología relativa al
editor). Lo ideal, ciertamente, sería que fuera el mismo editor que realizara tanto el trabajo filológico
y de investigación, como la codificación, pero a día de hoy, esto suele suceder pocas veces. Por editor
digital, pues, entendemos el que toma el relevo una vez el texto ha sido establecido y procede a su
codificación y, en nuestro caso, a la coordinación de la infraestructura y presentación digital.
22. Véanse las especificaciones del lenguaje XSLT, https://www.w3.org/TR/xslt-30/, y para el
caso específico de las ediciones digitales: Allés-Torrent 2015.
Editar el Siglo de Oro en la era digital
156
Eugenia Fosalba - Susanna Allés-Torrent
páginas HTML estáticas: cada una de las composiciones corresponde a una
documento HTML diferente. Huelga decir, a este respecto, que en términos
de infraestructura web para esta edición, se ha recurrido a un concepto de
tecnología mínima, utilizando solo lenguajes web estándares y generando el
resultado final como páginas HTML estáticas. Así pues, por un lado existen
los documentos XML-TEI, por el otro, un transformador escrito en XSLT, y
en fin, el resultado en HTML.23 Esta decisión vino motivada por la experiencia previa llevada a cabo en la sección Biblioteca digital,24 en la que se intentaron incluir los archivos XML-TEI en la infraestructura del CMS utilizado
(Wordpress). El resultado constató la complejidad de utilizar herramientas
prediseñadas para las ediciones filológicas digitales que presentan problemas
de integración y visualización.
En cuanto al diseño web y la experiencia de usuario, nos pareció imprescindible asumir la centralidad del texto original y aspirar a que éste fuera siempre visible (véase la Fig. 3, donde el texto aparece a la izquierda de la pantalla).
A partir del texto poético, se ramifica el paratexto a través de una serie de símbolos que conducen a las diferentes secciones. En cuanto al aparato crítico, este
planteó el reto de su presentación, un aspecto todavía no resuelto en términos
de crítica textual digital. Una imitación en versión digital del aparato tradicional basado en las dos dimensiones del papel, continúa siendo algo críptico para
la mayoría de la audiencia y carece de toda aportación al nuevo paradigma digital, mientras que la ideación de un aparato interactivo carga a veces sobremanera la interfaz web. La visualización del aparato crítico permanece uno de los
grandes retos. Por el momento, nuestra elección ha consistido en señalar con
un símbolo en el texto las palabras o sintagmas con variantes y reflejarlo en la
sección de la derecha junto con las otras pestañas y opciones editoriales. Por su
lado, la anotación crítica (notas, comentarios, loci similes) se agrupan en un
símbolo en forma de flecha con un menú desplegable y conducen al usuario a
la anotación correspondiente en el panel de la derecha manteniendo siempre la
referencia al texto original. En fin, existen algunas secciones que ofrecen textos
de dimensión desigual, lo cual puede romper en cierta manera la armonía del
formato. Tal es el caso de las secciones dedicadas a la métrica, o a la descripción
de testimonios que, aunque el equipo haya trabajado en la homogenización de
las descripción (a partir de un formulario), a veces el editor ha considerado
proporcionar más o menos detalles.
23. Todos los archivos estarán disponibles en el repositorio GitHub del proyecto.
24. Véase, https://pronapoli.com/biblioteca-digital/
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
157
5. Conclusiones
Pronapoli ha iniciado una senda productiva de investigaciones en torno a la estancia del gran poeta Garcilaso de la Vega en Italia. Con el fin de reconstruir las
coordenadas históricas y literarias de este período, hemos creado una plataforma
web, que va más allá de la simple difusión de los resultados y se concibe como
una herramienta de trabajo. El uso de un gestor de contenidos permite a los colaboradores subir sus aportaciones, al mismo tiempo que sirve como centro de
información para llevar a cabo sus investigaciones. A su vez, hemos puesto a disposición de un público amplio una edición en acceso abierto de las cinco odas
latinas y parte de la obra vulgar (más o menos horacianas) de Garcilaso, en un
texto fijado tras un nuevo cotejo, mucho más exhaustivo, y unas notas —loci similes, notas aclaratorias, comentarios más eruditos extensos—, se conectan entre
sí, al texto poético, y a las otras partes de la plataforma Pronapoli. A todo ello se
suman la galería de autores, el mapa de las academias, los textos transcritos y
rescatados del olvido, la recopilación de fuentes primarias y secundarias online
que, en su conjunto, proporcionan materiales para el contexto histórico-cultural
en una amplia gama de estratos de la realidad italiana y napolitana de la primera
mitad del siglo xvi, y que son imprescindibles para situar y entender con todas las
sutilezas y precisiones del caso, la compleja, cosmopolita y extraordinaria obra
poética del primer gran poeta moderno de la historia de la literatura española.
Editar el Siglo de Oro en la era digital
158
Eugenia Fosalba - Susanna Allés-Torrent
Desde el punto de vista de las humanidades digitales en general, y de la
práctica de la crítica textual digital en particular, hemos aspirado a ofrecer una
edición digital que responda al nuevo paradigma tanto en su teoría y método
como en su práctica (Sahle 2016; Allés-Torrent 2020). Resulta claro que la edición de la obra poética de Garcilaso se aleja del formato impreso y se convierte
en un amplio depósito de materiales que gravitan alrededor del texto. Así también, el flujo de trabajo, concebido a partir del modelo de representación de
datos expuesto más arriba, ha guiado el método filológico de los editores de
manera coordinada y paralela. Simultáneamente, se ha concebido una infraestructura web que prevé una estructura de publicación sostenible y escalable para
poder integrar otras obras garcilasianas, como esperamos que suceda en la siguiente fase del proyecto, para la obra poética castellana. En fin, la estructura
web y todos los contenidos que la conforman, incluidos los archivos fuentes con
la codificación en XML-TEI se pondrán a disposición de la comunidad en un
repositorio abierto para cumplir con las buenas prácticas del acceso abierto y la
transparencia en nuestra práctica científica digital.
Editar el Siglo de Oro en la era digital
La edición crítica digital de la obra poética de Garcilaso de la Vega
159
Bibliografía
Allés-Torrent, Susanna, “Edición digital y algunas tecnologías aliadas: codificación TEI y transformaciones XSLT”, Ínsula. Revista de Letras y Ciencias
Humanas, 822 (junio de 2015), pp. 1-30.
Allés-Torrent, Susanna, “Sobre la complejidad de los datos en Humanidades
digitales, o cómo traducir las ideas a datos”, Revista de Humanidades Digitales, 4 (2019), pp. 1-28, <https://doi.org/10.5944/rhd.vol.4.2019.24679>.
Allés-Torrent, Susanna, “Crítica textual y edición digital o ¿dónde está la
crítica en las ediciones digitales?”, Studia aurea: revista de literatura española
y teoría literaria del Renacimiento y Siglo de Oro, XIV (2020), pp. 63-98,
<https://doi.org/10.5565/rev/studiaaurea.395>.
Czepiel, Maria, «Two Newly Discovered Poems by Garcilaso de la Vega», Bulletin of Spanish Studies, 99, 5 (2022), pp. 741-776.
Fosalba, Eugenia y De la Torre , Gáldrick ed., La égloga renacentista en el reino
de Nápoles, Bulletin Hispanique, Presses Universitaires de Bordeaux, 2017.
Fosalba, Eugenia y De la Torre, Gáldrick, Contexto latino y vulgar de Garcilaso en Nápoles: redes de relaciones de humanistas y poetas (manuscritos, cartas,
academias), Peter Lang Verlag, 2018.
Fosalba, Eugenia, “Descripción del Ms. XIII AA 63 de la BN de Nápoles,
transmisor de dos odas neolatinas de Garcilaso”, Contexto latino y vulgar de
Garcilaso en Nápoles: redes de relaciones de humanistas y poetas (manuscritos,
cartas, academias), Peter Lang Verlag, 2018, pp. 297-321.
Fosalba, Eugenia, y De la Torre, Gáldrick, “Di qui Spagna et Italia han mostro chiaro l’onor”. Estudios dedicados a Tobia R. Toscano sobre Nápoles en
tiempos de Garcilaso, Studia Aurea Monográfica, Publicaciones Universitat
Autònoma de Barcelona, 2019.
Fosalba, Eugenia, ed. «Clasicismo horaciano en tiempos de Garcilaso de la Vega»,
Bulletin Hispanique, 125-1, 2023.
Rehbein, Malte, y Christiane Fritze, “Hands-On Teaching Digital Humanities: A Didactic Analysis of a Summer School Course on Digital Editing”,
en Digital Humanities Pedagogy: Practices, Principles and Politics, ed. Brett
D. Hirsch, Cambridge, Open Book Publishers, 2015, pp. 47-78,<http://
books.openedition.org/obp/1617>.
Sahle, Patrick, “What Is a Scholarly Digital Edition”, en Digital Scholarly Editing: Theories and Practices, ed. Matthew James Discroll y Elena Pierazzo,
Open Book Publishers, 2016,<https://doi.org/10.11647/OBP.0095>.
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación
del texto. Experiencias en torno a la constitución
de un corpus diacrónico de sonetos
Helena Bermúdez Sabel
JinnTec
[email protected]
Clara Isabel Martínez Cantón
UNED
[email protected]
Pablo Ruiz Fabo
Université de Strasbourg
[email protected]
Resumen
Esta contribución surge en el contexto de desarrollo del corpus de sonetos DISCO (Diachronic Spanish Sonnet Corpus), un corpus de 4530 sonetos en español
compuestos entre el siglo xvi y el xx por autores de diversas procedencias (Europa, Latinoamérica y Filipinas). Este recurso contiene las anotaciones de diferentes fenómenos de versificación que han sido obtenidas a partir de técnicas del
procesamiento del lenguaje natural (PLN). En este artículo presentamos cómo
los resultados de la anotación automática pueden ser utilizados para detectar
problemas de transmisión textual. Uno de los objetivos de esta contribución es
el de proporcionar claves sobre posibles flujos de trabajo que, ayudándose de
herramientas de PLN, permitan detectar posibles errores textuales, centrando
así los esfuerzos de revisión manual en pasajes concretos.
Palabras clave
corpus; soneto; procesamiento del lenguaje natural; anotación; edición digital;
versificación.
Abstract
Natural Language Processing and Text Curation. Experiences within the Development of a Diachronic Sonnet Corpus.
Editar el Siglo de Oro en la era digital
162
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
We present work carried out within the development of DISCO, the Diachronic Spanish Sonnet Corpus project, which consists of 4,530 sonnets in Spanish from Europe, Latin America and the Philippines, including texts from the
15th to the 20th centuries. The resource offers versification annotations obtained automatically through tools based on Natural Language Processing
(NLP). In this article, we present how automatic annotation results can be exploited to detect textual transmission errors. Drawing on our experience with
DISCO, we present observations towards the creation of workflows assisted by
NLP-based tools, which can help detect possible textual errors, thus allowing us
to focus on specific passages for our manual correction effort.
Keywords
Corpus; sonnet; natural language processing; annotation, scholarly editing, versification.
Introducción
El propósito de trabajar con corpus que reúnan una colección numerosa de
textos literarios, que permitan la comparación de sus características genéricas,
métricas, estilísticas, etc., se había visto condicionada, hasta la era digital, por la
capacidad limitada del ser humano para recopilar, clasificar y analizar datos. En
otras disciplinas, como la lingüística de corpus, este enfoque metodológico tuvo
más presencia. Sin embargo, también en los estudios literarios encontramos previamente a la utilización de bases de datos o internet, trabajos de investigación
que llevan a cabo cuantificaciones sobre determinadas características de un corpus. En el área de la métrica poética cabe nombrar, por ejemplo, repertorios que
recogían los esquemas métrico-rimáticos de un corpus, y que fueron creados
mediante un análisis manual, como Die nicht lyrischen Strophenformen des
Altfranzösischen de Gotthold Naetebus (1891), repertorio métrico que reunía con
un método riguroso la poesía narrativa francesa altomedieval, conservado en un
comienzo únicamente en papel.
La edición de textos es un campo que se ha visto enriquecido por la utilización de métodos digitales de muy diversas maneras. En este artículo queremos exponer cómo la recopilación y anotación con herramientas digitales del
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
163
corpus DISCO (Diachronic Spanish Sonnet Corpus)1 ha servido para mejorar
la edición y curación de este corpus, pues ha permitido encontrar y corregir
errores en la transmisión textual. Presentaremos, así, cómo ciertos indicios
que percibimos gracias a la anotación automática pueden ser indicativos para
la detección de pasajes problemáticos que pueden (o deben), después, ser cotejados manualmente.
DISCO es un corpus en continuo crecimiento,2 que recoge en el momento
presente 4530 sonetos en español de distintas épocas y lugares. Recoge poemas
de 1215 autores y autoras procedentes de 22 países distintos de Europa, Latinoamérica y Filipinas. Cronológicamente se recopilan sonetos desde los inicios de
esta forma poética (los primeros ensayos del Marqués de Santillana) hasta sonetos modernistas con versos alejandrinos o incluso hexadecasílabos.
Los sonetos recogidos en DISCO se extrajeron en la mayoría de los casos
de la Biblioteca Virtual Miguel de Cervantes, de distintas colecciones de sonetos (García González 2006a; 2006b), u otros recursos, como el Portal de
Literatura Hispanofilipina. Algunos textos del siglo xviii proceden de Wikisource u otras fuentes, y para la elaboración del subcorpus modernista el
equipo de investigación ha realizado la digitalización de diferentes ediciones
impresas. Estas diversas fuentes han sido homogeneizadas y estandarizadas
gracias a su transformación en XML, siguiendo las directrices de la Text Encoding Initiative (TEI).3 Otro valor añadido de DISCO, sin embargo, consiste en enriquecer estos textos, añadiéndoles, de manera sistemática, distinta
información. Por una parte, se han añadido metadatos para los autores, como
las fechas de nacimiento, muerte, procedencia y el identificador de VIAF
(Virtual International Authority File). El Identificador VIAF4 (Fichero de
Autoridades Virtual Internacional) agrupa en un solo registro los diferentes
registros de autoridad provenientes de diversas instituciones internacionales,
en su mayoría bibliotecas nacionales. El identificador VIAF permite la identificación y referenciación consistente de los y las poetas del corpus, por lo
que es relevante incluirlo.
Además, y lo que, creemos, hace más interesante al corpus, DISCO incluye
anotaciones literarias, creadas con distintas herramientas digitales (ver, para más
detalle Ruiz Fabo et al. 2021). El corpus está analizado métricamente, recogien-
1. https://github.com/pruizf/disco (último acceso el 26 de septiembre de 2023).
2. Ver https://github.com/pruizf/disco/#versions (último acceso el 26 de septiembre de 2023).
3. La Iniciativa de Codificación de Texto (TEI, por sus siglas en inglés) es un consorcio que desarrolla y mantiene de manera colectiva unas directrices para la representación de textos en formato digital. Este sistema de representación es el lenguaje de marcado, actualmente serializado como
un vocabulario XML comúnmente denominado XML-TEI, que cuenta con una guía de uso
mantenida por el consorcio. Para obtener más información sobre la Text Encoding Initiative
(TEI), puede visitar su sitio web oficial: https://tei-c.org/.
4. https://viaf.org/
Editar el Siglo de Oro en la era digital
164
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
do el número de sílabas de cada verso, su acentuación, su rima e incluso la existencia o no de encabalgamiento.5
Este corpus, además, puede consultarse a partir de una interfaz que permite
la búsqueda y exploración sencilla de los sonetos y la visualización con gráficos
dinámicos de sus características métrico-literarias, DISCOver6 (Bermúdez Sabel
et al., 2022).
Buscando la reutilización y la posible investigación con el corpus, DISCO
se ofrece tanto en texto simple como en XML-TEI, este último enriquecido con
RDFa, un formato de datos enlazados,7 utilizando por tanto estándares con gran
proyección en las humanidades.
Así, este corpus contribuye al desarrollo de recursos digitales para el estudio
de la poesía en español, especialmente, desde una perspectiva comparativa, diacrónica y polisistémica.
La anotación automática va seguida de una labor de revisión y edición manual para la que ciertos aspectos de la anotación son clave, como indicamos en
un comienzo. Es interesante recalcar que estos aspectos, además, no son los
mismos para el Siglo de Oro que para el Modernismo, porque las tendencias
literarias y la métrica también van evolucionando.
Presentaremos aquí el proceso y algunas muestras del trabajo de edición
realizado con el subcorpus del Siglo de Oro, que recoge un total de 477 poetas
que son autores de 1088 sonetos. Es interesante señalar la existencia de otro
corpus distinto de sonetos de Siglo de Oro, el Corpus de Sonetos del Siglo de Oro
(Navarro-Colorado et al., 2016), que se solapa solo en una pequeña parte con
DISCO, pues 17 de los autores se hallan representados en ambos corpus y encontramos 333 sonetos en común.
Retos
Los desafíos encontrados para la edición de este corpus de sonetos han sido de
diversa naturaleza.
Hay algunos retos que pueden parecer comunes a la recopilación de un
corpus, sea este digital o no, como todo el flujo de trabajo relacionado con la
5. Para estas anotaciones se han utilizado herramientas como Jumper (Marco Remón y Gonzalo
2021), el sistema de ADSO (Navarro-Colorado 2017) y Rantanplan (de la Rosa et al. 2020) para
la escansión y la acentuación métricas, Rhyme Tagger (Plecháč 2018) para la rima y ANJA (Martínez Cantón et al. 2021; Ruiz et al. 2017) para el encabalgamiento. Las anotaciones métricas han
sido corregidas manualmente en los sonetos modernistas, mientras que las de rima han corrido la
misma suerte en el subcorpus del Siglo de Oro.
6. https://prf1.org/disco/ (último acceso el 26 de septiembre de 2023).
7. El corpus ha sido utilizado para diversos estudios de humanidades digitales, como se recoge en
https://github.com/pruizf/disco/#resources-reusing-disco (último acceso el 26 de septiembre de 2023).
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
165
selección de los elementos, en este caso los sonetos, del corpus, y la información
que sobre ellos se proporciona. Sin embargo, como es bien sabido, el medio
condiciona el contenido, y ofrece posibilidades y limitaciones. En nuestro caso,
condicionó la selección de un solo tipo de composición poética, el soneto. Esta
elección ha sido en parte debida a la incontestable relevancia y tradición de esta
forma composicional en la literatura española. No es únicamente una forma
poética, sino que puede ser considerada un subgénero lírico (Romero Luque
2017; Spang 1993; Zavala 1995). No obstante, las razones que nos guiaron a
recoger un corpus solo de sonetos tienen que ver también con su tratamiento
digital. Se trata de una forma manejable desde el punto de vista computacional,
ya que obedece a restricciones claras. La variabilidad se mantiene dentro de unos
límites, lo que facilita la comparación de rasgos métricos entre poemas, o entre
distintos subcorpus de poemas.
Además, cuando este corpus comienza a gestarse, las herramientas de escansión y asignación del acento métrico estaban más avanzadas para el endecasílabo, mientras que para otras formas métricas la precisión era menor o los resultados eran poco significativos. No en vano, usando métodos computacionales, el
soneto había sido estudiado ya por distintos investigadores (Navarro-Colorado
2015; Navarro-Colorado, Lafoz, y Sánchez 2016; Navarro-Colorado 2017;
Agirrezabal, Alegria, y Hulden 2017). Por estas razones, un nuevo corpus de
sonetos enriquecía el panorama ya existente y abría un diálogo con trabajos anteriores en los estudios literarios tradicionales, en el desarrollo de corpus digitales y en el análisis computacional de la poesía.
La elección de las fuentes de las que se tomarán los sonetos supuso también
un reto, ya que, por una parte, debíamos aprovechar el material ya digitalizado
disponible en bibliotecas digitales, pero éramos conscientes de que debía construirse un corpus que siguiera unos determinados criterios de selección con el fin
de ofrecer a la comunidad científica un recurso de gran utilidad. Así, y dado que
existía ya el corpus del Siglo de Oro (siglos xv-xvii) de Navarro-Colorado
(2015) centrado en autores canónicos, DISCO se ocupa de recopilar sonetos de
todo tipo de autores, incluyendo autores menores, que completen (y complementen) así otro tipo de acercamientos.
Con la idea de recoger una muestra de cómo se ha cultivado el soneto en
español desde el siglo xv hasta el Modernismo en el siglo xx, no solo desde los
autores canonizados, sino desde una perspectiva amplia, se recogieron sonetos
de todas las épocas, potenciando así la dimensión diacrónica. Además, las dos
últimas versiones de DISCO,8 de 2021 y 2023 se recogen poemas de autores
filipinos y se le da más cabida a escritores latinoamericanos, tratando de ampliar
también la procedencia de los poetas del corpus.
8. Consultar aquí: https://github.com/pruizf/disco/#versions (último acceso el 26 de septiembre
de 2023).
Editar el Siglo de Oro en la era digital
166
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
Otro reto que se nos planteó fue el de incrementar la usabilidad del corpus y, de manera particular, hacer visible la existencia de poetas mujeres, y la
procedencia de los autores. Para ello, a través de la interfaz de exploración del
corpus DISCOver se facilitó la consulta y navegación de corpus a través de dos
funciones de búsqueda principales: búsqueda por autor y búsqueda facetada
basada en metadatos de autor. El buscador dispone de filtros para periodos,
género (femenino o masculino) y origen del autor o autora (Latinoamérica,
Asia o Europa).
Además, con la intención de facilitar la selección y reutilización de subcorpus derivados de DISCO, DISCOver permite seleccionar los sonetos o autores
deseados y etiquetar el subcorpus creado. Este nombre se utilizará para identificar los resultados del subcorpus en los gráficos que la herramienta genera. Para
los poemas seleccionados por el usuario, se crean gráficos dinámicos que muestran diferentes características métrico-rimáticas de la selección. Pueden combinarse en un mismo gráfico los resultados de diferentes selecciones con el fin de
facilitar la comparación cuantitativa. Es posible además acceder además al texto
de los propios sonetos en los que se ofrece la anotación de diferentes elementos
de versificación (patrón acentual de cada verso, esquema de rima y encabalgamiento). Por otra parte, la creación de nuevas herramientas de anotación automática ha dado nuevas posibilidades a este corpus. Así, si antes nos habíamos
ceñido al soneto hasta el siglo xix, pues son casi sin excepción endecasilábicos,
las versiones nuevas de DISCO incluyen sonetos modernistas, con sus distintas
medidas, versos compuestos, etc. Su etiquetado automático ha sido posible gracias a la existencia de nuevas herramientas de escansión, como Jumper (Marco
Remón y Gonzalo 2021) o Rantanplan (de la Rosa et al. 2020). Un tratamiento
eficaz del verso compuesto ha sido posible gracias a Jumper, cuyos resultados
con este tipo de versos (como evaluado en Marco Remón y Gonzalo 2021) superan los de otras herramientas.
La detección de la rima se añadió, asimismo, únicamente a partir de la versión 3 del corpus, publicada en octubre de 2019, con la adaptación de la herramienta Rhyme Tagger (Plecháč 2018) para el español.
La edición digital de textos cuenta ya con directrices específicas, por lo que
DISCO, desde un primer momento ha seguido de cerca los criterios de RIDE
para Colecciones de Textos Digitales (Henny-Krahmer y Neuber 2017).
La creación de un flujo de trabajo y unos criterios homogéneos para la edición y limpieza de los textos será, precisamente, el reto del que hablaremos en
este artículo.
Metodología
Las anotaciones prosódico-rimáticas del corpus DISCO han sido realizadas a
partir de diferentes herramientas de procesamiento del lenguaje natural. En el
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
167
caso particular de la rima, se ha utilizado el sistema multilingüe Rhyme Tagger
(Plecháč 2018).
Uno de los mecanismos implementados en la elaboración del corpus DISCO para mejorar la calidad de este recurso ha sido el de revisar manualmente los
versos no rimados. La rima se presenta como un fenómeno especialmente apropiado para focalizar los esfuerzos de revisión manual por diferentes motivos relacionados tanto con la historia de la versificación como con el procesamiento
automático. Por una parte, dependiendo del período, la presencia de versos no
rimados en el soneto en español puede considerarse una rareza (Pardo 2014).
Un estudio sobre cómo se componía un soneto en el Siglo de Oro español señala precisamente la rima como piedra de toque sobre la que se construía el edificio
poemático: “cuando uno se ponía a hacer un soneto, lo primero que hacía era
apuntar en el margen las palabras rimantes. Esto no debe sorprender: es obvio
que lo que rige todo soneto es la rima” (Dadson 1998: 512). Resulta llamativo,
de hecho, que Kurt Spang (1993: 99-103), en el espacio que dedica al soneto
como subgénero lírico, haga alusión a las posibles muchas variedades de la rima
y que no se considere la posibilidad de los sonetos sin rima.
Por otra parte, el rendimiento de la anotación automática de la rima es muy
elevado, con una precisión de 0.98 y una exhaustividad de 1. Esto quiere decir
que la herramienta, en principio, detecta todos los casos de rima y que solo en 2
de cada 100 casos anota como rima algo que en realidad no lo es.
Teniendo en cuenta lo anterior, la presencia de un verso no rimado en el
corpus de sonetos del Siglo de Oro puede relacionarse con tres posibles escenarios: 1) innovación formal, 2) problema de transmisión textual de la obra o 3)
error generado durante el proceso de conformación del corpus. En otros períodos del corpus DISCO, en los que se ha generado una versión electrónica del
texto a partir de fuentes impresas, tendríamos un caso específico del escenario 3
que es muy habitual: errores generados durante el proceso de digitalización
(OCR). Sin embargo, la fuente del subcorpus del Siglo de Oro es nativamente
digital (García González 2006). Es posible, no obstante, que nos encontremos
con errores textuales en esta fuente que en su origen provengan de errores de
OCR y que han pasado desapercibidos por el editor: en todo caso, en nuestro
contexto específico tienen que ser categorizados como problemas de transmisión
del texto, pues estamos utilizando una fuente digital curada.
Esta contribución explora cómo podemos utilizar los resultados de la anotación automática relativos a la rima para detectar posibles problemas en la
transmisión textual de una obra. La búsqueda de estos potenciales problemas se
centra en la presencia de versos no rimados que serán categorizados atendiendo
a los tres posibles escenarios previamente descritos.
Algunos de los casos encontrados presentan una lectura que de manera inmediata puede ser corregida. Véase como ejemplo los siguientes versos de Gonzálvez de Andrade (en negrita, palabra final del verso no rimado):
Editar el Siglo de Oro en la era digital
168
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
Des que en lechos de zafir reposan
y que por sendas de cristal caminas,
derramando tus urnas cristalinas
en favor de las playas arenosas;
(Paulo Gonzálvez de Andrade, Soneto, vv. 1-4)
Desde un punto de vista semántico y formal, la última palabra del primer
verso tiene que corregirse en “reposas”. La presencia de “reposan” es muy probablemente resultado del proceso de conformación de la edición digital de la
Biblioteca Virtual Miguel de Cervantes, ya que esta es la única edición que hemos encontrado con la lectura “reposan” (y en los recursos de ella derivados).
Como decíamos, la búsqueda automática de versos no rimados nos ha proporcionado ejemplos que responden a un problema de fijación de texto y no a
simples errores de digitalización. Este es el caso de uno de los versos no rimados
encontrados en la obra de Esteban Manuel de Villegas en la que uno de sus sonetos presenta la siguiente lectura:
Quién me dijera, Clori, que algún día
te pudiera olvidar tan fácilmente,
mientras soltero crin hizo en tu frente
con hilos de oro lazos de rabia.
(Esteban Manuel de Villegas, Eróticas, Soneto II, vv. 1-4)
Ediciones recientes de esta antología de Villegas (p. ej. Villegas 2010) reproducen también la lectura “rabia”. Sin embargo, en las primeras ediciones de la
obra de Villegas podemos encontrar una lectura mucho más adecuada, tanto
desde el punto de vista semántico como formal: “taujía” como palabra rima
(véase Villegas 1618; 1774; 1797). Taujía aparece hoy en día en el DRAE como
palabra en desuso para “ataujía”, que significa, a su vez, damasquinado, es decir,
una técnica artesanal de ornamentación que consiste en incrustar hilos de oro o
plata en superficies metálicas, como acero o hierro, creando intrincados diseños
decorativos. Como vemos, este término, además de encajar métricamente mucho mejor, tiene sentido en su contexto y resulta mucho más lírico.
Se reproduce a continuación una transcripción semi-diplomática de estos
versos en la edición príncipe (Villegas 1618, 80):
Quien me dixera, Clori, que algun dia
te pudiera olvidar tan facilmente,
mientras ſoltero crin hiço en tu frente
con hilos de oro laços de tauxia,
(Esteban Manuel de Villegas, Eróticas, Soneto II, vv. 1-4)
La transmisión de la obra de Villegas parece mostrar una cierta complejidad, pues encontramos en los tercetos de uno de sus sonetos dos versos no rimados que no podemos corregir de manera inmediata:
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
169
Cuando mostrabas de azucena, fruta,
la tez bruñida, o como sin cuidado
de mí solicitabas tus placeres,
déjame pues, que si te quise hermosa,
ya no es posible, puesto que has llegado
a tiempo, que a ti misma no te quieres.
(Esteban Manuel de Villegas, Eróticas, Soneto X, vv. 9-14)
Una vez más, en una de las ediciones contemporáneas a Villegas (Villegas
1618, 82) encontramos una lectura con rima:
Cuando moſtrabas de açuçena, i roſa
la tez bruñida; ó como ſin cuidado
de mi ſolicitabas tus placeres,
Dejame pues, que ſi te quiſe hermoſa,
ya no es poſible, pueſto que has llegado
a tiempo, que a ti miſma no te quieres.
(Esteban Manuel de Villegas, Eróticas, Soneto X, vv. 9-14)
En este caso, la hipótesis que manejamos para explicar cómo la lectura “azucena, y rosa” ha pasado a “azucena, fruta,” pasa por considerar que se trata de un
error generado durante la creación de un recurso electrónico usado como fuente, causado por un error de OCR, y que los editores posteriores no han detectado. Es posible que el caso anteriormente comentado, la sustitución de taujía por
rabia, responda a la misma casuística.
Discusión
El trabajo de revisión de los versos no rimados, detectados automáticamente, ha
sido una estrategia eficaz para mejorar la calidad de los textos contenidos en el
corpus DISCO. Cabe destacar, no obstante, que la mayor parte de los versos no
rimados detectados en el corpus respondía a errores de la herramienta de anotación, generalmente relacionados con rimas imperfectas (p. ej. serenas / cantinelas) o con grafías homófonas (p. ej. donna / razona, divino / digno). Por lo tanto,
este proceso de revisión también nos ha llevado a implementar correcciones en
la anotación rimática.
Si bien es cierto que los flujos de trabajo automatizados requieren de la intervención humana para mejorar los resultados de la automatización, en esta
contribución argumentamos que las herramientas de procesamiento del lenguaje natural también pueden ser utilizadas para detectar algunos de los errores
humanos. Esa misma sugerencia es hecha por los autores de dos herramientas de
escansión automática para español (Rantanplan y Jumper) cuando señalan:
Editar el Siglo de Oro en la era digital
170
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
Remarkably, using both systems [Rantanplan and Jumper] on the same corpora has
proved to be particularly useful in our experimentation: when both systems make
the same mistake, it is a reliable signal that the manual annotation might be erroneous. Therefore, used in conjunction they can be a useful tool for corpus clean-up
(Marco et al. 2021)
El corpus DISCO nace ante la necesidad de crear una gran colección de
poemas en español (concretamente de sonetos) para poder responder a nuevas
preguntas de investigación utilizando las metodologías habilitadas por la computación. Nos atrevemos a afirmar que entre las tareas necesarias para poder
investigar en disciplinas de Humanidades Digitales más ingratas destaca la creación de los corpus: es un trabajo arduo y cronofágico, y que muchos organismos
de evaluación académica en Humanidades ni siquiera consideran como producción científica.
El desarrollo de grandes colecciones de recursos electrónicos está generalmente vinculado a procesos de automatización que hagan esta tarea abarcable en
el menor tiempo posible. La presencia de errores en el texto o en la anotación es
prácticamente inevitable, de ahí que sea necesario establecer procesos de control
de calidad en cada una de las etapas del flujo de trabajo (especialmente en las
automatizadas).
Si bien es evidente que la calidad de los resultados de investigación adquiridos dependerá de la calidad científica del recurso utilizado, también es cierto
que las metodologías computacionales nos permiten establecer márgenes de
error aceptables: la presencia de errores no es incompatible con la calidad científica ni con la consecución de resultados pertinentes (véase, p. ej., Franzini et al.
2018). A la hora de desarrollar un recurso electrónico, resulta fundamental que
el equipo de investigación de Humanidades defina cuáles serán los tests que
permitan evaluar la calidad de los resultados de cada uno de los procesos de
automatización y establecer un margen de error aceptable. A la hora de explotar
dicho recurso, se necesitará hacer una reevaluación del margen de error atendiendo a los objetivos de la investigación específica que se va a desarrollar.
La Biblioteca Virtual Miguel de Cervantes es un recurso de gran valor para
los estudios literarios en español. Aunque en esta contribución hayamos reflejado algunos de los problemas textuales que presenta una de las ediciones disponibles en este portal, consideramos que esta edición (dada su extensión) se encuentra dentro de los parámetros del margen de error aceptable.
En la elaboración del corpus DISCO hemos establecido un sistema de versiones documentado que permite una mejora continua (pero organizada) de este
recurso. Esta estrategia ha permitido que una versión inicial del corpus estuviese
disponible para poder ser utilizada por la comunidad científica ya en 2017. Seis
años más tarde, hemos publicado la versión 5.0 del corpus (Ruiz Fabo, Bermúdez Sabel, y Martínez Cantón 2023). Este sistema de versiones permite que las
y los usuarios de este recurso puedan citar la versión concreta sobre la que se basa
Editar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
171
su trabajo y que el estado del corpus en ese momento siempre esté disponible.
Al mismo tiempo, también pueden comprobar qué cambios ha sufrido el corpus
en versiones posteriores y evaluar las nuevas posibilidades de investigación que
les ofrece cada una de las actualizaciones.
Conclusiones
La presente contribución es un ejemplo de cómo la evaluación de los resultados
de anotaciones automáticas (usando una o varias herramientas para la comparación) se puede utilizar como estrategia para mejorar el contenido textual de
grandes corpus. En este caso, la anotación rimática automática nos ha guiado en
tareas de fijación de texto limitadas a la palabra rima. No obstante, las correcciones manuales de anotaciones automáticas pueden explotarse de distintas maneras, pues cabe la posibilidad de que sirvan para mejorar herramientas de anotación existentes, para mejorar datos de entrenamiento y también para la creación
de modelos de corrección automática.
Esta contribución y el trabajo de revisión textual llevado a cabo dentro del
corpus DISCO es igualmente útil para otros recursos derivados de la Biblioteca
Virtual Miguel de Cervantes como ADSO (Navarro-Colorado, Ribes-Lafoz y
Sánchez 2016).
Las ediciones automatizadas son imperfectas, pero valiosas. En el análisis donde se busca evaluar estadísticamente una tendencia (lectura distante, lingüística de
corpus), la existencia de cierta proporción de errores no es un obstáculo insalvable,
ya que las tendencias se pueden detectar dentro de ciertos márgenes de error.
En este sentido, una edición automatizada de un corpus amplio puede ayudar a detectar tanto las tendencias generales como los valores atípicos Así, la
detección, gracias a la anotación automática, de pasajes en los que encontramos
características no esperadas (número de versos, de sílabas, rimas inesperadas)
puede ayudar también a focalizar nuestros esfuerzos críticos e interpretativos en
las partes más innovadoras, y llegar a una mayor comprensión de la experimentación poética, con el objetivo de acometer estudios y ediciones críticas.
Como ampliación y generalización de este trabajo inicial, planeamos utilizar
la anotación métrica para buscar irregularidades (o “rarezas”) en la escansión que
nos permitan detectar errores de transmisión textual, así como errores generados
durante la creación del corpus (mucho más frecuentes). El objetivo es precisamente el de eliminar todas las irregularidades causadas por errores, para poder centrarse en el estudio de las innovaciones o particularidades métrico-rimáticas.
Editar el Siglo de Oro en la era digital
172
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
Bibliografía
Agirrezabal, Manex, Iñaki Alegria, y Mans Hulden, “A Comparison of
Feature-Based and Neural Scansion of Poetry”, RANLP 2017 - Recent Advances in Natural Language Processing Meet Deep Learning, noviembre,
2017, pp. 18-23. <https://doi.org/10.26615/978-954-452-049-6_003>.
Bermúdez Sabel, Helena, Pablo Ruiz Fabo, et Clara Martínez Cantón, “DISCOvering Spanish Sonnets: A circular reading experience”, en Computational Stylistics in Poetry, Prose and Drama, ed. Anne-Sophie Bories, Petr Plecháč, y
Pablo Ruiz. De Gruyter. <https://doi.org/10.1515/9783110781502-004>
Dadson, Trevor J. 1998. “Cómo se hacía un soneto en el siglo de oro: el caso de
‘amor, la red de amor digo que es hecha’ ”, en Siglo de Oro. Actas del IV Congreso Internacional de la AISO, Alcalá de Henares, 1996, pp. 2: 509-524.
Franzini, Greta, Mike Kestemont, Gabriela Rotari, Melina Jander, Jeremi
K. Ochab, Emily Franzini, Joanna Byszuk, y Jan Rybicki, “Attributing
Authorship in the Noisy Digitized Correspondence of Jacob and Wilhelm
Grimm”, Frontiers in Digital Humanities, 5 (2018). <https://www.frontiersin.org/articles/10.3389/fdigh.2018.00004>.
García González, Ramón, ed., Sonetos del siglo XIX, Alicante, Biblioteca Virtual Miguel de Cervantes, 2006a, <https://www.cervantesvirtual.com/nd/
ark:/59851/bmc4q861>.
García González, Ramón, ed., Sonetos del siglo XV al XVII, Alicante, Biblioteca Virtual Miguel de Cervantes, 2006b, <https://www.cervantesvirtual.
com/nd/ark:/59851/bmc2r439>.
Henny-Krahmer, Ulrike, y Frederike Neuber, “Criteria for Reviewing Digital
Text Collections, version 1.0”, IDE. A Review Journal for Digital Editions
and Resources, 6 (2017), <https://www.i-d-e.de/publikationen/weitereschriften/criteria-text-collections-version-1-0/>.
Marco Remón, Guillermo, y Julio Gonzalo, “Escansión automática de poesía
española sin silabación”, Procesamiento del Lenguaje Natural 66 (2021), pp.
77-87, <https://doi.org/10.26342/2021-66-6>.
Martínez Cantón, Clara Isabel, Pablo Ruiz Fabo, Elena Gonzalez-Blanco,
Elena, y Thierry Poibeau. 2021. “Automatic Enjambment Detection as a
New Source of Evidence in Spanish Versification”, en Plotting Poetry: On
Mechanically Enhanced Reading, ed. Anne-Sophie Bories, Gerald Purnelle,
y Hugues Marchal, Liège, Presses Universitaires de Liège, pp. 93-112.
Naetebus, Gotthold, Die nicht-lyrischen strophenformen des altfranzösischen,
Leipzig, Druck von J.B. Hirschfeld, 1891.
Navarro-Colorado, Borja, “A computational linguistic approach to Spanish
Golden Age Sonnets: metrical and semantic aspects”, en Proceedings of the
Computational Linguistics for Literature Workshop at NAACL 2015, Denver,
U.S., Association for Computational Linguistics, 2015.
Navarro-Colorado, Borja, “A metrical scansion system for fixed-metre SpaEditar el Siglo de Oro en la era digital
Procesamiento del lenguaje natural y fijación del texto
173
nish poetry”, Digital Scholarship in the Humanities 33.1 (2017), pp. 11227. <https://doi.org/10.1093/llc/fqx009>.
Navarro-Colorado, Borja, María Ribes Lafoz, y Noelia Sánchez, “Metrical
Annotation of a Large Corpus of Spanish Sonnets: Representation, Scansion and Evaluation”, en Proceedings of the Tenth International Conference
on Language Resources and Evaluation, Portoroz, Slovenia, Portorož, Slovenia, 2016, pp. 4630-34. <http://www.lrec-conf.org/proceedings/lrec2016/
pdf/453_Paper.pdf>.
Pardo, Arcadio, “De la diversidad del soneto”. Rhythmica. Revista Española de
Métrica Comparada, 12 (2014), pp. 127-172, <https://doi.org/10.5944/
rhythmica.14247>.
Plecháč, Petr, “A Collocation-Driven Method of Discovering Rhymes (in
Czech, English, and French Poetry)”, en Taming the Corpus: From Inflection
and Lexis to Interpretation, ed. Masako Fidler y Václav Cvrček, Cham,
Springer International Publishing, 2018, pp. 79-95. <https://doi.org/10.1007/
978-3-319-98017-1_5>.
Romero Luque, Manuel, “El soneto modernista (Manuel Machado como paradigma)», Rhythmica, 15 (2017), pp. 113-45. <https://doi.org/10.5944/
rhythmica.21190>.
Rosa, Javier de la, Álvaro Pérez, Laura Hernández, Salvador Ros, y Elena
González-Blanco, “Rantanplan, fast and accurate syllabification and
scansion of spanish poetry”, Procesamiento del Lenguaje Natural, 65 (2020),
pp. 83-90.
Ruiz Fabo, Pablo, Helena Bermúdez Sabel, Clara Martínez Cantón, y Elena González-Blanco, “The Diachronic Spanish Sonnet Corpus: TEI and
Linked Open Data Encoding, Data Distribution, and Metrical Findings”,
Digital Scholarship in the Humanities, 36 (Supplement_1) (2021), pp. i6880, <https://doi.org/10.1093/llc/fqaa035>.
Ruiz Fabo, Pablo, Clara Martínez Cantón, Thierry Poibeau, y Elena González-Blanco, “Enjambment Detection in a Large Diachronic Corpus of Spanish Sonnets”, en Proceedings of the Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature,
2017, pp. 27-32, <http://www.aclweb.org/anthology/W17-2204>.
Spang, Kurt, Géneros literarios, Madrid, Síntesis, 1993.
Villegas, Esteban Manuel de, Las eroticas o amatorias, Nájera, por Ivan de
Mongaston, 1618.
Villegas, Esteban Manuel de, Las Eroticas; y Traduccion de Boecio, Madrid, por
Don Antonio de Sancha, 1774.
Villegas, Esteban Manuel de, Las Eróticas y traduccion de Boecio, Segunda edición, Madrid, por Don Antonio Sancha, 1797.
Villegas, Esteban Manuel de, Las eróticas o Amatorias. ed. María Ángeles Díez
Coronado y Emilio Magaña Orúe, Logroño, Instituto de Estudios Riojanos, 2010.
Editar el Siglo de Oro en la era digital
174
Helena Bermúdez Sabel - Clara Isabel Martínez Cantón - Pablo Ruiz Fabo
Zavala, Iris M, “El amor es una aventura en el mal: los sonetos de Sor Juana”,
Tropelías: Revista de Teoría de la Literatura y Literatura Comparada, 5-6
(diciembre) (1995), pp. 443-52, <https://doi.org/10.26754/ojs_tropelias/
tropelias.19955-65581>
Editar el Siglo de Oro en la era digital
Edición digital enriquecida:
un modelo de anotación multinivel
para poesía del Siglo de Oro
Borja Navarro Colorado
Universidad de Alicante
[email protected]
Resumen
En este capítulo se presenta un modelo general para la anotación multinivel de
corpora de texto literario. Por multinivel se hace referencia a la combinación,
en un mismo corpus, de información de diferentes niveles de descripción lingüística o literaria, desde datos relacionados con palabras o sílabas, hasta cuestiones temáticas, textuales o pragmáticas. El objetivo final de un corpus de
estas características es fijar un posible análisis literario, por lo que se considera
como una edición digital enriquecida. Se defienden cuatro características que
un corpus de texto literario debe cumplir: interoperabilidad, perspectivismo,
unidad y claridad/sencillez. Se da cuenta de los principales problemas de formalización en un corpus multinivel de este tipo: la combinación de diferentes
formalismos de representación y, en el caso de XML, el problema de un anidamiento incorrecto. Finalmente se propone un modelo para un corpus de
poesía del Siglo de Oro.
Palabras clave
corpus multinivel; poesía; métrica; sintaxis; anotación; edición digital; XML;
TEI.
Abstract
Enriched Digital Edition: a Multilevel Annotation Model for Golden-Age Spanish
Poetry.
This paper presents a general model for the multilevel annotation of a literary
corpus. Multilevel refers to the combination of information from different linguistic or literary levels in the same corpus: from word related data to thematic,
textual or pragmatic questions. The objective is to fix a possible literary analysis.
To be considered an enriched digital edition, an annotated corpus must meet four
Editar el Siglo de Oro en la era digital
176
Borja Navarro Colorado
characteristics: interoperability, perspectivism, unity and clarity/simplicity. The
main formalization problems are discussed: the combination of different representation formalisms and, in the case of XML, the improper nesting. Finally, a
model for a corpus of poetry from the Spanish Golden-Age is proposed.
Keywords
multilevel corpus; poetry; meter; syntax; annotation; digital edition; XML;
TEI.
Procesamiento del lenguaje natural y los estudios
literarios computacionales1
Una de las áreas de los llamados estudios literarios computacionales (CLS por
sus siglas en inglés)2 es la aplicación de herramientas de procesamiento del lenguaje natural (PLN) e inteligencia artificial (IA) al estudio del texto literario.
Esta aplicación presenta diversos problemas.
En primer lugar, las herramientas de PLN, salvo casos excepcionales, se
crean para procesar un texto moderno estándar. El análisis automático del texto
literario es mucho más complejo por dos motivos principalmente. Por un lado
porque el texto literario suele ser texto antiguo, con variantes históricas del idioma (aunque esté modernizado) para las que las herramientas de PLN no están
preparadas. A esto se le une la desautomatización propia del estilo literario, por
la cual se exprime al máximo la capacidad expresiva del idioma y se buscan formas lingüísticas novedosas.
Por otro lado, las herramientas de PLN no suelen estar diseñadas para extraer
información literaria. Éstas analizan aquellos aspectos lingüísticos que la comuni-
1. Trabajo parcialmente financiado por el Ministerio de Ciencia e Innovación a través del proyecto
“CORTEX:
Conscious
Text
Generation”
(PID2021-123956OB-I00):
MCIN/
AEI/10.13039/501100011033/ y “FEDER Una manera de hacer Europa”; y por la Generalitat
Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport) a través del Proyecto: NL4DISMIS: Tecnologías del Lenguaje Natural para lidiar con la desinformación (CIPROM/2021/021).
2. Para una visión general de los métodos actuales en los estudios literarios computacionales,
véase Schöch et at. eds. (2023).
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
177
dad de PLN considera relevantes, como categorías gramaticales, sintaxis, sentimientos o entidades nombradas, entre otras.3 Esta información solo resulta en
parte de interés para los estudios literarios. Son pocas las herramientas de PLN
capaces de extraer rasgos específicos del texto literario, como puede ser la métrica
(Navarro Colorado 2018a, de la Rosa et al. 2020, Haider 2021), figuras retóricas
y metáforas novedosas (Kesarwani et al. 2017), análisis de personajes, detección de
eventos narrativos y otros aspectos narratológicos (Piper et al. 2021), etc.
Para poder aplicar, por tanto, análisis computacional al texto literario es
necesario desarrollar herramientas específicas capaces, por un lado, de interpretar el texto literario en su complejidad histórica y expresiva, y por otro, que sean
capaces de extraer información de interés para los estudios literarios.
Para desarrollar estas herramientas hay que aplicar las técnicas propias del
PLN. El paradigma técnico dominante para el desarrollo de herramientas de
PLN en los últimos 30 años ha sido el aprendizaje automático o machine learning (Jurafsky y Martin 2023),4 y en concreto el aprendizaje automático supervisado.5 A diferencia de los métodos tradicionales en los que se indica a la máquina cómo analizar un texto mediante reglas de programación, en el paradigma
de aprendizaje automático supervisado es la propia máquina la que infiere cómo
analizar textos a partir de muestras textuales anotadas por humanos. Estas muestras textuales son los corpora anotados, que como se puede comprobar, tienen
un papel básico en PLN, bien sea como corpus de aprendizaje en los métodos
supervisados, bien como corpus de evaluación en cualquier caso (Pustejovsky y
Stubbs 2012, Ide y Pustejovsky (eds.) 2017).
Con esta situación, para los estudios literarios computacionales en general,
y para el desarrollo de herramientas de PLN específicas para texto literario en
particular, es necesario desarrollar corpora de textos literarios anotados con información tanto lingüística como propiamente literaria.
La anotación de corpus se puede considerar además un modelo de análisis
lingüístico y literario en sí mismo. Anotar un corpus es una tarea de interpretación
3. Véase Jurafsky y Martin (2023), en especial los capítulos 17 a 28, centrados en el análisis
computacional de estructuras lingüísticas.
4. En el PLN actual sin embargo, dominan las técnicas neuronales y el desarrollo de grandes modelo de lenguaje (large language models o LLM), caracterizados precisamente por no necesitar corpora
anotados a mano. Sin embargo, tanto para adaptar esos grandes modelos de lenguaje a tareas concretas (como las que se requieren en CLS), el llamado fine-tunning, como para las técnicas de prompting basadas en ejemplos (few-shots prompting), los corpora anotados sí son necesarios.
5. Las técnicas de aprendizaje automático se agrupan en dos grandes familias: las técnicas supervisadas y las no supervisadas. Las supervisadas parten de un corpus anotado, mientras que las no
supervisadas parten de un corpus sin ningún tipo de marca ni anotación. En este trabajo me
centro en la aproximación supervisada, que es la que más relevancia tiene en los corpora anotados.
En los estudios literarios también se han aplicado técnicas no supervisadas, como por ejemplo
Topic Modeling (Navarro Colorado 2018b). Sobre la aplicación de aprendizaje automático a los
estudios literarios computacionales, véase Hatzel et al. (2023).
Editar el Siglo de Oro en la era digital
178
Borja Navarro Colorado
y estudio de la lengua literaria a partir del análisis de muestras textuales. Entre otros
aspectos requiere definir un modelo teórico general, especificar qué información se
va a marcar, formalizar esa información mediante un lenguaje de marcas, determinar el proceso de anotación, detectar casos complejos (normalmente problemas de
ambigüedad) y determinar heurísticas para su correcta interpretación y anotación,
entre otros aspectos (Ide y Pustejovsky (eds.) 2017). Aplicado a un texto literario,
es una tarea hermenéutica propia de los estudios literarios (Meister 2022).
La anotación de corpus como paradigma de análisis lingüístico-literario no
está exenta de problemas. Sin entrar en detalles, comentaré dos aspectos. Por un
lado, la anotación tiene sus límites porque no se puede asumir que se pueda
anotar todo tipo de información lingüístico-literaria. Por otro, toda formalización supone siempre un proceso de simplificación, y por tanto supone cierta
pérdida en la precisión de análisis; en especial los casos más complejos (aquellos
que se desvían de la norma general), que se obvian o se simplifican demasiado
para ajustarlos al modelo general (McShane y Nirenburg 2001: 52-55). Como
principal ventaja, la anotación del corpus permite automatizar el análisis literario y, así, realizar análisis a gran escala de amplios corpora.
Desde la óptica de los estudios literarios, un corpus anotado es lo que vamos
a denominar una “edición digital enriquecida”, en tanto que edición digital de
una o más obras en las que no solo se ha fijado el texto, sino que también se ha
establecido una posible interpretación de las obras a uno o varios niveles de
análisis: métrica, sintáctica, semántica, temática, etc. Y se ha realizado además
con ánimo de ser análisis de referencia para futuras investigaciones del fenómeno literario tratado.
En este trabajo presentamos un modelo general para la anotación multinivel
de corpora de texto literario. Por multinivel me refiero a un modelo de anotación que permita combinar información de diferentes niveles de descripción
lingüística o literaria, de ahí el nombre de “multinivel”: desde datos relacionados con palabras o sílabas, hasta cuestiones temáticas, textuales o pragmáticas.
En la siguiente sección se expondrán los requisitos que considero debe tener un
corpus de texto literario anotado para considerarse edición digital enriquecida;
luego comentaré los principales problemas de formalización que presenta el desarrollo de un corpus multinivel, y finalmente se propondrá un modelo general
para un corpus de poesía del Siglo de Oro.
Requisitos generales para una edición digital enriquecida
Desarrollar un corpus anotado es una tarea compleja que requiere tiempo y esfuerzo. Se debe abordar siempre con la intención de conseguir una anotación
útil y válida durante mucho tiempo. Así como en una edición crítica se busca
fijar un texto de referencia para su lectura y análisis posterior por parte de la
comunidad científica, una edición enriquecida busca marcar en el texto un anáEditar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
179
lisis de referencia que sea útil para los estudios literarios durante los siguientes
años. No me refiero con esto a establecer una única interpretación del texto literario (más sobre este punto luego), sino a establecer un análisis que sirva de referencia para otros análisis, bien como soporte para investigaciones relacionadas,
bien para proponer análisis alternativos, o bien como corpus de aprendizaje para
sistemas automáticos.
Para conseguir, por tanto, que un corpus anotado como el aquí planteado
sea útil, fiable y válido para los estudios literarios, de manera que pueda ser considerado una edición digital enriquecida, debe cumplir cuatro requisitos básicos:
•
•
•
•
interoperabilidad,
perspectivismo,
unidad
sencillez y claridad.
A continuación comentaré cada uno de ellos.
Interoperabilidad
El concepto de interoperabilidad proviene de los sistemas de información y su
capacidad para utilizarse de forma conjunta, compartir datos e intercambiar
información.6 Así, entendiendo un corpus anotado como un sistema de información, debe estar diseñado de tal manera que la información contenida (la
anotación) pueda ser compartida y reutilizada por otros corpora y/o por sistemas automáticos y herramientas de PLN.
Este rasgo recae sobre todo en la formalización. El formato de anotación
debe ser lo más compatible posible, incluyendo aquí tanto el lenguaje de marcado utilizado, como la sistematización de la información realizada y la representación de ésta mediante etiquetas. Esto asegura la reutilización de la información
anotada, su complementariedad con otros corpora y, en general, el intercambio
de información con diferentes sistemas automáticos.
Para ello es necesario utilizar lenguajes y modelos de marcado estándar. En
humanidades digitales y estudios literarios computacionales, el lenguaje de marcas más utilizado es el eXtensible Markup Language o XML usado según las
recomendaciones de la Text Encoding Initiative o TEI (TEI Consortium 2023).
Sin embargo, no siempre XML-TEI es la mejor opción. En la siguiente sección
se expondrán sus límites y algunos problemas que pueden surgir al anotar un
corpus multinivel con este formato estándar.
6. Véase cómo define interoperabilidad el Diccionario panhispánico del español jurídico: https://
dpej.rae.es/lema/interoperabilidad (19 de septiembre de 2023).
Editar el Siglo de Oro en la era digital
180
Borja Navarro Colorado
Perspectivismo
En el área del PLN, la calidad de un corpus de aprendizaje se determina según la consistencia de la anotación (Pustejovsky y Stubbs 2012, Ide y Pustejovsky 2017): en qué medida, un mismo fenómeno lingüístico es anotado de
la misma manera por dos personas diferentes. Se busca el máximo consenso
en la anotación del corpus para que la máquina, al final, aprenda aquello en
lo que los humanos están de acuerdo. El desacuerdo entre los anotadores se
penaliza, pues se considera que hay un error en la anotación (bien sea en la
formalización, en la sistematización, en las etiquetas, o en cualquier otro aspecto).
Este planteamiento es apropiado en la anotación lingüística de corpora
en la medida en que, con un mismo modelo teórico, es viable llegar a un
acuerdo en la interpretación de cuestiones morfológicas o sintácticas. Sin
embargo, en las últimas décadas el PLN ha ido abordando cuestiones semánticas y más subjetivas donde el acuerdo interpretativo entre los anotadores
cada vez es más complejo, incluso partiendo de los mismos modelos teóricos.
En los últimos años, al tratar con temas tan subjetivos como la expresión de
opiniones, emociones y sentimientos, o la detección de la ironía, se ha replanteado este modelo de calidad de un corpus anotado basado en el acuerdo
entre anotadores.
En este contexto ha surgido un nuevo paradigma en anotación de corpora
denominado “perspectivismo”.7 Este paradigma considera que el desacuerdo entre anotadores no es tanto un error como una fuente valiosa de información
sobre el fenómeno anotado. El desacuerdo entre anotadores manifiesta formas
diferentes de interpretar un mismo fenómeno lingüístico o (en nuestro caso)
literario. Este desacuerdo es relevante porque, en primer lugar, está mostrando
problemas en la anotación y por tanto temas relevantes para ser estudiados e
investigados (¿a qué se debe el desacuerdo?, ¿es un fallo en el modelo teórico
general, en las etiquetas, en el proceso?, ¿es un caso nuevo que obliga a replantear el modelo, la definición del fenómeno?, etc.); y en segundo lugar es relevante porque si entre las personas expertas no hay acuerdo, las herramientas computacionales derivadas del corpus deben aprender también que ese fenómeno se
puede interpretar (es decir, anotar) de diversas maneras, que no hay una interpretación única (Cabitza et al. 2023).
El perspectivismo, por tanto, hace referencia a la posibilidad de anotar los
mismos fenómenos y los mismos textos de diferentes maneras, desde supuestos, modelos o perspectivas diferentes. Toda anotación implica un proceso de
interpretación, y se debe asumir que siempre puede haber diversas interpretaciones. Un corpus anotado debe ser consistente consigo mismo, es decir: una
7. Véase The Perspectivist Data Manifesto en https://pdai.info/ (19 de septiembre de 2023)
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
181
misma persona debe anotar los mismos fenómenos de la misma manera a lo
largo de todo el corpus. Pero no tiene por qué ser consistente con la anotación
de otra persona.
Desde este punto de vista, una edición crítica enriquecida, en tanto que
texto literario anotado, debe ser considerada siempre como una propuesta de
análisis. La anotación fija una interpretación del texto que se presenta como referencia para otros estudios, pero no como una interpretación única y definitiva:
se asume que puede haber (y debe haber) anotaciones y análisis alternativos que
enriquezcan la interpretación. Si en otras áreas del PLN el perspectivismo es una
opción, para la anotación del texto literario, dado su carácter plurisignificativo,
es una necesidad. Piénsese, por poner un caso extremo (pero no extraño), las
diferentes relaciones sintácticas y, con ello, las diferentes interpretaciones que se
pueden establecer en estos famosos versos de Quevedo:
Cerrar podrá mis ojos la postrera
sombra que me llevare el blanco día,
y podrá desatar esta alma mía
hora a su afán ansioso lisonjera:
(Quevedo, Amor constante más allá de la muerte, vv. 1-4)8
Unidad
La unidad hace referencia a la unidad textual del corpus. Un texto literario anotado con información diversa a diferentes niveles de descripción lingüística puede llegar a ser un entramado complejo de ficheros e información. Pero no hay
que perder nunca de vista la unidad del corpus: toda la anotación responde a un
único texto y todos los elementos anotados deben estar relacionados.
Un poema, por ejemplo, anotado con información métrica y con información categorial debe estar creado de tal manera que, aunque sean aspectos relacionados con unidades diferentes (la sílaba para la información métrica y la palabra para la información categorial), quede claro que son rasgos de un mismo
texto y que están relacionados.
Dada la diversidad de información y la heterogeneidad de unidades lingüísticas, establecer estas relaciones no es tarea fácil. En la siguiente sección se expondrán problemas derivados de este aspecto y vías de solución.
8. Jauralde Pou (1997) repasa los diferentes problemas interpretativos del poema y las lecturas
clásicas. En concreto, para los versos 3-4, que considera “extremadamente difíciles” (pág. 94),
destaca “la extraña utilización de hora; la concordancia de lisonjera y la referencia de su.” (pág. 95).
Todos estos son problemas sintácticos. “Hora”, por ejemplo, suele considerarse sujeto de “podrá
desatar” (Torre, 2004), pero no es una lectura evidente.
Editar el Siglo de Oro en la era digital
182
Borja Navarro Colorado
Sencillez y claridad
Precisamente por la complejidad que tiene un corpus anotado, se debe procurar
que el modelo formal (el código, las marcas y las etiquetas utilizadas en la anotación) sea lo más claro posible para la persona que realiza la anotación manual.
Con independencia del uso de editores de anotación como CATMA,9 INCEpTION10 u otros, un código claro permite a las personas modificarlo directamente. El objetivo es conseguir, en la medida de lo posible, un marcado claro, sencillo y explícito en la línea de las recomendaciones de código claro para lenguajes
de programación como Python.11
No quiero expresar con esto un rechazo absoluto al uso de editores de anotación. Más bien quiero expresar que el uso de editores de anotación debe ser
siempre una opción del anotador, pero nunca una obligación. Los editores mediatizan la anotación y limitan la capacidad expresiva de los lenguajes de marcado.12 Por ello siempre hay que mantener la opción de anotar directamente en
código (con editores de código para asegurar la consistencia sintáctica y semántica), y ello implica que el marcado, el código, debe ser inteligible para un humano. Dado que en toda anotación se hará antes o después un trabajo manual,
considero que hay que dar preferencia antes a la inteligibilidad del marcado que
a su optimización computacional.
En resumen, de una edición digital enriquecida se espera que fije una interpretación de referencia del texto útil para los estudios computacionales, pero asumiendo siempre interpretaciones y anotaciones alternativas; que sea compatible
con otros corpora y sistemas automáticos; que todos los niveles de anotación estén
relacionados para mantener la unidad textual del corpus, y que el código sea, en la
medida de lo posible, claro e inteligible para una persona experta.
Problemas formales en la anotación de un corpus multinivel.
Conseguir estas características implica resolver diversos problemas. En esta sección comentaré cuestiones derivadas de la formalización, la unidad y la claridad
del código. A partir de ello, en la siguiente sección propondré un modelo general para poesía del Siglo de Oro.
9. https://catma.de/ (19 de septiembre de 2023)
10. https://inception-project.github.io/ (19 de septiembre de 2023)
11. Véase, por ejemplo, “Zen of Python” en The Hitchhiker’s Guide to Python: https://docs.
python-guide.org/writing/style/#zen-of-python
12. El editor CATMA, por ejemplo, siguiendo las propias recomendaciones de TEI, separa el
texto de la anotación en dos ficheros diferentes. El fichero con las etiquetas tiene referencias a las
posiciones del fragmento de texto al que se refieren la etiquetas. Si bien este modelo es óptimo
desde un punto de vista computacional, la anotación resultante resulta opaca para un humano.
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
183
Se comentó en la sección anterior que para conseguir la máxima interoperabilidad es necesario marcar el corpus con lenguajes de marcado de uso común y,
si existe, seguir un estándar de anotación. En humanidades digitales, la opción
más estandarizada es sin duda alguna el formalismo XML-TEI. Ahora bien, al
afrontar la creación de un corpus multinivel, hay dos cuestiones generales a las
que hay que dar respuesta: en primer lugar, cómo anotar aquellos fenómenos
que no se pueden representar con XML-TEI o para los que hay un estándar alternativo; en segundo lugar, cómo resolver el problema de anidamiento que se
puede producir entre los diferentes niveles de anotación.
Límites de XML-TEI
Si bien XML es un lenguaje de marcas muy flexible, que se puede adaptar a
prácticamente cualquier tipo de información que se quiera representar, no siempre es la mejor opción. En anotación lingüística de corpora hay un caso en el
que XML no es el lenguaje de marcas más utilizado: la sintaxis.
El modelo teórico más implantado hoy en sintaxis computacional es el modelo de dependencias. Mediante este modelo se marcan las relaciones de dependencia entre las palabras (lo que en la gramática tradicional se denominan funciones sintácticas: sujeto, objeto directo, etc.). La relación es siempre entre dos
palabras, una es la palabra núcleo y otra la palabra dependiente. Todas las relaciones de dependencia entre las palabras de una oración forman al final el árbol
sintáctico. Véase Fig. 1:
Fig. 1: Ejemplos de análisis sintáctico de dependencias.
Desde un punto de vista formal, un árbol de dependencias se representa
como un grafo dirigido formado por un conjunto de vértices y un conjunto de
arcos. Los vértices son las palabras de la oración y los arcos dirigidos son las
relaciones de dependencia, que van siempre de un vértice (la palabra que actúa
de núcleo) a otro vértice (la palabra dependiente de ese núcleo) (Jurafsky y
Martin 2023).
Editar el Siglo de Oro en la era digital
184
Borja Navarro Colorado
El problema para la anotación de corpora con información sintáctica es que,
si bien es posible representar grafos en XML, éste no suele ser el formalismo
estándar. Hay otros modos más comunes de representar formalmente un grafo.
En el caso concreto del análisis sintáctico, dentro del mundo del PLN el formato más común es el formato CONLL (Buchholz y Marsi 2006).13 La Tabla 1
muestra un ejemplo del análisis sintáctico del verso de Lope de Vega “Un soneto me manda hacer Violante” con un formato CONLL simplificado:
1
Un
Uno
DI0MS0
2
spec
2
soneto
soneto
NCMS000
5
obj
3
me
me
PP1CS00
4
obl
4
manda
mandar
VMIP3S0
0
sentence
5
hacer
hacer
VMN0000
4
obj
6
Violante
violante
NP00000
4
suj
7
.
.
Fp
4
f
Tabla 1: Análisis sintáctico de dependencias en formato CONLL (simplificado).
Como se puede ver, el formato CONLL es un formato tabular, donde las
líneas representan cada palabra y las columnas su información morfosintáctica.
La primera columna es el número identificativo de la palabra; y las siguientes
tres columnas la información morfológica: el token tal y como aparece en el
texto, su lema y la etiqueta categorial y morfológica. Finalmente, en las columnas 5 y 6 aparece la información sintáctica. La columna 5 es el número de la
palabra de quien depende (su núcleo) y la 6 el tipo de dependencia.14
Así, la raíz de este árbol sintáctico es la palabra 4 (“mandar”), de la cual
depende la palabra 6 (“Violante”) con una dependencia tipo “sujeto” (suj) y la
palabra 5 (“hacer”) con una dependencia tipo “objeto” (obj), etc.
El siguiente código muestra este mismo grafo en anotación XML siguiendo
las recomendaciones TEI:15
<graph type=“directed” xml:id=“RDG1”>
<node n=“1”><label>
<w lemma=“uno” pos=“DI0MS0” msd=“DI”>Un</w></label>
</node>
<node n=“2”><label>
13. Véase https://universaldependencies.org/format.html (19 de septiembre de 2023.)
14. En este caso, las etiquetas morfológicas y sintácticas están basadas en el modelo de Dependencias Universales. Véase https://universaldependencies.org/ (19 de septiembre de 2023).
15. Véase el capítulo 19 de la guía TEI “Graphs, Networks, and Trees”: https://tei-c.org/release/
doc/tei-p5-doc/en/html/GD.html
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
185
<w lemma=“soneto” pos=“NCMS000” msd=“NC”>soneto</w></label>
</node>
<node n=”3”><label>
<w lemma=“me” pos=“PP1CS00” msd=“PP”>me</w></label>
</node>
<node n=“4”><label>
<w lemma=“mandar” pos=“VMIP3S0” msd=“VMI”>manda</w></label>
</node>
<node n=“5”><label>
<w lemma=“hacer” pos=“VMN0000” msd=“VMN”>hacer</w></label>
</node>
<node n=“6”><label>
<w lemma=“Violante” pos=“NP00000” msd=“NP”>Violante</w></label>
</node>
<arc from=“#1” to=“#2”>
<label>spec</label>
</arc>
<arc from=“#2” to=“#5”>
<label>obj</label>
</arc>
<arc from=“#3” to=“#4”>
<label>obl</label>
</arc>
<arc from=“#4” to=“#0”>
<label>sentence</label>
</arc>
<arc from=“#5” to=“#4”>
<label>obj</label>
</arc>
<arc from=“#6” to=“#4”>
<label>subj</label>
</arc>
</graph>
En este caso, primero se codifican los nodos del arco con la etiqueta <node>
y luego los arcos dirigidos con la etiqueta <arc>, que especifica la relación entre
dos nodos o palabras (@from y @to).
Como se puede observar, la codificación CONLL es más inteligible para un
humano y es también óptima para su tratamiento computacional.
La cuestión, por tanto, a la hora de desarrollar una edición digital enriquecida multinivel, es decidir si para marcar la información sintáctica se utiliza
XML, como presumiblemente se habrá utilizado en otros niveles, o utilizar otro
formalismo diferente como CONLL, de uso común y considerado el estándar
de facto en la comunidad científica.
Esto mismo podría ocurrir con otro tipo de información. Así, para la anotación multinivel de corpora lingüísticos hay propuestas en los dos sentidos. Por
Editar el Siglo de Oro en la era digital
186
Borja Navarro Colorado
ejemplo, PAULA-XML16 (Chiarcos et al. 2008) o SALT17 (Zipser y Romary
2010), al igual que TEI, proponen un único formalismo para marcar cualquier
tipo de información en el corpus. El primer caso está basado en XML, mientras
que el segundo está basado en grafos. De esta manera toda la información está
unificada en un único formalismo. Sin embargo, otros corpora, como el corpus
GUM18 (Zeldes 2017), utilizan un formalismo diferente para cada tipo de información o nivel de anotación, según sea el estándar o el formato más común. Así,
en el corpus GUM la estructura general de cada documento está marcada en
XML-TEI, pero luego utilizan CONLL para marcar la información sintáctica.
Dentro de los estudios literarios computacionales, esta opción de mantener
el formato más usado para cada tipo de información o nivel de representación es
la que se utiliza en BookNLP:19 un conjunto de herramientas de PLN entrenadas específicamente para procesar texto literario en inglés.20 Por el contrario,
algunos editores de marcado como CATMA21 o TEI:TOK,22 utilizan XML-TEI
como formato nativo y cualquier tipo de información que se pueda anotar se
representa con este formalismo único.
Con esta situación, no se puede considerar una opción mejor que otra. Si se
opta por utilizar diferentes lenguajes de marcado, se corre el riesgo de perder la
unidad del corpus y que éste quede como una acumulación de ficheros. Si se
opta por utilizar XML para toda la anotación, puede resultar un código final
oscuro; aparte del problema de anidamiento que se comentará después.
En cuanto a los límites de TEI, si bien cuenta con infinidad de etiquetas, no
incluye toda la información que pueda interesar para los estudios literarios computacionales. Pero esto realmente no es un problema porque TEI ya está diseñado para que se pueda ampliar con la especificación de etiquetas propias, aunque
no sea una práctica recomendada.23
Anidamiento
Antes se comentó que la información que se puede anotar en un corpus multinivel
es muy variada, desde información lingüística como lemas y categorías gramatica16. https://github.com/korpling/paula-xml (19 de septiembre de 2023)
17. https://corpus-tools.org/salt/ (19 de septiembre de 2023)
18. https://gucorpling.org/gum/ (19 de septiembre de 2023)
19. https://github.com/booknlp/booknlp (19 de septiembre de 2023)
20. Junto al análisis lingüístico, realiza un análisis propio del texto literario como la detección automática de personajes y eventos narrativos, o la detección de estilo directo, entre otros aspectos.
21. https://catma.de/ (19 de septiembre de 2023)
22. http://teitok.corpuswiki.org/ (19 de septiembre de 2023)
23. Véase la sección “Customization” de la web de TEI: https://tei-c.org/guidelines/customization/. Para recursos en español, véase la web TTHUB https://tthub.io/ (19 de septiembre de
2023) y en especial Allés-Torrent et al. (2022).
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
187
les, frases hechas, sintaxis, referencias a entidades (named entities), emociones y
opiniones, relaciones anafóricas, estructuras argumentales y roles semánticos, significado léxico, etc. (Jurafsky y Martin 2023); hasta información literaria como los
personajes de novelas y las relaciones entre ellos, intervenciones y estilo de discurso, eventos narrativos, métrica y ritmo, sentimientos, temas recurrentes, similitudes estilométricas, etc. (Piper et al. 2021, Schöch et at. eds. 2023, entre otros).
Si se opta por utilizar XML como único formalismo para representar información diversa en un único corpus, surge el problema del cruce de ramas, es
decir, un anidamiento erróneo de los elementos XML.
La representación que hace XML de la información es una representación
arbórea y anidada. De una etiqueta madre (la principal es root) pueden depender
una, dos o más etiquetas, de las cuales a su vez pueden depender otras etiquetas,
etc. Así, un texto marcado en XML es un árbol descendente, donde cada etiqueta de un nivel tiene anidadas las etiquetas del siguiente nivel.24
Por ejemplo, para marcar la estructura básica de una novela en XML, TEI
propone usar una etiqueta “text”, de la que depende una etiqueta “body”, de la
que a su vez depende una o más etiquetas “chapter”, de la cual dependen una o
más etiquetas “p” (párrafo), etc. Se forma, así, una estructura arbórea que se
puede recorrer de manera descendente o ascendente.
Esta estructura arbórea establece relaciones de anidamiento entre etiquetas.
Esto implica que si se introduce una etiqueta de apertura <A> y dentro otra
etiqueta de apertura <B>, no se puede cerrar la etiqueta <A> hasta que se haya
cerrado la etiqueta anidada B. Si así se hiciera, el XML resultante estaría mal
formado por un error de anidamiento y no se podría procesar.
Este error puede aparecer cuando se quiere anotar en un mismo fichero información a diferentes niveles de descripción, porque cada uno puede depender
de unidades lingüísticas diferentes. Así ocurre, por ejemplo, si se quiere anotar
en un poema información métrica e información categorial. La unidad básica de
la métrica es la sílaba métrica, mientras que la unidad básica de las categorías
gramaticales es la palabra (el lema). En principio, son unidades compatibles
porque una palabra está formada por sílabas, por lo que se puede asumir que
siempre que finalice una palabra, finalizará también una sílaba. El problema
surge cuando aparece una sinalefa.
Efectivamente, con la sinalefa nos hallamos ante un problema de anidamiento: al unirse la última sílaba de una palabra con la primera sílaba de la siguiente palabra en una única sílaba métrica, no se puede representar ambas
unidades con XML en un mismo fichero. Si se cierra la etiqueta de palabra, se
debe cerrar la etiqueta de sílaba (que está anidada) y por tanto se pierde el límite de la sílaba métrica. Si no se cierra, no se puede cerrar la unidad palabra y
quedarían dos palabras marcadas como si fueran solo una.
24. http://www.w3.org/TR/xml/ (19 de septiembre de 2023)
Editar el Siglo de Oro en la era digital
188
Borja Navarro Colorado
En el verso de Lope de Vega mostrado en la Tabla 1 hay sinalefa entre las
palabras “manda” y “hacer”. El siguiente ejemplo muestra las dos opciones de
anotación (sílabas o palabras), pero no se pueden representar las dos a la vez:
<seg type=“syllable”>man</seg>
<seg type=“syllable”>daha</seg>
<seg type=“syllable”>cer</seg>
<w>manda</w>
<w>hacer</seg>
El estándar TEI propone algunas soluciones para poder tratar este problema
(DeRose 2004).25 En los siguientes párrafos las resumo brevemente con los siguientes versos de Lope de Vega como ejemplo. En este caso se produce un error
de anidamiento entre la oración y el verso por el encabalgamiento del primer
verso. Se muestra primero la anotación XML mal formada:
<l><s>Así Fabio lloraba. </s><s>Albania entonces </l>
<l>mirole, y quiso hablar, cerró los ojos, </l>
<l>y respondiole lo demás la muerte. </s></l>
Como se ve, no se puede marcar el final del primer verso (<l>) sin antes
marcar el final de la oración (<s>), pero no se puede marcar el final de la oración
porque ésta finaliza en el tercer verso.
La primera solución es hacer la anotación en ficheros diferentes. Así, cada
uno tendrá su XML y no habrá problema de anidamiento. Con esta opción, sin
embargo, se pierde la unidad del corpus: habría que idear métodos para combinar la información de cada fichero de manera automática.
<l>Así Fabio lloraba. Albania entonces</l>
<l>mirole, y quiso hablar, cerró los ojos,</l>
<l>y respondiole lo demás la muerte.</l>
<s>Así Fabio lloraba.</s>
<s>Albania entonces mirole, y quiso hablar, cerró
los ojos, y respondiole lo demás la muerte.</s>
Una segunda opción es marcar las unidades no con etiquetas dobles (una
de apertura y otra de cierre, tipo <A> </A>), sino con etiquetas de elemento
vacío <A/>, que aparecen solo una vez y marcan límites. La idea sería utilizar
este tipo de etiqueta para marcar el inicio o el fin de la unidad que entra en
conflicto con otra.
25. https://www.tei-c.org/release/doc/tei-p5-doc/en/html/NH.html (19 de septiembre de 2023)
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
189
En este ejemplo, en vez de poner una etiqueta <s n=1> para marcar el inicio
de la oración y otra </s> para marcar su final, se podría marcar solo el inicio de
cada oración en un texto con <s n=1/>. El final de la oración se puede inferir por
la etiqueta de inicio de la siguiente oración, o por la marca de fin de texto. Al ser
solo una etiqueta, no se produce conflicto en el anidamiento de etiquetas. Este
método no es tan explícito como el uso de dos etiquetas de inicio y cierre, y en
muchas ocasiones no se puede utilizar, pero es una solución elegante y útil para
algunos casos.
<l><s n=“1”/>Así Fabio lloraba. <s n=“2”/> Albania entonces </l>
<l>mirole, y quiso hablar, cerró los ojos, </l>
<l>y respondiole lo demás la muerte. </l>
Para la tercera opción es necesario que cada unidad tenga un identificador
único (por ejemplo, si son oraciones, vale un simple @n, como n=1 para la primera oración, n=2 para la segunda, etc.). En este ejemplo, si una oración queda
interrumpida por otra unidad, se cierra y se vuelve a abrir pero con el mismo
identificador. De esta manera, gracias al identificador, queda marcado que la
oración continúa:
<l><s n=“1”>Así Fabio lloraba.</s> <s n=“2”>Albania entonces </s></l>
<l><s n=“2”>mirole, y quiso hablar, cerró los ojos, </s></l>
<l><s n=“2”>y respondiole lo demás la muerte. </s></l>
El problema de esta opción es que se duplican las etiquetas y queda una
anotación algo redundante. Si el corpus es muy amplio, se pueden generar al
final ficheros muy grandes.
La última opción es el llamado stand-off Markup. La idea es tener en ficheros
separados el texto por un lado (sin ningún tipo de marca, el texto puro) y en
otros la anotación, con tanto ficheros como tipos de anotación se quieran incluir. Para marcar a qué fragmento de texto corresponde cada etiqueta, se utilizan referencias entre ficheros como punteros, enlaces, etc. Esta es la opción que
utilizan editores como CATMA. Computacionalmente la opción es óptima
pero, como se ha comentado antes, el resultado es una anotación opaca para las
personas pues, en vez del texto, aparecen números de referencia.
El siguiente ejemplo es el formato de CATMA. En cada etiqueta el texto
está referenciado con dos números (punteros): el primero indica la posición en
el fichero de texto del primer carácter del fragmento de texto y el segundo la
posición del último carácter.
<content>Así Fabio lloraba. Albania entonces
mirole, y quiso hablar, cerró los ojos,
y respondiole lo demás la muerte.</content>
Editar el Siglo de Oro en la era digital
190
Borja Navarro Colorado
<l><xi:include href=“source.xml”
pointer=“string-range(element(/1),0,35)”/></l>
<l><xi:include href=“source.xml”
xpointer=“string-range(element(/1),36,75)”/></l>
Como se puede observar, esta segunda opción es totalmente ininteligible para
una persona. Eso sí, es muy eficiente desde un punto de vista computacional.
Qué solución adoptar depende de cada proyecto de anotación. En general,
la opción 4 es la más eficiente desde un punto de vista computacional y la opción 2 la más elegante e inteligible, si bien no siempre es posible aplicarla. A
partir de todos estos problemas, en la siguiente sección se mostrará un modelo
general para la anotación multinivel de un corpus de poesía del Siglo de Oro.
Estudio de caso:
un corpus multinivel de poesía del Siglo de Oro
En esta sección se aborda la anotación multinivel de un corpus de poesía del Siglo
de Oro con el objetivo final de disponer de una anotación rica a modo de análisis
de referencia que permita tanto profundizar en los estudios literarios como en el
desarrollo de herramientas específicas de PLN para poesía española.
Los poemas están extraídos del Corpus de sonetos del Siglo de Oro desarrollado en el Proyecto ADSO (Navarro Colorado et al. 2016).26 La edición de los
textos es la modernización que realizó la Biblioteca Virtual Miguel de Cervantes,27
más algunas correcciones y enmiendas. Además del texto, el corpus ya dispone
de la anotación métrica realizada en el proyecto ADSO.
El modelo de anotación que aquí presentamos está pensado para poder
marcar en principio cualquier tipo de información lingüística o literaria. Por
ahora nuestro interés se centra en el estudio del hipérbaton como rasgo estilístico, para lo que se necesita marcar el corpus a tres niveles de descripción:
métrico (el patrón métrico y rítmico de cada verso), léxico-categorial (la categoría gramatical de cada palabra) y sintáctico (las relaciones sintácticas entre
las palabras, con independencia de su posición en el verso). En el futuro se
espera poder anotar el corpus con otro tipo de información como entidades o
lenguaje figurado.
El proceso de anotación, como es habitual, se desarrolla de manera semiautomática. Primero se realiza una anotación automática con herramientas de
PLN, que luego es revisada, corregida y fijada de manera manual. En esta primera fase del proyecto estamos más interesados en fijar un análisis correcto que
26. https://gplsi.dlsi.ua.es/proyectos/adso/ (17 de enero de 2024).
27. https://www.cervantesvirtual.com/portales/biblioteca_del_soneto/ (19 de septiembre de 2023).
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
191
en disponer de gran cantidad de texto anotado, por lo que por ahora se está
trabajando con pocos sonetos.
Buscando la máxima interoperabilidad, el lenguaje de marcado utilizado es
el XML siguiendo, en la medida de lo posible, las recomendaciones del estándar
TEI. Esta elección no representa un problema para la anotación métrica y categorial, que está bien definida en TEI y para la que XML es un lenguaje de marcado apropiado.
Sin embargo, como se ha comentado en secciones anteriores, la representación de la información sintáctica en XML-TEI no es una representación estándar ni común. Para conseguir la máxima interoperabilidad es mejor utilizar el
formalismo CONLL, al igual que hacen otros corpora multinivel como el corpus GUM (Zeldes 2017): este es el formato que utiliza la herramienta de análisis sintáctico utilizado y es más inteligible para la anotación manual. Para mantener la unidad del corpus, se utilizan identificadores, como se comentará luego.
Con la anotación métrica y léxico-categorial, ambas en XML, se puede producir un problema de anidamiento comentado anteriormente. Para solventarlo,
seguiremos la opción de marcar cada nivel en ficheros diferentes (la opción primera de las cuatro indicadas en la sección anterior).
Para tratar este problema, en trabajos anteriores (Navarro Colorado 2019) se
propuso marcar en un mismo fichero tanto la información métrica como la categorial, y así se materializó en el Corpus general de poesía lírica castellana del Siglo
de Oro.28 Con este objetivo, se desarrolló un modelo de anotación basado en
XML-TEI. En este modelo, las palabras quedan marcadas con la etiqueta correspondiente (“<w>”), tanto al inicio como al final de cada una, que contiene además información sobre el lema de la palabra y su categoría gramatical. La separación silábica, sin embargo, no se marca con la etiqueta “<seg>”, que es la
recomendada por TEI, sino con la barra vertical (“|”). Este formalismo de la barra
vertical es recomendado por las guías directrices de TEI para marcar la separación
silábica de palabras en diccionarios. De esta manera, la sinalefa queda explícitamente marcada con una etiqueta fin de palabra (“</w>”) que no está precedida
por la barra vertical indicativa de fin de sílaba. Véase la sinalefa producida en
“para andar” en este verso de Lope de Vega:
<l met=“-|-|-|-|5|-|7|-|” n=“3”>
<w lemma=“porque” type=“CS”>por|que|</w>
<w lemma=“para” type=“SP”>pa|ra</w>
<w lemma=“andar” type=“VMN0000”>an|dar|</w>
<w lemma=“conmigo” type=“PP1CSO0”>con|mi|go|</w>
</l>
28. https://github.com/bncolorado/CorpusGeneralPoesiaLiricaCastellanaDelSigloDeOro (19 de
septiembre de 2023)
Editar el Siglo de Oro en la era digital
192
Borja Navarro Colorado
Actualmente, sin embargo, no considero apropiado este modelo. Al incluir
además la información métrica en la etiqueta de verso <l>, la anotación resultante es muy densa y resulta compleja para la anotación manual. Por otro lado, su
procesamiento automático no resulta óptimo al mezclar dos tipos de etiquetas,
unas basadas en XML (la etiqueta de verso y palabra) y otra no (la barra vertical
para separar sílabas).
En la propuesta actual considero que es mejor tratar cada fenómeno en ficheros diferentes. Con ello se busca una anotación más modular, de tal manera
que se puedan marcar los textos en paralelo a diferentes niveles, y que en cualquier momento se puedan incorporar nuevos niveles de anotación sin que afecte a los niveles ya marcados.
Así, siguiendo las recomendaciones TEI y aprovechando la experiencia en el
desarrollo de otros corpora literarios como ELTeC (Burnard et al. 2022), se
parte de un fichero central que contiene el texto puro (la edición crítica digital)
marcada únicamente con información textual básica: los metadatos propios del
encabezado TEI y la estructural (títulos y versos). El resto de niveles de representación se marca en ficheros diferentes.
El siguiente código es un ejemplo de la anotación métrica. Como se puede
ver, es una anotación XML-TEI estándar: las sílabas se marcan con la etiqueta
genérica “<seg>” más el valor “syllable”. El patrón métrico y rítmico con las
etiquetas “<met>” y “<real>” respectivamente, más información sobre pausas y
encabalgamientos. Para la justificación de este modelo de anotación, véase Navarro Colorado (2022):
<l source=“#LopeVega.1063.1” met=“--+--+-+-+-”
real=“--+--+-+-+-” enjamb=“no”>
<seg n=“1” type=“syllable” subtype=“0”> Un</seg>
<w n=“1”/>
<seg n=“2” type=“syllable” subtype=“0”> so</seg>
<seg n=“3” type=“syllable” subtype=“3”> ne</seg>
<seg n=“4” type=“syllable” subtype=“0”> to</seg>
<w n=“2”/> <pause type=“1”/>
<seg n=“5” type=“syllable” subtype=“0”> me</seg>
<w n=“3”/>
<seg n=“6” type=“syllable” subtype=“3”> man</seg>
<seg n=“7” type=“syllable” subtype=“0”> da<w n=“4”/> ha</seg>
<seg n=“8” type=“syllable” subtype=“0”> cer</seg>
<w n=“5”/>
<seg n=“9” type=“syllable” subtype=“0”> Vio</seg>
<seg n=“10” type=“syllable” subtype=“3”> lan</seg>
<seg n=“11” type=“syllable” subtype=“0”> te</seg>
<w n=“6”/>
<pause type=“3”/>
</l>
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
193
El único dato ajeno a la métrica es el límite de las palabras. El final de cada
palabra está marcado con la etiqueta <w>, pero como etiqueta simple <w/>. La
razón por la que se incluye el límite de la palabra es para mantener la unidad del
corpus: cada palabra (token) tiene un identificador único, que es utilizado en
todos los niveles de anotación para poder relacionar unos ficheros con otros,
independientemente del tipo de información anotada. Dado que estos identificadores actúan solo a modo de punteros, no es necesario hacer uso de la etiqueta de palabra “<w>” con apertura y cierre. Basta marcar el límite de cada palabra
y su identificador con un elemento vacío“<w/>”, lo que evita el problema de
anidamiento. Seguimos en este punto la segunda recomendación de TEI para
evitar este problema comentado anteriormente.
Otro fichero diferente contiene la anotación categorial del poema. El siguiente fragmento de código muestra un ejemplo. En este caso también se siguen las recomendaciones TEI. Esta anotación es léxica, no hay marcas para
oraciones ni sintagmas, por lo que no hay problema de anidamiento. Cada palabra está localizada con su identificador único, que es el mismo utilizado en el
nivel métrico y sintáctico:
<l source=“#LopeVega.1063.1”>
<w n=“1” lemma=“uno” pos=“DI0MS0”> Un</w>
<w n=“2” lemma=“soneto” pos=“NCMS000”> soneto</w>
<w n=“3” lemma=“me” pos=“PP1CS00”> me</w>
<w n=“4” lemma=“mandar” pos=“VMIP3S0”> manda</w>
<w n=“5” lemma=“hacer” pos=“VMN0000”> hacer</w>
<w n=“6” lemma=“Violante” pos=“NP00000”>Violante</w>
</l>
Finalmente, en otro fichero diferente se están haciendo pruebas de anotación sintáctica con el modelo teórico de las gramáticas de dependencias y el
formalismo CONLL (véase un ejemplo en la Tabla 1 mostrada anteriormente).
El identificador de cada palabra es el mismo utilizado en el resto del corpus. La
información morfológica y categorial en este caso es redundante, porque ya aparece en el fichero del nivel categorial. Por ahora no se elimina para mantener el
formato estándar. Lo relevante es la información sintáctica: las relaciones de
dependencia entre las palabras que se han explicado en la sección anterior.
Con esto ya se podría llevar a cabo el marcado necesario para el estudio del
hipérbaton como rasgo estilístico y su relación con el ritmo poético. Se dispone
por un lado de la posición de cada palabra en el verso, de su patrón métrico y
rítmico, de la categoría gramatical de cada palabra y demás información morfológica, y de las relaciones sintácticas de dependencias entre las palabras.
En estos momentos está definido el modelo y se están desarrollando las
pruebas de anotación. Cada nivel de anotación tiene ahora sus propios problemas que serán tratados en su momento, sobre todo la anotación sintáctica que,
sin duda, es la más compleja. Con todo, lo que aquí hemos mostrado es cómo
Editar el Siglo de Oro en la era digital
194
Borja Navarro Colorado
integrar toda esta información, más otra que se pudiera añadir al corpus, en un
modelo modular pero unificado, claro en la medida de lo posible, y que asegura
la máxima compatibilidad con otros corpora y herramientas de PLN.
Como crítica a este modelo podría argumentarse, y con razón, que es un
modelo redundante, pues hay información repetida en diferentes ficheros (sobre
todo el propio texto). Esto no es apropiado desde un punto de vista computacional porque hace que sea necesario mucho espacio en disco para almacenar el
corpus. Precisamente el modelo de marcado stand-off se diseñó para optimizar el
espacio y evitar redundancias.
Por ahora se ha preferido mantener la redundancia para facilitar la anotación del corpus en paralelo por diferentes personas y con información diferente.
Repetir el texto en cada fichero permite al anotador centrarse en la información
que está marcando, sin depender de otros ficheros. Así, por ejemplo, anotar la
sintaxis se puede realizar con independencia del fichero con información categorial. Finalizada la anotación del corpus se podrá plantear un modelo stand-off
para su almacenamiento final. Gracias a los identificadores de palabra y al fichero central con el texto puro se podrá automatizar este paso; pero esto queda ya
como trabajo futuro.
Conclusiones
En este capítulo se ha mostrado la necesidad, tanto computacional como literaria, de desarrollar corpora literarios anotados a diferentes niveles de descripción
lingüístico-literaria. Para considerar un corpus así anotado como una edición
digital enriquecida que sirva de referencia para los estudios literarios, se ha argumentado que el modelo debe ser compatible con otros corpora y herramientas
computacionales; que así mismo debería relacionar los diferentes niveles de análisis para mantener la unidad textual, y, finalmente, que sería deseable que fuera
un modelo lo suficientemente claro como para permitir la edición manual del
código. Por último, se han presentado algunos problemas formales y los procedimientos para solventarlos, mostrando así la viabilidad de desarrollar un corpus
anotado de poesía del Siglo de Oro que cumpla con estas características.
Editar el Siglo de Oro en la era digital
Edición digital enriquecida: un modelo de anotación multinivel para poesía del Siglo de Oro
195
Bibliografía
Allés-Torrent, Susanna; Gabriel Calarco, y Gimena del Rio Riande, “Edición y publicación de textos con TEI”, TTHub. Text Technologies Hub:
Recursos sobre tecnologías del texto y edición digital, 2022 <https://tthub.io/
aprende/tutorial/edicion-y-publicacion-textos-tei/>
Buchholz, Sabine y Erwin Marsi, “CoNLL-X shared task on Multilingual
Dependency Parsing”, Proceedings of the 10th Conference on Computational
Natural Language Learning (CoNLL-X), New York City, 2006, pp. 149-164.
Burnard, Lou; Borja Navarro Colorado, Carolin Odebrecht y Martina
Scholger, “Collaborative creation of a multi-lingual literary corpus. Challenges and best practices for corpus design”, COST Action Distant Reading
Closing Conference, Krakov/on-line, junio 2022.
Cabitza, F., Campagner, A., Basile, V., “Toward a Perspectivist Turn in
Ground Truthing for Predictive Computing”, Proceedings of the AAAI Conference on Artificial Intelligence, 2023 <https://arxiv.org/pdf/2109.04270.pdf>
Chiarcos, C., Dipper, S., Götze, M., Leser, U., Lüdeling, A., Ritz, J. & Stede,
M., “A Flexible Framework for Integrating Annotations from Different Tools
and Tag Sets”, Traitment automatique des langues 49, (2008) pp. 271-293.
DeRose, Steven, “Markup Overlap: A Review and a Horse”, Proceedings of the
Extreme Markup Languages, Montréal, Canada, 2004.
Haider, Thomas, “Metrical Tagging in the Wild: Building and Annotating
Poetry Corpora with Rhythmic Features” Proceedings of the 16th Conference
of the European Chapter of the Association for Computational Linguistics, pp.
3715-3725, 2021 <https://doi.org/10.18653/v1/2021.eacl-main.325>
Hatzel, Hans Ole; Haimo Stiemer; Chris Biemann y Evelyn Gius, “Machine
learning in computational literary studies” it - Information Technology
(2023) <https://doi.org/10.1515/itit-2023-0041>
Ide, Nancy y James Pustejovsky (eds.), Handbook of Linguistic Annotation,
Dordrecht, Springer, 2017.
Jauralde Pou, Pablo “Cerrar podrá mis ojos la postrera ” Revista de Filología
Española, LXXVII, 1/2 (1997).
Jurafsky, Dan y James H. Martin Speech and Language Processing (3rd ed.
draft), 2023 <https://web.stanford.edu/~jurafsky/slp3/>
Kesarwani, Vaibhav; Diana Inkpen; Stan Szpakowicz y Chris Tanasescu,
“Metaphor Detection in a Poetry Corpus”, Proceedings of the Joint SIGHUM
Workshop on Computational Linguistics for Cultural Heritage, Social Sciences,
Humanities and Literature, Vancouver, Canada, 2017, pp. 1-9.
McShane, Marjorie y Sergei Nirenburg, Linguistics for the Age of AI, Cambridge, Massachusetts, MIT Press, 2021.
Meister , Jan Christoph, “Poetry, Phenomenon and Phenomenology” en Bories, Anne-Sophie; Petr Plecháč y Pablo Ruiz Fabo (eds.), Computational
Stylistics in Poetry, Prose, and Drama, Berlin/Boston, de Gruyter, 2022.
Editar el Siglo de Oro en la era digital
196
Borja Navarro Colorado
Navarro Colorado, Borja; Ribes-Lafoz, María and Sánchez, Noelia “Metrical
Annotation of a Large Corpus of Spanish Sonnets: Representation, Scansion and Evaluation”, Proceedings of the Tenth International Conference on
Language Resources and Evaluation (LREC 2016) Portorož, Eslovenia, 2016.
Navarro Colorado, Borja, “A Metrical Scansion System for Fixed-Metre Spanish
Poetry”, Digital Scholarship in the Humanities 33, 1 (2018a), pp. 112-127
Navarro Colorado, Borja, “On Poetic Topic Modeling: extracting themes
and motifs from a corpus of Spanish poetry”, Frontiers in Digital Humanities. Computational Linguistics and Literature, (2018b), DOI 10.3389/fdigh.
2018.00015
Navarro Colorado, Borja “Por un análisis distante y profundo: un corpus
piloto de la poesía lírica castellana del Siglo de Oro” Revista de poética medieval, 33 (2019).
Navarro Colorado, Borja, “Beyond the metre: formalization of linguistic-rhythmic features for a computational analysis of the Spanish poetry”, Calderón, R
and Python: New Methods and Digital Tools for Quantitative Analysis of Theatre,
Verse Drama and Poetry, Vienna, University of Vienna, 2-3 junio 2022.
Piper, Andrew; Richard J. So y David Bamman, “Narrative Theory for Computational Narrative Understanding”, Proceedings of the 2021 Conference on
Empirical Methods in Natural Language Processing, 2021, pp. 298-311.
<https://doi.org/10.18653/v1/2021.emnlp-main.26>
Pustejovsky, James y Amber Stubbs, Natural Language Annotation for Machine Learning. O’Reilly Media, Inc., 2012.
de la Rosa, Javier; Álvaro Pérez; Laura Hernández; Salvador Ros y Elena González-Blanco, “Rantanplan, Fast and Accurate Syllabification and Scansion of
Spanish Poetry”, Procesamiento del lenguaje natural 65 (2020), pp. 83-90
Schöch, Christof; Julia Dudar, Evegniia Fileva, eds., Survey of Methods in
Computational Literary Studies Version 1.1.0, Trier, CLS INFRA, 2023
<https://methods.clsinfra.io>, DOI: 10.5281/zenodo.7892112.
The TEI Consortium, TEI P5: Guidelines for Electronic Text Encoding and Interchange 2023 <https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html>
Torre, Esteban, “«Cerrar podrá mis ojos...»: Paráfrasis, métrica y hermenéutica” Rhythmica, 2, (2004), pp. 235 - 250 <https://doi.org/10.5944/rhythmica.6409>
Zeldes, Amir, “The GUM Corpus: Creating Multilayer Resources in the Classroom”, Language Resources and Evaluation 51, 3 (2017), pp. 581-612.
Zipser, F. y L. Romary “A model oriented approach to the mapping of annotation formats using standards”, Proceedings of the Workshop on Language Resource and Language Technology Standards, LREC 2010, Malta, 2010
<http://hal.archives-ouvertes.fr/inria-00527799/en/>
Editar el Siglo de Oro en la era digital