N°3 / Vers l’interopérabilité des bases de textes / Toward Interoperability of Texts Databases — Digitizing Enlightenment V

ECuMe (Édition Censure Manuscrit)

Fonctionnalités et interopérabilité d'une bibliothèque numérique sous CMS

Laurence Macé

Résumé

Mots-clés

Plan de l'article

Télécharger l'article

1. Présentation générale du site ÉCuMe

Le projet ÉCuMe (Édition Censure Manuscrit) résulte d’une recherche individuelle fondée sur une expérience dans le domaine de l’édition critique au croisement de la littérature, de l’histoire du livre et de l’histoire de la censure et de l’opportunité d’un financement à l’échelle régionale normande au sein d’un « paquet » de projets numériques, le projet CorNum (Contenus et cORpus NUMérisés)[1]. Pour la période 2018-2021, 20.000 € (dont 5000 pour le développement et 12.000 pour les numérisations) ont été alloués au projet qui a engagé la collaboration de 2/3 puis 3/4 partenaires : l’IRIHS, structure de recherche fédérative en LSH/SHS de l’Université de Rouen porteuse du projet CorNum, l’ITEM puis l’UMR Thalim (CNRS/Sorbonne Nouvelle) pour la plateforme d’édition EMA et à partir de 2020, la BMCF (Bibliothèque-Musée de la Comédie-Française) pour une partie des fonds numérisés. Ces partenariats sont naturellement affichés au bas de la page d’accueil du site.

Totalement émergent au moment de l’appel à projets financé, ÉCuME proposait de développer sur cette base modeste un prototype pour une idée : à partir d’un corpus patrimonial manuscrit et imprimé, l’idée était de reconstituer le processus de censure et de mesurer son incidence dans la genèse des textes d’Ancien Régime, en se fondant sur un objet jamais étudié : le manuscrit soumis à la censure portant le visa du censeur et, le cas échéant, de ses diverses interventions sur le manuscrit. Techniquement, il s’agissait de proposer un prototype de bibliothèque numérique d’archives de la censure pour l’édition génétique des textes de l’Ancien Régime.

Pour ce faire, le choix a été fait d’utiliser la plateforme EMAN (Édition de Manuscrits et d’Archives Numériques[2]), un CMS (Content Management System, en français Gestionnaire de contenus) fournissant une instance Omeka Classic implémentée de plugins (dont le plugin « Transcript » dont nous reparlerons).

La plateforme EMAN développée au sein de l’ITEM puis de THALIM par Richard Walter a été choisie pour deux raisons principales :

– parce qu’elle permettait un développement collaboratif et mutualisé, et de ce fait la participation d’intervenants pas spécifiquement formés au code informatique : elle offrait en effet une interface « clique-boutons » autorisant le recrutement de collègues et étudiants non formés à l’XML-TEI par exemple (je reviendrai sur l’impact pédagogique d’ÉCuMe)

parce qu’elle offrait des garanties de pérennité et interopérabilité, répondant aux préconisations du consortium CAHIER pour le plan de gestion des données par exemple et étant hébergée par la TGIR HumaNum.

L’adresse du site ÉCuMe, dont on trouvera ci-après une capture d’écran de la page d’accueil, est la suivante : https://eman-archives.org/Ecume/.

 

2. Présentation scientifique du site ÉCuMe

Sur un plan scientifique, ÉCuMe

vise à rendre visibles et lisibles les textes soumis à la censure dont le processus n’a pas abouti, ou à confronter le texte soumis à la censure aux versions imprimées du même texte

en se fondant sur quelques rares témoins conservés et sur des séries souvent partielles, ÉCuMe travaille à partir du résiduel et de la trace, à la manière des paléoanthropologues identifiant les formes humaines anciennes.

Un tout petit nombre de témoins autorise ainsi la reconstruction d’un état parfois méconnu du texte et l’approche de pratiques de censure finalement mal connues voire pas connues du tout dans le détail.

Sur cette base, ÉCuMe propose une bibliothèque numérique, soit l’équivalent d’une étagère présentant divers objets organisés autour de « collections », elles-mêmes composées de « notices » (ou « items »), elles-mêmes composées de « fichiers ».

Chaque « collection » – ou série - est organisée autour d’un manuscrit soumis à la censure, c’est-à-dire a minima paraphé par le censeur, ou à défaut son fantôme. Sur un plan théorique, ces séries étant très souvent incomplètes, il nous est apparu intéressant de faire apparaître au moins (dans les cas mis en avant sur la page d’accueil, c’est-à-dire bénéficiant d’une édition) au moins une série dont le(s) manuscrit(s) soumis à la censure est(sont) manquant(s) : c’est le cas de La Vie de Molière de Voltaire, une série sans manuscrit central. Nous y reviendrons.

Chaque collection comprend idéalement un manuscrit paraphé par le censeur, l’édition approuvée issue du processus de censure, une ou plusieurs éditions clandestines et tout autre document (témoignages issus de correspondances, article de presse périodique) pertinent pour la série.

Sur un plan pratique, il s’est agi :

– de recenser, identifier, classer, décrire chacun des documents d’archives (manuscrits ou imprimés) situés dans les structures dépositaires en France et à l’étranger : une campagne de recherche menée par des étudiants de M2 du Master Humanités numériques a ainsi permis de repérer de nouvelles éditions dans le KVK et le WorldCat au printemps 2023

Il faut noter l’extension massive du projet qui a intégré le corpus des manuscrits dits du souffleur de la Comédie-Française : pour le XVIIIe siècle, environ 40% des manuscrits du souffleur conservés (environ 180 sur 380) sont des manuscrits portant aussi, outre les inverventions du souffleur et ou de la Troupe, le paraphe du censeur et du lieutenant de police, et les interventions du censeur le cas échéant.

d’étudier les pratiques des censeurs royaux, notamment identifier et analyser sur les manuscrits la nature des interventions censoriales dans les textes parus « avec approbation » au XVIIIe siècle

– d’expérimenter une édition numérique génétique permettant de retracer et de visualiser sous différentes formes les processus de censure et leurs interactions avec les processus éditoriaux.

Ce volet est resté le moins abouti, pour des raisons techniques qui seront exposées plus loin.

Sur un plan théorique, ÉCuMe

illustre l’idée d’un « texte fluide » (J. Bryant) ou « héraclitéen » (E. Pierazzo),

– dessine les formes de ce qu’on pourrait appeler une auctorialité partagée au sein de l’« ancien régime de la Librairie » (R. Chartier),

– met en évidence les « transactions » (G. Genette) ou les « négociations » (Steven Shapin) dont le manuscrit est le lieu et dont il porte la trace, entre auteur et autres instance (imprimeur-libraire, censeur(s), voire comédiens-acteurs (et comédiennes actrices..) avec lesquels se trouve partagée la fonction auctoriale,

– permet la visibilisation de protagonistes jusqu’ici oubliés par l’histoire des textes : les censeurs mais aussi les comédiens, les comédiennes,

contribue à redessiner le continent des œuvres perdues, à affiner la «  perception obscure et vague » du volume de ce qui a disparu (J. Schlanger).

On trouvera par exemple ici la première page du Voyage au Levant d’Antoine Galland, manuscrit laissé posthume au moment de la mort du traducteur des Mille et une nuits en 1715, soumis à la censure par ses proches et finalement pas publié[3]. En haut à droite de la page manuscrite, la numérotation en toutes lettres de la page de la main du censeur Moreau de Mautour (« deux ») de même que le paraphe qu’il a imposé au bas de la page sous le texte, identifie ce manuscrit comme le manuscrit soumis à la censure. Même claire dans sa graphie, cette page conservée à la Staatsbibliotek de l’État de Bavière illustre la difficulté d’interprétation de ces objets manuscrits, les interventions sur le premier jet du texte pouvant être attribuées à l’auteur lui-même, à quelque(s) ami(s) érudit(s) au(x)quel(s) il soumit certains textes de son vivant, ou encore à des interventions posthumes : par le censeur, et peut-être par d’autres avant eux.

Sur cette page, la largeur du trait et la graphie des « ajouts » postérieurs rendent vraisemblable l’attribution à Moreau de Mautour, le censeur : on notera que les modifications intervient sur le titre et un énoncé pour des raisons purement « stylistiques » fort éloignées de la manière dont on imagine l’intervention du censeur depuis le XXe-XXIe siècle.

ÉCuMe ne s’est pas contenté de numériser des manuscrits et des imprimés, ou de récupérer des numérisations.  Comme déjà dit, le site structure les objets sous forme de collection et présente chacun des objets composant chaque collection sous forme de métadonnées intégrées à des « blocs » dont le contenu a été défini, ici par exemple la notice d’une lettre par Decroix éditeur de Voltaire à Ruault au sujet d’un Recueil de lettres de Voltaire, de Mme du Châtelet et de Jean-Jacques Rousseau, postérieur à la mort de tous les épistoliers puisque daté de 1782. Ces métadonnées permettent comme on va le voir une interrogation des données pour l’utilisateur du site.

ÉCuMe se distingue en tant que le développement du site a accompagné le développement de la recherche, tandis que celle-ci précède souvent le développement informatique (étant parfois complètement achevée avant la candidature à l’appel à projets, qui finance dès lors un projet déjà presque totalement abouti).

Entre le début et la fin du projet, on est ainsi passé de deux manuscrits signalés dans des notes de bas de page à une quarantaine de manuscrits dispersés auxquels sont venus s’ajouter les 188 manuscrits du souffleur de la Comédie-Française (et 9 autres manuscrits de la Comédie-Française ne relevant pas du souffleur).

Au 31/12/ 2021, date de la fin scientifique officielle du projet (et de la 1ère publication), ECuMe comptait :

– 203 collections ouvertes pour 308 contenus présentés via des métadonnées Dublin Core (15 métadonnées essentielles) complétées de métadonnées personnalisées spécifiques au projet (« censeur », « imprimeur-libraire),

– 5 collections sont « mises en avant » et accessibles à partir de la page d’accueil : elles sont transcrites intégralement ou partiellement, dont deux pièces de la Comédie Française: La Réunion des amours de Marivaux (mss. du souffleur) et Le Siège de Mézière de Durosoy (manuscrit pour la publication).

Les transcriptions sont progressivement révisées et complétées depuis le 1er janvier 2022 (la révision considérée comme définitive étant toujours signalée et devant être considérée comme non encore advenue par défaut) et une 6e collection transcrite par deux étudiantes du Master Humanités numériques de l’Université de Rouen rejoindront les 5 premières en page d’accueil dès qu’elles auront pu être revues.

– 77 manuscrits dits du souffleur du XVIIIe siècle, paraphés par la censure, ont pu être numérisés grâce à ÉCuMe (selon le choix de la conservatrice de la BMCF, Agathe Sanjuan, les 50 premiers manuscrits dans l’ordre chronologique, ainsi que les 28 manuscrits les plus fragiles sur le plan de conservation ou de plus grande valeur sur le plan patrimonial (autographes et d’auteurs canoniques) ;

– les 110 manuscrits du souffleur 18e paraphés par la censure restants ont été par la suite  dans le cadre d’un partenariat Gallica/Comédie-Française.

Ainsi 40% environ du fonds des manuscrits du souffleur de la Comédie-Française a été numérisé directement ou indirectement grâce au projet ÉCuMe, qui a lancé la numérisation de ce fonds (à terminer) au terme financier et scientifique du projet financé par la Région Normandie.

L’interface producteur du site permet d’accéder aux statistiques du site qu’on présente ici :

3. les fonctionnalités EMAN exploitées par ÉCuMe

Le corpus

Le corpus de manuscrits est directement accessible à l’utilisateur sur le menu bandeau horizontal via l’onglet « Parcourir le corpus ». L’arborescence du corpus présente les titres courants des textes du corpus comme on le voit ici.

Pour circuler dans le corpus

Comme dit plus haut, des Métadonnées Dublin Core (créateur, date, source, titre) complétées de métadonnées « personnalisées » (pour ÉCuMe à notre demande, « censeur », « imprimeur-libraire », « date de représentation » pour le corpus théâtral) permettent d’interroger le corpus via un index des valeurs à menu déroulant. On a délibérément fait le choix d’un petit nombre de « valeurs ». On y accède à travers l’onglet « Consulter les index » de la page d’accueil comme on le voit ici :

L’index des valeurs permet aussi une interrogation par titre courant, ainsi que par « créateur » (l’auteur en Dublin Core), par date (plusieurs types de date, que nous voudrions mieux distinguer dans l’index), par source (structure dépositaire et cote), par imprimeur-libraire et par censeur (les lieutenants de police n’étant pas distincts des censeurs et comptés dans cette catégorie au 1.9.2023, comme René Hérault dans la capture d’écran ci-dessous) :

C’est néanmoins l’action des censeurs royaux que cette métadonnée met en avant, comme ici où apparaissent les censures du corpus signées par Fontenelle, censeur en chef ou presque pour toute la première moitié du siècle – censures bien bien plus nombreuses en vérité, comme l’ont montré les travaux de Jean-Dominique Mellot[4].

L’un des censeurs les plus actifs de notre corpus (pas complètement représentatif) est Prosper Jolyot de Crébillon le dramaturge, dit Crébillon père (1674-1762), censeur royal et censeur de la police pour les théâtres parisiens de 1728 à sa mort en 1762 : 29 manuscrits du souffleur de la Comédie-Française qui portent son paraphe ont été conservés (étant entendu qu’en théorie toutes les pièces nouvelles jouées le furent nécessairement avec son accord).

On peut aussi interroger le corpus par l’entrée « imprimeur-libraire », qui n’est pas sans offrir des difficultés compte tenu du caractère dynastique de cette industrie. L’exemple des Prault présenté ici met en évidence l’implication de ces libraires, les plus éminents d’entre eux, dans le système de la censure royale avec laquelle ils travaillent étroitement et dont ils anticipent parfois les desiderata comme le montre l’exemple des « censures » dénoncées par Voltaire dans sa Vie de Molière, vraisemblablement imputables au libraire et non au censeur lui-même et réalisées sans doute en amont de la remise du texte à Fontenelle (l’une des censures le concernant directement)[5] :

Parmi les autres fonctionnalités embarquées sur la plateforme EMAN offertes pour accéder au corpus d’ÉCuMe, on peut noter en page d’accueil le carrousel d’images qui permet un accès aléatoire à l’utilisateur non spécialiste du site :

L’accès par mots-clés, possible et un temps envisagé à titre expérimental, a été pour le moment abandonné en raison du caractère arbitraire des tags et de leur redondance avec les métadonnées renseignées par ailleurs (le genre littéraire du texte par exemple).

Concernant l’approche génétique du corpus, un outil de comparaison de notices, embarqué sur EMAN et donc sur ÉCuMe qui permet une visualisation « face à face » de deux pages appartenant à deux items d’une même collection (le même passage dans l’édition approuvée et dans une édition clandestine par exemple, ou dans le manuscrit et l’édition approuvée). La comparaison est possible entre fichiers images et métadonnées, mais son utilisation est complexe et de fait difficile car l’adresse des deux notices doit être entrée (et donc préalablement connue). Aucun dispositif d’alignement automatique n’existe entre les notices.

 

En terme de fonctionnalités, le financement accordé par ÉCuMe à la plateforme EMAN a notamment permis de développer un plugin de visualisation des données via le module Graph : en établissant des relations entre les objets de chaque collection selon une syntaxe donnée (x a pour édition clandestine y, x a pour édition officielle z, x a pour commentaire zz etc…) grâce au module « Item Relations », il est non seulement possible de faire apparaître ces relations dans la notice de la collection visualiser les relations entre les objets (notices) de chaque collection, et entre les documents de collections différentes.

Enfin, la page d’accueil donne accès, sous le carrousel d’images, aux collections « mises en avant » qui ont bénéficié d’une transcription de tout ou partie des objets de la collection.

Pour ces collections mises en avant, ÉCuMe a expérimenté via l’outil EMAN-embarqué Transcript, spécifiquement développé par EMAN pour Omeka, une édition semi-diplomatique XML-TEI de chaque image numérisée – édition collaborative via la création/la modification possible de métadonnées et des transcriptions par les chercheurs et étudiants associés au projet.

Dans le cadre du projet financé, de premiers textes ont d’abord été encodés sous la version Transcript1 par l’assistante ingénieure recrutée à tiers-temps sur le projet :

Une V2 de Transcript a ensuite été développée par EMAN, qui a été utilisée par les stagiaires du Master Humanités numériques de Rouen qui sont ensuite intervenus sur le projet comme le montre ici l’exemple de La Réunion des amours de Marivaux, encodée par Deborah Caltero et Romane Long au printemps 2022 (ci-dessous), ou la Zénéide de Louis de Cahusac, encodée par Eva Prevost et Isabelle Suze au printemps 2023. [20]

Si l’utilisateur peut afficher la transcription face au texte ou la transcription seule, l’interface producteur, quand il est connecté, permet l’accès au code-source pour l’éditeur :

Cet encodage peut se faire, via le module Transcript, grâce à un menu déroulant pour les éditeurs possédant pas ou peu de notions d’encodage, ici l’interface éditeur dans la V1 de Transcript (sept.2019-juin 2021) :

et l’affichage sortie utilisateur à la suite de cet encodage via Transcript V1 :

4. Et l’interopérabilité dans tout ça ?

Conformément aux préconisations du W3C, ÉCuMe s’est efforcé de penser l’interopérabilité du site, à la fois sur le plan scientifique et sur le plan technique. 

Sur le plan scientifique, ÉCuMe énonce le protocole d’édition critique qu’il met en œuvre dans l’onglet « Principes éditoriaux » de la Page d’accueil.

Y sont mentionnés à la fois les principes de transcription et les balises utilisées (même si cette version de la page n’est à ce jour pas stabilisée suite à la bascule de la v1 à la v2 du module « Transcript », une partie des transcriptions ayant été réalisées sous v1, l’autre sous v2 sans que la plateforme ait à ce jour pourvu aux problèmes d’homogénéisation des deux versions[6]).

En termes d’interopérabilité scientifique encore, l’onglet « Avancement et actualités du projet » toujours en page d’accueil, décrit l’état du site au temps t de la consultation – le site continue de connaître révisions et éventuellement modifications – et mentionne pour l’utilisateur, le cas échéant, les problèmes rencontrés ponctuellement.

De manière plus pragmatique, la métadonnée Dublin Core « Description » de certaines notices est utilisée pour signaler cet avancement (ou des problèmes plus ou moins ponctuels d’accessibilité ou d’alignement) et la métadonnée Dublin Core « Contributeur » permet de préciser l’état révisé ou non de chaque fichier. Sur un plan éthique, essentiel et désormais exigé dans les financements, cela permet, à tous les niveaux de l’arborescence (collection/notice/fichier) la reconnaissance du rôle joué par chacun, comme le montre la page d’une des deux notices de la collection du Siège de Mézière de Durosoy, dont j’assume l’édition scientifique réalisée en collaboration avec Élisa Barthélemy, assistance ingénieure qui a conçu globalement l’édition numérique sur la partie financée du projet. Le bloc « Edition numérique du document » qui mentionne les droits (et notamment les droits à l’image qui reste propriété de la troupe de la Comédie-Française) précise le détail des contributions de chacun : Nicolas Morel, post-doc du FNSR, a assuré la transcription du document, édité spécifiquement par Deborah Caltero, stagiaire du master Humanités numériques de l’Université de Rouen au printemps 2022, avant révision et validation scientifique par Hélène Hôte, ingénieure d’études au CÉRÉdI (Université de Rouen).

En page d’accueil, accessible depuis le menu déroulant de l’onglet « Présentation du projet », une page dédiée présente l’ensemble des membres de l’équipe ayant participé plus ou moins ponctuellement au projet, et leur institution d’appartenance le cas échéant.

Du point de vue de l’interopérabilité technique, le site ÉCuMe, tout comme la plateforme EMAN est créé sous licence Creative Commons, c’est-à-dire qu’il répond à un modèle livre et ouvert, aussi bien au niveau des métadonnées qu’au niveau des données.

Au niveau des métadonnées, aucun import automatique (possible en général sur EMAN) n’a été réalisé pour ÉcuMe. Le référentiel auteurs de la BNF, finalement réduit à la forme du nom BNF et date (sans import automatique) a néanmoins été utilisée. Une réflexion est en cours sur la question des référentiels pour compléter le site.

Par ailleurs, les métadonnées créées par le site sont, comme on l’a dit, décrites au format Dublin Core et compatibles avec ce protocole. Plusieurs types d’exports des métadonnées sont possibles, pour les machines :  les exports prévus, qui supposent d’avoir les bons logiciels pour interpréter les fichiers prévus sont : atom, dcmes-xml, json, omeka-xml, ce dernier étant le plus performant. Un export PDF des métadonnées est possible pour les humains (et l’export PDF des métadonnées et des images est fonctionnel sur d’autres sites EMAN et devrait être installé sur ÉcuMe prochainement).

Un moissonnage des métadonnées est également possible à partir de l’entrepôt OAI-PMH qui permet d’interroger celles-ci par le biais d’une requête. Ainsi on peut par exemple

lister les collections du projet

lister tous les contenus de toutes les collections avec les descripteurs Dublin Core

lister les contenus de toutes les collections avec d’autres descripteurs

lister les contenus d’une collection

lister les informations d’un contenu avec les descripteurs Dublin Core/avec tous les descripteurs.

Une difficulté importante, qui demeure et a été corrigée pour les projets EMAN plus récents postérieurs à ÉcuMe concerne l’absence de de l’encodage XML-TEI réalisé. Une réflexion est en cours avec la plateforme pour voir comment pallier ce manque important.

Au niveau des données maintenant, concernant l’import, il faut préciser qu’il n’y a pas de base de données au fondement d’ÉcuMe de sorte qu’aucun import csv (possible dans le bandeau de gauche de l’espace de travail) n’a été réalisé. Les transcriptions ont été réalisées soit sous Word puis intégréés dans l’éditeur Transcript et soit via océrisation par le logiciel OCR Transkribus pour les éditions imprimées (Transkribus n’ayant pu être entraîné et utilisé pour les manuscrits en raison du grand nombre de mains différentes au regard des capacités de Transkribus au moment du développement financé du projet) : par le biais d’une fonction installée dans l’éditeur XML-TEI embarqué sur EMAN (et donc EcuMe), on dépose un fichier et un mapping se fait.

Les fichiers images ont quant à eux été importés en masse : si dans EMAN l’import est généralement  possible aux formats  .jpg, .jpeg, .png, .gif, .bmp et .tiff, il a dans la pratique été réalisé pour ÉcuMe au format .jpg uniquement. Un module AdminImage a réemment été développée pour passer de la visionneuse Bookreader à la visionneuse Universel Viewer, permettant ainsi l’évolution de la plateforme vers le standard IIIF.

Du point de vue des données, est possible sur ÉcuMe :

l’export XML-TEI de la transcription d’un fichier : 
https ://eman-archives.org/Ecume/transcript/browse ?fileid=2135 => https ://eman-archives.org/Ecume/teibp/transcriptions/97a2c32f105a81b83c221ea838c6e057.xm

– l’export en bloc de tous les fichiers XML-TEI d’une notice

Sur  https ://eman-archives.org/Ecume/items/show/62, on peut par exemple choisir Exporter les 74 transcriptions dans un fichier XML et on arrive bien à un fichier xml valide mais il faut avoir le bon outil pour visualiser le document.

5. Croître et multiplier

Quels sont les résultats et enjeux de l’interopérabilité pour ÉCuMe à date ? L’interopérabilité effective du site est difficile à mesurer car il n’existe pas de statistiques de téléchargements à date pour les sites EMAN.

La publication du site ÉCuMe, effective depuis le 31 décembre 2021 selon l’exigence du financeur du projet, la Région Normandie, a provoqué la bascule en mode public de l’ensemble des métadonnées et d’une partie des transcriptions « mises en avant » pour les collections en page d’accueil, pour certaines en cours de révision encore. 4 des 5 collections mises ont en avant ont été révisées à l’automne 2023, une 4e (plus massive sur le plan textuel) est encore en cours de révision et une 6e collection, celle de la Zénéide de Cahusac, sera mise en avant quand les transcriptions réalisées par Eva Prévost et Isabelle Suze dans le cadre de leur stage au printemps 2023 pourront être vérifiées.

Ainsi ÉCuMe continue de croître, malgré les retards induits par la crise sanitaire 2020-2021 qui est venue percuter de plein fouet le projet en cours de financement, qui n’a pu bénéficier de report et a donc été assez sévèrement impacté. L’autre conséquence de la Covid a été la difficulté à rassembler une équipe scientifique suffisamment importante pour m’assister dans le projet, alors que chacun était confiné et que d’autres projets numériques antérieurs et importants comme celui des Registres de la Comédie-Française (dans lequel la plupart de ceux qui pourraient intervenir sur les manuscrits du souffleur) marquaient le pas ou rencontraient des difficultés liées au confinement.

En matière d’interopérabilité mais pas seulement, plusieurs points doivent être retravaillés pour « achever » la publication d’ÉCuMe. Cela devrait passer, sur un plan technique, par :

– la bascule en mode Multipages (v2) des transcriptions réalisées en mode Monopage en v1, de manière à les distribuer face à chaque image ;

la possibilité d’aligner transcription et image ;

– l’intégration de documentant l’édition comme l’exige tout projet XML-TEI.

Ces avancées essentielles sont actuellement freinées faute de financement.

On pourrait dès lors, sur un plan plus scientifique, envisager :

la mise à jour du protocole éditorial quand le module Transcript sera stabilisé et utilisé de manière homogène pour tous les fichiers d’ÉCuMe

la définition d’usages réguliers et spécifiques des métadonnées Dublin Core et des métadonnées personnalisées (ex. met-on sous la métadonnée « censeur », comme c’est le cas actuellement, le lieutenant de police qui valide l’avis du censeur.

Un dictionnaire pour guider l’utilisateur pourrait être envisagé.

– la réflexion sur le recours possible à d’autres standards, notamment archivistiques (XML-EAD pour certains objets des collections)

– la réflexion sur les référentiels utiles et leur possible import dans ÉCuMe.

L’interopérabilité constitue donc un point d’attention et un enjeu majeur pour le projet ÉCuMe, qui dépend de nouveaux financements régionaux, nationaux voire internationaux qui pourraient être obtenus. Il faut malheureusement insister sur la difficulté qu’il y a à obtenir des financements : ainsin en 2022-2023, un projet conjointement porté par l’Université de Bristol et l’Université de Rouen (« Censoring the French State Stage 1700-1830 (PI Clare Siviter, co-I Laurence Macé) déposé auprès de l’AHRC (Arts and Humanities Research Council) autour du corpus des manuscrits du souffleur de la Comédie-Française, n’a finalement pas été retenu. Plusieurs pistes s’esquissent désormais, soit qu’un ÉCuMe 2 poursuive le travail de recension et de visibilisation des manuscrits de tous genres soumis à la censure, sur EMAN ou sur un nouveau site dédié (CorNum2, Région Normandie, en réflexion), soit qu’une convergence soit envisageable à plus ou moins long terme pour les seuls manuscrits de théâtre vers le projet des Registres de la Comédie-Française ou des projets associés. Dans tous les cas, seule la garantie offerte par ÉCuMe 2 ou tout autre nouveau site en termes d’interopérabilité permettra que l’une ou l’autre de ces pistes se concrétise.

 

 


[1] Pour une présentation du projet CorNum, voir ici : https://ceredi.hypotheses.org/projet-cornum. Une communication proche de ce texte est consultable en vidéo à l’adresse https://webtv.univ-rouen.fr/videos/03-edition-censure-et-manuscrit-par-laurence-mace-ceredi_13893/.

[2] Pour une présentation d’EMAN, voir ici : https://eman-archives.org/EMAN/

[3] Voir notamment Manuel Couvreur et Didier Viviers, « Galland se relit : correction ou censure », Revue belge de philologie et d’histoire, 72-3, 1994, p. 585-593 ; Manuel Couvreur, « Jacob Spon, à travers un manuscrit inédit de la Bibliothèque Royale de Belgique », dans Jacob Spon : un humaniste lyonnais du XVIIème siècle, éd. Roland Étienne et Jean-Claude Mossière Lyon, PUL, « Publications de la Bibliothèque Salomon-Reinach », 1993, p. 247-256 et l’introduction d’Antoine Galland, Le Voyage à Smyrne. Un manuscrit d’Antoine Galland (1678), éd. Frédéric Baudeigne, Paris, Chandeigne, 2000, p. 29-34. Le manuscrit du Voyage dans le Levant est conservé à Munich, Bayerische Staatsbibliotek (BSB), sous la cote Ms. cod. gall 727-728 (ce sont les numérisations libres de droits disponibles en ligne qui ont été utilisées).

[4] Voir Jean-Dominique Mellot, « Fontenelle censeur royal ou approbateur éclairé? », Revue Fontenelle, 6-7, 2008-2009, p. 51-72 et id., « La centralisation censoriale et la critique à la fin du règne de Louis XIV », dans Censure et critique, dir. Laurence Macé, Claudine Poulouin et Yvan Leclerc, Paris, Classiques Garnier, 2015, p. 33-60.

[5] Voir Laurence Macé, « Avec approbation et privilège du Roi : écrire la Vie de Molière sous le regard de la censure », dans Molière malgré lui. Récits de vie, imagerie, mise-en-légende, dir. Elodie Bénard et Marc Douguet, Hermann, 2021, p. 45-60.

[6] En termes d’affichage utilisateur de certains encodages, ceux-ci étant par ailleurs pour certains en mode mutlipages (face à l’image, pour la v2) et d’autres en mode monopage (l’intégralité de la transcription face à la première image de l’item, généralement la page de couverture, pour la v1).

Continuer la lecture avec l'article suivant du numéro

Inventaire de la correspondance de Beaumarchais

Linda Gil

Lire la suite

Du même auteur

Tous les articles

Aucune autre publication à afficher.