Javier del Barco (chercheur à l'Instituto de Lenguas y Culturas del Mediterráneo y Oriente Próximo, du Consejo Superior de Investigaciones Científicas – CSIC, Madrid).

La présentation publiée ci-après a été faite dans le cadre du projet ANR ACHN 2016 MBH et du séminaire du Centre Paul-Albert Février, le 13 décembre 2016, de 16h à 18h, à la MMSH d'Aix-en-Provence. 

***

Aujourd’hui, le catalogage de manuscrits est en pleine transformation. Le développement disciplinaire de la codicologie depuis les années cinquante du dernier siècle a posé de nombreuses questions sur la production de manuscrits et a apporté plusieurs approches à leur étude en traversant les limites imposées par les disciplines : objet multiforme, le manuscrit se prête bien à une étude globale, soit matériel, soit textuelle, soit historique. Selon les questions posées et selon l’objet de la recherche sur le manuscrit, des approches quantitatives, comparatives, contextuelles, et structurelles sont possibles et nous permettent d’étudier sous différents angles la production, l’utilisation, la circulation et le collectionnisme de ce qui est l’objet de nos recherches, le manuscrit médiéval.

À ce développement des approches méthodologiques, l’arrivée de l’informatique et son application à l’étude des manuscrits médiévaux, a constitué un énorme potentiel pour la recherche et a changé drastiquement nos manières de travailler et d’envisager les résultats. Ce n’est pas un fait spécifique dans l’étude des manuscrits, mais un phénomène global dans les Sciences Humaines, et dont l’apparition des Humanités Numériques en atteste l’ampleur et l’importance.

Mais qu’est-ce que cette transformation signifie aujourd’hui lorsque nous envisageons d’écrire un catalogue de manuscrits ? À quelles questions devons-nous essayer de répondre ? Quels sont les enjeux scientifiques propres à un catalogue de manuscrits ? À quoi le catalogue, pour qui, comment ? Et la question qui nous intéresse ici de façon particulière, comment intégrer, dans notre travail, le potentiel que nous offre l’informatique pour résoudre nos questions ?

Tout d’abord, faisons un peu d’histoire sur la relation entre l’informatique et l’étude des manuscrits. En 1991, Denis Muzerelle, dans un article intitulé « Evolution et tendances actuelles de la recherche codicologique », faisait la réflexion suivante sur l’utilisation de l’informatique pour l’étude codicologique des manuscrits :

« Avec l’informatique, on a entrevu le moyen d’accumuler, de gérer et d’exploiter des masses de données pratiquement infinies, de les tenir perpétuellement à jour, et surtout de compléter les données traditionnelles par une foule d’autres dont la liste pourrait s’allonger au fur et à mesure des besoins et des découvertes (Muzerelle 1991, 356) ».

Muzerelle appelle depuis « choc informatique » la manière dont cet outil a changé la façon de travailler avec les manuscrits, en particulier pour leur étude codicologique, un changement qui n’a pas de retour arrière car, selon cet auteur :

« Aujourd’hui, on ne conçoit plus d’opération de répertoriage ni d’enquête de quelque ampleur sans le secours de l’informatique (Muzerelle 1991, 357) »

Le choc informatique dont Muzerelle parle, peut être décrit d’une manière plus précise comme « le choc des bases des données », car il souligne l’impact de l’informatique sur le traitement des données codicologiques, c’est-à-dire leur accumulation, gestion et exploitation. En effet, jusqu’au développement des images numériques et d’internet, les bases des données, et leur traitement, ont été l’enjeu principal de l’informatique en relation avec l’étude des manuscrits.

Pour les manuscrits hébreux, depuis les années soixante-dix, Malachi Beit-Arié et son équipe ont construit la base de données codicologique des manuscrits hébreux datés, appelé Sfardata, à partir des données rassemblées pour le catalogage des manuscrits hébreux datés dans les bibliothèques de France et d’Israël. Le premier volume de ce catalogue a été publié en 1972, et le dernier en 1986 sous l’égide du Comité de paléographie hébraïque. Cette équipe a commencé son travail encore à l’époque où l’on utilisait des cartes perforées pour communiquer avec la machine. Or, cet outil a été développé durant les décennies qui ont suivi, et à présent la base de données Sfardata est accessible en ligne et par une interface graphique beaucoup plus facile à utiliser par l’utilisateur non-expert. (chercher Paris BNF 20).

Page d'accueil de Sfardata

Page d'accueil de Sfardata

Mais si le choc des bases de données a eu un impact effectif sur la manière dont on travaille avec les données ramassées lors de l’observation et de la description des manuscrits, c’est le « choc d’internet » qui a véritablement bouleversé l’accessibilité --et même-- la forme des résultats de nos recherches. En effet, la création des bases de données informatiques avait offert d’énormes possibilités de renouvellement des méthodes de travail, en particulier dans la gestion d’une foule de données qui désormais pouvaient être analysées avec la précision et la vitesse de la machine. Mais la forme du résultat final en était la même : un catalogue en papier avec une distribution limitée aux bibliothèques spécialisées et aux centres de recherche. Ce n’est qu’avec l’apparition d’internet que le catalogue en papier va à commencer sérieusement à être contesté, et cela à cause de la numérisation des catalogues des bibliothèques et des collections de manuscrits.

Numérisation et accessibilité sont, à mon avis, les deux mots magiques que la nouvelle ‘Ère internet’ a imposé à nos enjeux scientifiques. Numérisation des catalogues de bibliothèques et des images de manuscrits, et accessibilité des collections : voilà les deux objectifs qui s’imposent aux grandes et petites bibliothèques à présent, et qui changent d’une manière drastique non pas seulement notre façon de travailler et d’avoir accès aux sources manuscrites, mais aussi la forme du résultat de notre recherche, c’est-à-dire, la forme du catalogue.

Tout d’abord, il est vrai que l’accessibilité aux manuscrits est une question qui se posait déjà bien avant l’apparition d’Internet. Étant des objets fragiles qui doivent être conservés et transmis aux générations futures, l’accès aux manuscrits en tant qu’objets est aujourd’hui restreint aux chercheurs qui ont besoin d’analyser son aspect matériel d’origine, voir codicologique, ou aux historiens d’art qui ont besoin d’observer avec précision les couleurs et les matériaux des enluminures sur leur support matériel. Pour tout autre enquête, et particulièrement pour les philologues, les historiens de la littérature, les linguistes, les philosophes, où il s’agit de s’occuper du contenu textuel des manuscrits plutôt que du support matériel, il faut travailler avec des microfilms ou avec des images numérisées.

Mais avant le numérique et avant toute préoccupation de conservation des manuscrits, la question de l’accessibilité était un des problèmes les plus importants à résoudre par le chercheur qui devait étudier un manuscrit, car celui-là pouvait être conservé dans une bibliothèque lointaine ou peu accessible. La photographie, et surtout l’invention des microfilms et microfiches, ont commencé à rendre plus facile l’accès aux textes médiévaux des manuscrits, et pendant des décennies les chercheurs ont commandé aux bibliothèques des copies de microfilms pour pouvoir travailler aisément dans leurs laboratoires ou leurs maisons et sans plus avoir besoin de se déplacer, parfois, à des milliers de kilomètres.

C’est grâce aux microfilms que dans les années cinquante a commencé une vaste entreprise menée par le Ministère de l’Éducation et de la Culture du gouvernement d’Israël. Avec le support indispensable du premier ministre à l’époque, David ben Gurion, l’Institut des manuscrits hébreux microfilmés a été créé à Jérusalem avec l’objectif précis de rassembler les copies microfilmées de tous les manuscrits hébreux conservés dans le monde. Dans les premières treize années de son existence, sous la direction de Nehemiah Allony (1950-1963), cet Institut a rassemblé plus de 15.000 microfilms. Ils sont arrivé à Jérusalem provenant des principales bibliothèques d’Europe et des États-Unis, et permettant ainsi aux chercheurs de pouvoir consulter en un seul endroit un même texte conservés dans plusieurs manuscrits issus de bibliothèques du monde entier.

Il est évident qu’au fur et à mesure que les manuscrits arrivaient à Jérusalem, le catalogue de l’Institut s’agrandissait, accumulant sur fiches de brèves descriptions bibliographiques. À partir de 1986, ce catalogue sur fiches a été progressivement numérisé et rendu accessible sur internet. À présent, il est intégré dans le catalogue général de la Bibliothèque nationale d’Israël, et permet aux utilisateurs du monde entier, ayant accès à internet, de consulter à partir d’un seul site, les descriptions bibliographiques des manuscrits hébreux microfilmés et numérisés de l’Institut, c’est-à-dire, de plus de 74.000 entrées.

Notice du Paris BNF Hébreu 20 dans ALEF

Notice du Paris BNF Hébreu 20 dans ALEF

Tout comme le catalogue de l’Institut des manuscrits hébreux microfilmés de Jérusalem, à partir des années quatre-vingt, les catalogues sur fiches de la plupart des bibliothèques européennes et d’ailleurs ont été numérisés et rendus accessibles sur internet. Or, la numérisation des catalogues sur fiches ne rend pas accessible par elle-même les collections de manuscrits des bibliothèques.  Même si des microfilms existent pour des collections entières, le déplacement demeure nécessaire à la bibliothèque qui abrite les manuscrits ou, dans le cas des manuscrits hébreux, à l’Institut de Jérusalem.

C’est à cause de ce problème d’accessibilité que la numérisation des collections de manuscrits a commencé à être la priorité des bibliothèques, les pionnières lançant des programmes de numérisation à partir des années quatre-vingt-dix, dans un processus qui se poursuit aujourd’hui. Nous tous connaissons l’expression de « bibliothèque virtuelle », qui est l’expression la plus commune pour désigner une collection numérisée, comme par exemple Gallica, la collection virtuelle de la Bibliothèque nationale de France. D’autres bibliothèques virtuelles existent et rendent leurs collections numérisées accessibles à n’importe qui avec un ordinateur connecté à internet.

De ce fait, à présent, le choc informatique, ainsi appelé par Muzerelle, et le choc internet ont été capables de produire des outils inimaginables il y a encore trente ans, à savoir : des bases de données et des catalogues en ligne qui nous permettent d’accumuler et de gérer une foule énorme de données, ainsi que les documents numérisés qui s’y rapportent et qui nous offrent des images de qualité, auxquelles des métadonnées peuvent être attachées. On a donc les outils nécessaires pour créer des catalogues de manuscrits numérisés en ligne. Par ce catalogue en ligne, les résultats de la recherche codicologique et de l’étude textuelle devraient être transformés en un véritable catalogue du futur, polyvalent, accessible à tous, et capable à la fois de sauvegarder les collections de manuscrits originaux tout en nous offrant en revanche l’accessibilité à leur équivalent en collections virtuelles que, peut-être un jour, nous serons capables de consulter en trois dimensions.

Cependant, ce type de catalogue est loin d’exister encore, et nous, en tant que chercheurs, devons rappeler que les questions scientifiques que nous nous posions lorsque nous envisagions un nouveau catalogue de manuscrits en papier doivent être les mêmes au moment où nous envisageons un catalogue numérique. Le format change, c’est vrai, et le numérique nous ouvre toutes les possibilités d’accessibilité et de polyvalence dans le traitement de l’information textuelle et graphique ; mais les questions méthodologiques et l’évaluation des résultats de la recherche restent toujours un enjeu dont nous –chercheurs – devons être responsables, et auquel les bibliothèques et les organismes qui se lancent dans des programmes de collections virtuelles et de catalogues en ligne devraient rester sensibles.

Aujourd’hui, on vit encore dans l’impact de l'apparition des manuscrits numérisés et de l’accessibilité (quasi magique) qu’ils offrent. Nous restons toujours stupéfiés par la possibilité de feuilleter des manuscrits sur écran et d’apprécier jusqu’à leurs moindres petits détails, et la plupart des bibliothèques investissent de grands efforts et moyens pour avoir leurs collections de manuscrits numérisées et disponibles en ligne. Or, le travail de catalogage, l’étude codicologique, textuelle et historique approfondies sont laissés de côté, soit parce qu’il existe déjà des catalogues en papier, soit parce que la priorité est la numérisation de l’image pour la mettre en ligne, c’est-à-dire, l’accessibilité virtuelle de l’objet. Quelques bibliothèques font des essais pour intégrer l’objet virtuel avec sa description, mais les résultats à cet égard sont encore très préliminaires.

Si le catalogue en papier est un livre organisé du début à la fin, dont les descriptions sont les résultats d’une approche théorique et une méthodologie précise, qui présente des contenus homogènes d’une façon linéale, et qui ne se publie pas tant qu’il n’est pas fini, révisé, amendé et approuvé, le catalogue numérisé ou mis en ligne n’arrive pas encore, actuellement, à représenter un outil définitif et pleinement satisfaisant pour le chercheur. Le manuscrit numérisé et sa description, s’il y en a une, sont hébergés normalement sur des sites internet qui abritent d’autres contenus très variés, où le texte est souvent subordonné à l’image. La linéarité du livre est substituée par une polyvalence où les recherches par mots clés ou par cote se substituent à une recherche guidée par l’ordre livresque et matériel du catalogue (avec un début, une fin). Cela est un avantage clair pour trouver des informations rapidement, mais il y a des effets secondaires. Le lecteur connecté, qui trouve la description en ligne d’un manuscrit parmi d’autres éléments visuels et d’autres informations, ne réussit pas à savoir si cette description fait partie d’un tout cohérent du point de vue méthodologique (par exemple, dans un ensemble concernant les manuscrits de tel ou tel type); il ne peut non plus s’apercevoir de la pertinence des données présentes dans la description, ni pourquoi ces données ont été choisies et non pas d’autres, car il n’y a pas presque jamais d’introduction méthodologique aux catalogues numériques…  Les textes des descriptions, enfin, sont très souvent des assemblages de textes incomplets ou provisoires, quand parfois ils ne sont pas qu’une simple transposition d’un texte déjà publié dans un catalogue en papier (sans toujours le dire clairement), et n’ajoutant – dans ce cas – aucun des avantages du numérique.

Certainement que ce qui se joue, c’est que chaque projet (ou étape) de numérisation poursuit un objectif différent (ou en tout cas pas toujours en cohérence avec l’étape précédente). Il est évident que numérisation et catalogage sont des enjeux différents, et que l’ajout de descriptions aux manuscrits virtuels, c’est-à-dire, la préparation d’un vrai catalogue numérisé, n’est pas une obligation mais un choix qui appelle des efforts combinés entre bibliothèques, chercheurs et informaticiens, des efforts beaucoup plus complexes et aussi plus coûteux à faire que la seule numérisation des objets avec des métadonnées basiques.

Voyons par exemple le projet Polonski Foundation Digitization Project de numérisation de manuscrits hébreux de la Bodleian Library et la Bibliotheca Apostolica Vaticana, un projet qui réunit les efforts des deux bibliothèques avec le patronage de la Fondation Polonsky. Dans ce projet de numérisation[1], seules des métadonnées et des références aux contenus sont ajoutées aux objets numérisés, et les descriptions détaillées, avec l’étude codicologique, textuelle et historique, font partie du catalogue en papier, qui reste ici comme l’outil de référence du chercheur. Le simple lecteur n’en est pas particulièrement informé. (Voir MS Kennicot 1).

Description du Ms. Kennicot 1 dans Digital Bodleian Library Oxford

Description du Ms. Kennicot 1 dans Digital Bodleian Library Oxford

Le cas des collections virtuelles de manuscrits hébreux de la Bibliothèque nationale de France et de la British Library est un peu différent. La collection de la BNF, par exemple, est intégré dans le web Gallica, qui abrite la numérisation de documents de tout type et en tout format : livres, manuscrits, cartes, images, journaux, enregistrements sonores, objets et vidéos. Les numérisations des manuscrits sont accompagnées ici de leurs descriptions, même si elles sont provisoires, incomplètes, ou simplement copiées du catalogue en papier plus récent. Or, ces descriptions et leurs métadonnées ne sont pas intégrées dans le catalogue général. Cela n’offre pas d’autres possibilités qu’une recherche générale du texte et la lecture de la description, comme s’il s’agissait d’une page en PDF. (Chercher « Hébreu 20 » dans les manuscrits et comparer avec « Hébreu 20 » décrit dans le catalogue papier récent Del Barco 2011, pp. 112-120).[2]

Manuscrit numérisé et description en ligne (i) sur Gallica du Ms. Hébreu 20.

Manuscrit numérisé et description en ligne (i) sur Gallica du Ms. Hébreu 20

En définitive, le projet de la British Library, sponsorisé par la Fondation Polonsky, offre avec la numérisation une description suffisante du manuscrit. Cette description n’est pas une transposition du texte du catalogue de Margoliouth, mais une nouvelle description qui essaye d’aborder des aspects matériels, textuels et ceux de l’historique des collections. Or, de même qu’on l’a vu pour les manuscrits numérisés de Gallica, ces descriptions ne sont pas intégrées au catalogue général de la British Library, même si elles ont été rédigées sous le format numérisé TEI-XML et que le téléchargement des métadonnées est possible. (voir par exemple le Add MS 26878).

Manuscrit British Library MS Add. 26878 (la description située en dessous des images à télécharger)

Manuscrit British Library MS Add. 26878 (la description située en dessous des images à télécharger)

Un autre exemple est celui de la collection virtuelle de manuscrits orientaux dans les bibliothèques du CSIC, le Centre Supérieur de la Recherche d’Espagne. Dans ce catalogue numérisé, les descriptions sont intégrées dans le système du catalogue général, comme dans le cas du catalogue de l’Institut de manuscrits hébreux microfilmés de Jérusalem. Outre les informations catalographiques basiques intégrées dans le catalogue général, chaque description comprend des données codicologiques et textuelles, et le téléchargement des métadonnées est aussi possible. (Chercher un mahzor)

Description d’un Mahzor dans la collection virtuelle de manuscrits orientaux du CSIC

Description d’un Mahzor dans la collection virtuelle de manuscrits orientaux du CSIC

L’intégration des notices dans un format normalisé et standardisé pour les bibliothèques nous pose la question sur le type de description et des données qui doivent être compris par le catalogue numérisé. Les exemples de la bibliothèque virtuelle du CSIC et de l’Institut de Jérusalem présentent une option dont les données sont intégrées dans les catalogues généraux, créant des liens de différent type avec le reste de la collection. Par contre, les numérisations de Gallica et de la British Library offrent des descriptions avec leur métadonnées attachées seulement à l’objet numérisé. Cela permet, certes, de compléter les descriptions avec beaucoup plus de détails, mais, en revanche, empêche d’intégrer la notice dans un catalogue numérisée plus large et, en conséquence, de prendre en compte les possibilités polyvalentes du numérique.

Très récemment, la Bibliothèque nationale d’Israël a lancé, avec le concours de la Friedberg Jewish Manuscript Society, la Collection internationale de manuscrits hébreux numérisés (The International Collection of Digitized Hebrew Manuscripts) surnommée KTIV. Ce site internet a pour but de réunir les numérisations de tous les manuscrits hébreux du monde en un seul endroit, suivant en cela l’esprit de l’Institut de manuscrits hébreux microfilmés de Jérusalem. Les manuscrits numérisés sont accompagnés de leurs descriptions, qui ont été importées directement du catalogue numérisé de l’Institut. Cela veut dire que les mêmes descriptions peuvent être consultées soit sur le catalogue numérisé de l’Institut, intégré dans le catalogue général de la Bibliothèque nationale d’Israël (via NLI/ALEF), soit sur le site de la collection virtuelle KTIV. Pour l’heure, les manuscrits numérisés disponibles sur ce site internet ne sont pas très nombreux car il prendra des années pour arriver à un accord avec chaque bibliothèque et intégrer leurs collections virtuelles à KTIV, et, surtout pour numériser les manuscrits dont il n’existe pas encore de format numérique. En ce qui concerne les descriptions dans KTIV, les données du catalogue numérisé de l’Institut doit être révisé et actualisé, car les erreurs sont nombreuses. Or, les descriptions dans le site de cette collection virtuelle KTIV présentent des opportunités et des avantages pour l’avenir. Un, les numérisations des manuscrits seront éventuellement accessibles dans un seul site internet ; deux, leurs descriptions sont intégrées dans un catalogue général, permettant l’interconnexion des données et les recherches secondaires à partir des hyperliens présents dans la notice ; trois, même si les données actuelles sont incomplètes et fautives, la structure graphique de la notice semble permettre l’intégration de données codicologiques, textuelles et historiques dans cet outil. (Ktiv - Paris BN 20).

Le manuscrit Paris BNF hébreu 20 dans KTIV

Le manuscrit Paris BNF hébreu 20 dans KTIV

Il est donc clair que les ressources technologiques sont à présent suffisantes pour entreprendre la construction d’un « véritable catalogue en ligne » qui soit vraiment conçu à partir du numérique, même si la technologie avance vite et que des changements seront fréquemment introduits. Malheureusement, notre époque est l’époque de l’immédiat, et les structures des ressources numériques sont souvent instantanément lancées en phase bêta ou même alpha (il y a sans doute là un mélange des genres avec les blogs ou les pages Facebook, Twitter), sans attendre d’avoir à proposer des contenus de qualité, relus et critiqués. Idéalement, ce sont ces contenus-là qui doivent remplir les notices des catalogues numériques. C’est donc à nous, chercheurs de manuscrits médiévaux, de remplir cet espace et de collaborer avec les bibliothèques et les informaticiens, pour assurer la crédibilité scientifique des résultats, de la même façon que nous faisons avec ce que nous publions en papier.

Le catalogue du futur sera donc numérique si les contenus proposés deviennent sujets aux mêmes normes de qualité que les contenus de nos publications en papier (méthode homogène et expliquée, relecture, comité éditorial). Sinon, les catalogues en papier continueront à être des ouvrages de référence pour tout chercheur ayant besoin d’étudier les manuscrits médiévaux, et les collections virtuelles de manuscrits ne seront que des outils numérisés pour accéder aux images. Avoir des images numérisés et accessibles est déjà au-delà de nos rêves, mais le potentiel technologique actuel pourrait nous permettre de développer des catalogues numériques beaucoup plus utiles et puissants.

***

Javier del Barco, 13 décembre 2016

  • Références :

J. del Barco, Manuscrits en caractères hébreux conservés dans les Bibliothèques de France: Catalogues, Paris-Turnhout: BNF, Institut de Recherche et d’Histoire des Textes (CNRS), Brepols, 2011.

G. Margoliouth, Catalogue of the Hebrew and Samaritan Manuscripts in the British Museum (now in the British Library), 3 Vol., [Seconde édition, 1965] (Londres, 1899).

D. Muzerelle, “Evolution et tendances actuelles de la recherche codicoligique”, Historia, Instituciones, Documentos 18, 1991, 347—374.

  • Liens aux sites mentionnés:

OXFORD Bod. Lib. / BAV Vaticana Library : Polonski Foundation Digitization Project

BRITISH LIBRARY Catalogue: http://www.bl.uk/manuscripts/Default.aspx

CSIC (Manuscrits orientaux): http://manuscripta.bibliotecas.csic.es/

GALLICA: http://gallica.bnf.fr/

KTIV: http://web.nli.org.il/sites/NLIS/en/ManuScript/

NLI Catalogue: http://aleph.nli.org.il/

SFARDATA: http://sfardata.nli.org.il/sfardatanew/home.aspx

  • Notes de bas de page:

[1]  Le site du Polonski Project renvoie aux manuscrits mis en ligne sur les sites de chaque bibliothèque, sur http://digital.bodleian.ox.ac.uk/ pour la Bodleian Library et sur  http://digi.vatlib.it/ pour la BAV.

[2] On notera toutefois que les descriptions de Gallica sont réorganisées dans le CCFr et comportent de la bibliographie. Notice du BNF 20 dans le CCFr.

***

Sur l'auteur : Javier del Barco est chercheur titulaire  au Consejo Superior de Investigaciones Científicas (CSIC) de Madrid. Il est l'auteur de plusieurs catalogues de manuscrits hébreux, et a publié des ouvrages sur la production et l'histoire des manuscrits hébreux médiévaux et prémodernes. Il a publié récemment The Late Medieval Hebrew Book in the Western Mediterranean: Hebrew Manuscripts and Incunabula in Context (Leiden, Boston: Brill, 2015).

Éditeur : Élodie Attia

Pour citer ce billet: https://mbh.hypotheses.org/423