Ce projet, porté par le service « Bibliothèque » et la plateforme « Banque d’images et données textuelles », a pour objet la dématérialisation (gestion, numérisation, documentation et mise en ligne) de documents patrimoniaux issus du don de la Bibliothèque Salomon Reinach, libres de droits, localisés à la bibliothèque de la MOM. Ces documents sont constitués d’extraits et de tirés-à-part de revues scientifiques internationales, de la fin du XIXe et du début du XXe siècle, reliés dans des volumes appelés du terme générique « tirés-à-part ».

Accès au corpus des tirés-à-part numérisés de Salomon Reinach.
http://www.tpsalomonreinach.mom.fr

Contexte

Le don de Madame Reinach à l’Université de Lyon (1937) a doté la Bibliothèque de la Maison de l’Orient et de la Méditerranée d’un important fonds d’étude sur l’antiquité classique comprenant de nombreux ouvrages (intégrés au catalogue de la bibliothèque de la MOM) et de volumes reliés de tirés-à-part, actuellement en cours de numérisation.

Salomon Reinach

Les frères Reinach (Joseph, Salomon et Théodore) représentent l’élite intellectuelle et politique de la fin du XIXe siècle. Salomon Reinach, deuxième de cette fratrie, est né en 1858 à Saint-Germain-en-Laye et mort en 1932 à Boulogne-sur-Seine.

Grand érudit de la charnière XIXe-XXe siècle, il s’intéressa aux nombreux domaines que couvrent la science, l’art, et l’histoire. Il fut professeur à l’école du Louvre, archéologue, historien des religions, philologue. Il fut également membre de l’Académie des Inscriptions et Belles-Lettres, et co-directeur de la Revue Archéologique.

Il séjourna trois années en Grèce, mena des fouilles en collaboration avec de nombreux archéologues de l’époque. Salomon Reinach ne cessa d’écrire, de publier des articles, des courriers scientifiques dans la « Gazette des Beaux-arts » ou encore le « Bulletin de correspondance hellénique ». Sa production intellectuelle fut grande : son œuvre recense près de 80 volumes et plus de 7000 articles.

Les tirés-à-parts de la bibliothèque Salomon Reinach

Le fonds des tirés-à-part de la bibliothèque S. Reinach (637 volumes reliés, soit plus de 6500 articles) présente une grande diversité quant au contenu. Ces publications internationales, écrites par des archéologues, des historiens, des épigraphistes et autres savants du XIXème siècle, adressées à Salomon Reinach, traitaient principalement d’archéologie et d’histoire ancienne mais aussi de littérature, d’éducation, de médecine, de droit législatif ou encore de politique. L’hétérogénéité de ce fonds témoigne d’une époque où la culture encyclopédique (scientifique, littéraire et politique) était encore la règle.

Ces tirés-à-part, sélectionnés et reliés par l’archéologue, sont également le reflet des relations personnelles qu’entretenait Salomon Reinach avec des savants du monde entier. Ils constituent, par ailleurs, une documentation très utile aujourd’hui pour qui travaillerait sur des problématiques liées à l’Antiquité classique car issue de revues internationales difficiles d’accès, dispersées voire oubliées. Cette documentation intéressera aussi ceux qui étudient l’histoire des sciences humaines, l’histoire des mentalités…

Objectifs

La numérisation des tirés-à-part Salomon Reinach c’est :

  • La signalisation des tirés-à-part, actuellement absents du catalogue informatisé de la bibliothèque.
  • La conservation : créer un support de substitution et permettre la consultation de documents fragiles, améliorer la conservation, disposer d'une qualité qui devrait satisfaire les utilisateurs et qui ne demande pas de faire appel à la consultation de l'original, sauf demande exceptionnelle.
  • La diffusion et consultation à distance : mise en ligne sur Internet pour toucher un public plus vaste et gagner du temps dans la recherche.
  • La valorisation de la bibliothèque, du fonds Salomon Reinach, de la collection de tirés-à-part mal connue.
  • Le public visé est : les spécialistes, les universitaires et les étudiants.

Méthodes

La chaine de dématérialisation c’est :
La préparation matérielle et documentation initiale

Cette étape consiste à décrire de façon fine (page à page) les fascicules à numériser. Elle devra en particulier permettre d’identifier tous les tirés-à-part constituant un fascicule et/ou d’identifier les pages nécessitant un traitement particulier. Cette étape est particulièrement sensible puisque les données qui en sont issues sont utilisées pour : piloter l’étape de numérisation / amorcer la gestion de la qualité / documenter les champs d’identification de l’article (Auteur / Titre / Date / etc…) afin de constituer la « table des matières virtuelle » du fascicule.

La production

L’étape de production couvre tous les traitements réalisés par la plateforme technologique, de la prise en charge des fascicules à numériser, dès que la documentation initiale est terminée, jusqu’à la mise à disposition des images numérisées sur le réseau Internet.

Numériser: ensemble des traitements permettant la mise à disposition des ressources numériques (images et textes associés) notamment traitements et amélioration d’image, contrôle qualité, cohérence et complétude des données numérisées, OCR.

Sauvegarder : préservation sur l’espace de stockage temporaire, des données courantes de traitement (bruts de scan + fichiers OCR). Ces données sont accessibles notamment par des robots assurant un retraitement des informations. Transfert, à l’issue du processus, de l’information vers un espace de stockage cumulatif pour l’opération en vue de son archivage ultérieur.

La validation éditoriale

Cette étape consiste à faire un bilan global et une analyse qualitative du travail de documentation et de production en vue de leur validation. Le responsable du corpus dispose d’un outil permettant de vérifier, corriger et valider les différents types d’information :

  • documentation des unités bibliographiques.
  • traitement des demandes de re-numérisation de pages éventuellement problématiques.

Lorsque chacun de ces aspects est entériné, une validation globale est accordée au traitement de chaque fascicule. Cette validation vaut « bon pour diffusion » sur le portail.

Diffusion Web & archivage

La mise en ligne est effective depuis le 26 octobre 2012; les travaux en cours concernent la diffusion par le protocole OAI pour le moissonnage et la plateforme d'archivage locale. Ultérieurement, une liaison avec le futur catalogue de la bibliothèque (Koha) de la bibliothèque de la MOM sera effectuée.

Matériel et moyens humains dédiés au projet

Matériel informatique utilisé dans l’opération : deux stations d’acquisition, 1 scanner Recto / Verso Futjitsu fi-6770, 1 scanner « patrimonial » OS 1400, 2 stations pour le traitement d’image et l’OCR, 1 NAS de production. Le matériel a été acquis sur les budgets de l’USR.

La première phase du projet a mobilisé une stagiaire qui, pendant un mois, a lancé la documentation des tirés-à-part. Un vacataire a été ensuite embauché pendant cinq mois (300 tirés-à-part/mois) pour finaliser la documentation du corpus des tirés-à-part sélectionnés, pour les numériser, effectuer les traitements d’images et l’OCR.

Une vacataire a récemment été recrutée pour poursuivre la documentation et la numérisation des recueils de tirés-à-part « moyen » format restants (environ 300) et commencer le traitement des « petits » formats.

Toute la partie technique (numérisation, traitements, validation technique) est pilotée par la plateforme « Banque d’images et données textuelles ». Les aspects documentaires (sélection et préparation du corpus, suivi de la documentation, validation éditoriale…) sont gérés par le service « Bibliothèque ».

Réalisation

Sur les 6500 tirés-à-part « S. Reinach » recensés, 1500 (54000 pages) ont été, pour l’instant, documentés, numérisés, traités, validés et mis en ligne. Les articles sont consultables au format « pdf » et librement téléchargeables et imprimables.

Ce qu’il reste à faire

Les recueils de tirés-à-part « S. Reinach » qui restent à traiter, environ 500 (près de 5000 articles), sont de petits formats et par conséquent difficilement manipulables et numérisables en l’état. Nous ne sommes pas, pour l’instant, équipés d’un périphérique capable de traiter ce type de documents qui assurerait un rendement compatible avec une numérisation quantitativement satisfaisante.

Par ailleurs, des améliorations seront entreprises au niveau de l’interface de recherche afin de le rendre notamment plus ergonomique et plus performant. Un accès aux articles par thèmes est aussi envisagé.

Contacts

Patrick Desfarges & Franck Capisano

Accès au corpus des tirés-à-part numérisés de Salomon Reinach.
http://www.tpsalomonreinach.mom.fr

Liste complète des articles numérisés


Merci à ceux qui ont participé et qui participent à ce projet :
Véronique Lacroix, Maryam Zahmoul, Aline Langlois, Gaspard Vernay, Rachelle Moutamalle, Wei Huangfu.