Le Sigb de demain sera dans les nuages

NuagesJacques Kergomard vient de publier un autre article très intéressant dans lequel il prône tout simplement la disparition des catalogues locaux. (voir aussi chez Hubert) Je partage complètement ce point de vue !

Toute la lourdeur vient de la nécessité de recopier en local une partie du catalogue maître, un peu comme si votre navigateur Internet avait besoin de recopier et tenu à jour sur le disque dur de votre ordinateur l’intégralité des sites qui vous intéressent, pour pouvoir vous afficher une page. Votre navigateur se contente d’aller chercher sur le serveur du site une page pour vous l’afficher au moment où vous voulez la consulter, garantie que celle-ci est toujours à jour.

Pour les notices du catalogue de référence, on pourrait imaginer un fonctionnement similaire : le SIGB irait chercher, chaque fois que nécessaire, la notice sur le serveur de la base de référence. On se contenterait alors localement d’un pointeur vers la notice de la base maître, complété par des données locales. Pour un affichage ou une indexation, le SIGB inclurait dans une même notice les parties distantes et locales.

Ce mécanisme permettrait de s’affranchir complètement du problème de synchronisation des bases et de toutes les tâches qui en découlent.

(…)

Avec une telle architecture, la bibliothèque s’affranchit totalement des tâches de catalogage, supprime la partie bibliographique et autorité de son catalogue et la base d’indexation correspondante. Elle bénéficie également de la puissance du moteur de recherche de systèmes spécialisés qui sont souvent (pas toujours) plus puissant que celui d’un SIGB local.

Certains verront dans une telle solution le retour de la tentation d’un SIGB centralisé et hégémonique. Comme pour Internet, c’est exactement l’inverse : il s’agit d’un système décentralisé sans redondance d’informations et avec répartition des compétences Chaque site conserve en local les données et le fonctionnement qui lui sont propres et il utilise les ressources extérieures correspondant à des compétences qu’il ne possède pas ou ne veut pas assumer.

Et de pointer le principal obstacle, qui n’est pas technique, mais bien psychologique :

Mais cela suppose surtout une évolution des mentalités : accepter de déléguer le travail de catalogage a été une tâche longue et difficile. Ne plus avoir son catalogue, son moteur de recherche et sa base d’indexation risque d’en perturber plus d’un.

Ajoutons à cela la très juste remarque de Remi Mathis, commentant le rapport Tessier en appuyant la nécessaire…

…acceptation que l’expertise sur les documents se trouve plus chez les milliers de lecteurs que chez les quelques bibliothécaires et, partant, la nécessité de permettre aux premiers d’enrichir description et organisation des documents.

Coïncidence des dates : le même jour, l’ABES publie sur son blog les chiffres du Sudoc :

Le catalogue Sudoc poursuit sa croissance. Au cours de l’année 2009 il a dépassé le seuil des 9 000 000 de notices localisées et  s’est accru de 539 112  notices supplémentaires par rapport à 2008 soit 6,1% d’augmentation. Notons que 3 110 593 ont été créées entre décembre 2005 et décembre 2009.

On y apprend, avec soulagement, que l’ABES permet à nouveau aux moteurs de recherche d’indexer sa base, ce qui n’était pas le cas en 2008 (ça ressemble à une grosse grosse boulette ça !)

La baisse du nombre des recherches enregistrée en 2009 est vraisemblablement dû  à la non indexation, en 2008, du catalogue par les robots. Cette non-indexation du catalogue à permis d’ améliorer les temps de réponse qui à l’époque n’étaient pas bons. L’ABES a  réactivé cette fonctionnalité début novembre 2009. Malgré cette manœuvre  cet item connaît une courbe de croissance de plus de 65% depuis 2005.

Nombre de recherches ayant débouché sur un résultat dans le Sudoc via internet :

Là j’ai envie de dire OUF ! C’est évidemment une très bonne chose qu’un énorme catalogue comme le Sudoc puisse être indexé et consulté depuis des moteurs de recherche, les statistiques ci-dessus montrent que c’est de plus en plus souvent le cas.

Autrement dit, pour rebondir sur l’article proposé par Dominique Lahary ce n’est pas la bibliothèque qui est dans les nuages, mais bien ses données, le bibliothécaire dans ce schéma devient non pas seulement celui qui décrit la nature des ressources et crée des bases de données, mais celui se concentre aux côtés de communautés d’usagers sur la recommandation et la médiation en local, pour alimenter une base globale. Ce qu’on appelle une « bibliothèque numérique » est bel et bien une manière de désigner conjointement trois cercles tels qu’il sont proposés par Dominique Lahary :

  • Le premier cercle, qui englobe tout, est le web dans son ensemble. Il constitue la bibliothèque globale, même si c’est aussi bien d’autres choses.
  • Le second est l’ensemble des « bibliothèques dans les nuages ».
  • Le troisième est constitué par les bibliothèques locales, lieux physiques.

Les bibliothèques et le numériques ? De quelles bibliothèques, de quelle bibliothèque parlez-vous ? Si vous ne voyez qu’un des trois cercles, vous ne voyez pas le tout.

Le principale défi étant d’articuler ces cercles entre eux et de faire coïncider au moins deux des trois web repérés par Nicolas Vanbremeersch :

Les-trois-web
(195)

This work, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-ShareAlike 3.0 France License.

Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

2 Responses

  1. B. Majour dit :

    <p>
    Salutations
    </p>
     
    <p>Sur le principe, le partage d’un catalogue « unique », où tout le monde mettrait ses liens, ses annotations, etc.  ne pourrait être que superbe.
    </p>
     
     
    <p>Maintenant, dans la réalité physique du Web, avec les coupures de service, voire une panne d’Internet, le principe de l’unicité de la base informatique me paraît sujette à caution. Et je crains que la lourdeur (que tu invoques) ne soit un principe informatique nécessaire.
    </p>
     
     
    <p>Le Web fonctionne de cette manière : par la redondance de l’information et des serveurs.
    Avec de la copie locale quand on veut des temps d’accès raisonnables.
    </p>
     
    <p>Une seule base de données et toutes les bibliothèques de France qui se connectent dessus = Europeana dans ses débuts… Gloup ! Gloup ! Gloup !
    </p>
     
    <p> Les temps d’accès raisonnables, tu les retrouves ici :
    <em>Cette non-indexation du catalogue a permis d’ améliorer les temps de réponse qui à l’époque n’étaient pas bons. </em>
    Des temps d’accès importants = un mauvais service = aucune raison d’utiliser un mauvais service… </p>

    <p>
    C’est ce que donnerait une base de données trop centralisée.
    Surtout si des dizaines de bots, tels des pucerons ou des tiques, viennent la pomper-scanner en permanence, pour fouiller ses pages.
    </p>

    </p>
    Ce qui manque, effectivement, c’est bien une zone centralisée, où tout le monde pourrait échanger, récupérer en local (en attendant le Net indestructible) et aussi chez soi pour prendre le temps d’explorer, de travailler, de remuer cette pâte de données.
    </p>

    <p>
    Aux bibliothécaires de l’organiser, de la centraliser, de la rendre exploitable (digestible ou digeste).
    </p>
     
    <p>
    Jkergomard propose Dracula pour le nom de la base.
    Dracula, je ne sais pas… L’animal vampire vit pour lui-même, à son seul profit.
    </p>
     
    <p>
    Je préfère
    Bouton d’or : Bibliothèque OUverte à TOus Naturellement D’ORigine. ;-)
    </p>
     
    <p>
    Bien cordialement
    B. Majour
    </p>

  2. Bouton d’or ou dracula, décidément les bibliothécaires ont de l’imagination !!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>