Quand un informaticien de 25 ans invente un SUDOC des bibliothèques publiques…

J’ai reçu la semaine dernière un courriel très intéressant, de M. Damiano ALBANI, ingénieur informaticien de 25 ans (damiano.albani[at]gmail.com) :

Informaticien de formation, « bidouilleur dans l’âme », j’apprécie particulièrement travailler sur les mashups. Je m’intéresse également à la problématique de la disponibilité des données publiques (géographiques, transports, statistiques, etc). À part ça, je suis développeur freelance « polyvalent », donc si ça intéresse quelque employeur… 🙂

Je vous laisse lire ses mots à lui, qui me sont adressés mais qu’il m’a autorisé à publier, j’ajoute mes commentaires en me « didascalisant »  [en bleu et entre crochets] :

Cela fait un petit moment que je suis votre blog, depuis que je m’intéresse au domaine des bibliothèques. [Voilà qui commence bien ! 🙂 ]. Je travaille actuellement sur un petit projet perso qui me vient d’un ressenti en tant qu’usager de bibliothèques : la majorité des OPAC sont très peu agréables à utiliser. La présentation est souvent des plus frustes et il faut savoir ce qu’on cherche, pas facile de « butiner ». Je reconnais que les nouveaux SIGB ont des OPAC à la façon « Web 2.0 » qui corrigent la plupart de ces problèmes mais cela reste rare. [double approbation , le « à la façon web 2.0 » étant bien souvent une mise à jour commerciale pour bibliothécaire avide de 2.0]

En attendant, il y a des interfaces Web que l’on pourrait d’une certaine façon considérer comme des OPAC : les sites de ventes sur Internet, tels que Amazon ou Alapage !! On y trouve une interface de navigation agréable, bien pensée et souvent avec des métadonnées à foison (commentaires, évaluations, etc).

[bon là on est d’accord, cher M. Damiano, on le sait bien. Mais attendez, bande de bibliothécaires ça devient très intéressant quand le monsieur décide de passer à l’acte 🙂 ]

J’ai donc eu « l’idée » de vouloir utiliser ces pseudo-OPAC mais en y montrant le catalogue des bibliothèques près de chez moi. D’ailleurs, de par le découpage administratif en France, chaque commune gère son propre réseau de bibliothèques municipales. Quand on habite dans une grosse agglomération, rechercher un ouvrage voudrait dire faire cette recherche dans chaque OPAC ! Bref, mon projet consiste à proposer un service de recherche fédérée, pour les bibliothèques de tout type (municipales, universitaires, associatives…) proches de chez moi. [bon il existe des catalogues fédérés pour les communautés d’agglo, quelques catalogues régionaux, mais c’est bien connu, l’usager est sans frontières, comme les médecins…et tant mieux.]

J’ai créé un site qui s’appelle http://bibli.othequ.es sur lequel on peut faire ce genre de recherche. Cela reste un prototype, très incomplet mais il est fonctionnel :


Le vrai intérêt vient du compagnon à ce site : un userscript à installer dans GreaseMonkey [j’ajoute un lien pour les non initié au monde merveilleux de Greasemonkey] sous Firefox. Il interroge mon service de recherche fédérée et incruste les résultats sur les pages des sites Web tels que Amazon.fr, Alapage.com, Chapitre.com ou Fnac.com. Et la boucle est bouclée 🙂 . Comme je sais que vous êtes « à l’écoute » des initiatives dans le domaine des bibliothèques, qu’est-ce que vous en dites ? [ah ben je dis clap clap clap et bravo, magnifique idée ! (et… pourquoi bordel de Dewey qu’on est pas capable de faire ça nous-mêmes ?!). J’ajoute que ce type de dissémination de la bibliothèque existe depuis quelques années, j’en avais parlé dans ce billet, voir aussi ce projet : Library lookup qui propose des bookmarklet, ce qui, soit dit en passant est encore plus simple à utiliser qu’un script greasemonkey…]

Informaticien de formation, je n’ai aucune prétention avec cette idée, mais comme j’aime bien « bidouiller », je me suis lancé dans ce projet ! [ben c’est quand même un super résultat, encore bravo, à bon entendeur, le Monsieur cherche du travail !]

A ma question envoyée par mail, en constatant l’aspect clairsemé de la répartition géographique des bibliothèques dans lequel ce catalogue fédéré « maison » va chercher… Quels sont les critères techniques qui pour sélectionner telle ou telle bibliothèque pour cette recherche fédérée ?

En fait, le problème, c’est que je ne suis pas très « confiant » par rapport à ma méthode d’interrogation des catalogues. Au risque de vous étonner, j’interroge les serveurs Z39.50 de ces bibliothèques (+ SUDOC). Elles ne sont pas nombreuses les bibliothèques qui « exposent » ce service à l’extérieur mais j’en ai trouvées quelques unes, par « essai et erreur ». [oui, comme l’avait précisé Paul Poulain en commentaire de mon billet pour qu’un catalogue de bibliothèque soit accessible de l’extérieur : « le site extérieur DOIT proposer une API (interface d’accès) qui permette ce genre d’interrogation. Du genre  » rel= »nofollow »>mon-catalogue….« ]

Loin de moi l’idée de vouloir « m’introduire » dans leurs systèmes mais les OPAC sont vraiment inutilisables pour récupérer de l’information et effectuer des requêtes (critère de recherche ISBN manquant la plupart des fois d’ailleurs…) [Pfff on est vraiment des nullos quand même, si on demande à nos prestataires, a minima d’activer une recherche experte par ISBN , il y aurait pas ce genre de problème débile, (mais j’anticipe sur la suite)!]

Certains SIGB retournent également des données UNIMARC mais en HTTP (!). Très peu implémentent également le profil 995 en UNIMARC, qui donne l’état des emprunts notamment.

J’ai donc une petite architecture basée autour du protocole Z39.50 et j’utilise notamment le logiciel yazproxy [J’ajoute le lien, il s’agit d’un logiciel sous licence GPL spécialisé dans la recherche fédérée] pour « canaliser » les connections vers les serveurs Z39.50 des bibliothèques. Si seulement on pouvait avoir un service de recherche au niveau national, comme le SUDOC mais pour les bibliothèques municipales. Mais je sais que je « rêve » là 🙂 [j’aime bien les rêveurs professionnels, je fais partie de l’espèce, aussi.]

Bon que retenir de cette expérience ? D’abord qu’elle existe, alors courrez voir si votre bibliothèque fait partie des heureux qui peuvent participer d’ores et déjà à cet embryon de SUDOC de la lecture publique !

En réalité ce travail apporte une réponse chiffrée à la question de savoir quelles sont les bibliothèques dont la base de donnée est, techniquement, en 2009, interrogeable depuis l’extérieur du réseau de la collectivité. A ma question d’avoir accès à une liste des bibliothèques accessibles :

Je n’ai pas de liste « présentable » à vous fournir immédiatement mais en allant sur http://bibli.othequ.es/sets » vous pourrez voir une liste brute en XML. Celle qui est utilisée par mon application en fait. Actuellement il y a environ 80 bibliothèques dans cette liste — ou plutôt les bibliothèques de 80 communes, car c’est ainsi que je les range pour le moment. Mais c’est loin d’être une liste exhaustive. Encore aujourd’hui j’en ai rajouté une dizaine et il m’en reste « sur le feu » 🙂 Et je n’ai même pas encore importé les bibliothèques universitaires par exemple. Vous posiez la question : « quelles bibliothèques sont accessibles depuis l’extérieur ? » En fait, ça revient bien souvent à savoir quel SIGB est mis en place. Avec par exemple du MoCCAM, Carthame, Koha et éventuellement Aloès, on s’en sort pour pouvoir interroger « proprement » le catalogue. Avec les autres SIGB (antédiluviens), c’est une autre paire de manche… Mon « problème » vient du fait que j’ai besoin de faire une recherche par ISBN — qui parfois même n’est pas « parfait » — et il semble que les fournisseurs de SIGB aient complètement oublié ce critère de recherche 🙂 Bref, seul du Z39.50 ou SRU/SRW ou approchant (ex: dump UNIMARC par l’OPAC) permet de travailler proprement. Le reste c’est pas très fiable, même si j’ai réussi à me débrouiller avec généralement.

D’après ce travail il n’y a donc qu’environ 80 bibliothèques municipales sur 3 000 pour la plupart dans des petites villes (ah l’absence quasi systématique des grandes villes, ça fait mal quand même !) qui ont un catalogue accessible depuis l’extérieur. A bon entendeur.

Quitter la version mobile