Quand un informaticien de 25 ans invente un SUDOC des bibliothèques publiques…
J’ai reçu la semaine dernière un courriel très intéressant, de M. Damiano ALBANI, ingénieur informaticien de 25 ans (damiano.albani[at]gmail.com) :
Informaticien de formation, « bidouilleur dans l’âme », j’apprécie particulièrement travailler sur les mashups. Je m’intéresse également à la problématique de la disponibilité des données publiques (géographiques, transports, statistiques, etc). À part ça, je suis développeur freelance « polyvalent », donc si ça intéresse quelque employeur… 🙂
Je vous laisse lire ses mots à lui, qui me sont adressés mais qu’il m’a autorisé à publier, j’ajoute mes commentaires en me « didascalisant » [en bleu et entre crochets] :
Cela fait un petit moment que je suis votre blog, depuis que je m’intéresse au domaine des bibliothèques. [Voilà qui commence bien ! 🙂 ]. Je travaille actuellement sur un petit projet perso qui me vient d’un ressenti en tant qu’usager de bibliothèques : la majorité des OPAC sont très peu agréables à utiliser. La présentation est souvent des plus frustes et il faut savoir ce qu’on cherche, pas facile de « butiner ». Je reconnais que les nouveaux SIGB ont des OPAC à la façon « Web 2.0 » qui corrigent la plupart de ces problèmes mais cela reste rare. [double approbation , le « à la façon web 2.0 » étant bien souvent une mise à jour commerciale pour bibliothécaire avide de 2.0]
En attendant, il y a des interfaces Web que l’on pourrait d’une certaine façon considérer comme des OPAC : les sites de ventes sur Internet, tels que Amazon ou Alapage !! On y trouve une interface de navigation agréable, bien pensée et souvent avec des métadonnées à foison (commentaires, évaluations, etc).
[bon là on est d’accord, cher M. Damiano, on le sait bien. Mais attendez, bande de bibliothécaires ça devient très intéressant quand le monsieur décide de passer à l’acte 🙂 ]
J’ai donc eu « l’idée » de vouloir utiliser ces pseudo-OPAC mais en y montrant le catalogue des bibliothèques près de chez moi. D’ailleurs, de par le découpage administratif en France, chaque commune gère son propre réseau de bibliothèques municipales. Quand on habite dans une grosse agglomération, rechercher un ouvrage voudrait dire faire cette recherche dans chaque OPAC ! Bref, mon projet consiste à proposer un service de recherche fédérée, pour les bibliothèques de tout type (municipales, universitaires, associatives…) proches de chez moi. [bon il existe des catalogues fédérés pour les communautés d’agglo, quelques catalogues régionaux, mais c’est bien connu, l’usager est sans frontières, comme les médecins…et tant mieux.]
J’ai créé un site qui s’appelle http://bibli.othequ.es sur lequel on peut faire ce genre de recherche. Cela reste un prototype, très incomplet mais il est fonctionnel :
Le vrai intérêt vient du compagnon à ce site : un userscript à installer dans GreaseMonkey [j’ajoute un lien pour les non initié au monde merveilleux de Greasemonkey] sous Firefox. Il interroge mon service de recherche fédérée et incruste les résultats sur les pages des sites Web tels que Amazon.fr, Alapage.com, Chapitre.com ou Fnac.com. Et la boucle est bouclée 🙂 . Comme je sais que vous êtes « à l’écoute » des initiatives dans le domaine des bibliothèques, qu’est-ce que vous en dites ? [ah ben je dis clap clap clap et bravo, magnifique idée ! (et… pourquoi bordel de Dewey qu’on est pas capable de faire ça nous-mêmes ?!). J’ajoute que ce type de dissémination de la bibliothèque existe depuis quelques années, j’en avais parlé dans ce billet, voir aussi ce projet : Library lookup qui propose des bookmarklet, ce qui, soit dit en passant est encore plus simple à utiliser qu’un script greasemonkey…]
Informaticien de formation, je n’ai aucune prétention avec cette idée, mais comme j’aime bien « bidouiller », je me suis lancé dans ce projet ! [ben c’est quand même un super résultat, encore bravo, à bon entendeur, le Monsieur cherche du travail !]
A ma question envoyée par mail, en constatant l’aspect clairsemé de la répartition géographique des bibliothèques dans lequel ce catalogue fédéré « maison » va chercher… Quels sont les critères techniques qui pour sélectionner telle ou telle bibliothèque pour cette recherche fédérée ?
En fait, le problème, c’est que je ne suis pas très « confiant » par rapport à ma méthode d’interrogation des catalogues. Au risque de vous étonner, j’interroge les serveurs Z39.50 de ces bibliothèques (+ SUDOC). Elles ne sont pas nombreuses les bibliothèques qui « exposent » ce service à l’extérieur mais j’en ai trouvées quelques unes, par « essai et erreur ». [oui, comme l’avait précisé Paul Poulain en commentaire de mon billet pour qu’un catalogue de bibliothèque soit accessible de l’extérieur : « le site extérieur DOIT proposer une API (interface d’accès) qui permette ce genre d’interrogation. Du genre » rel= »nofollow »>mon-catalogue….« ]
Loin de moi l’idée de vouloir « m’introduire » dans leurs systèmes mais les OPAC sont vraiment inutilisables pour récupérer de l’information et effectuer des requêtes (critère de recherche ISBN manquant la plupart des fois d’ailleurs…) [Pfff on est vraiment des nullos quand même, si on demande à nos prestataires, a minima d’activer une recherche experte par ISBN , il y aurait pas ce genre de problème débile, (mais j’anticipe sur la suite)!]
Certains SIGB retournent également des données UNIMARC mais en HTTP (!). Très peu implémentent également le profil 995 en UNIMARC, qui donne l’état des emprunts notamment.
J’ai donc une petite architecture basée autour du protocole Z39.50 et j’utilise notamment le logiciel yazproxy [J’ajoute le lien, il s’agit d’un logiciel sous licence GPL spécialisé dans la recherche fédérée] pour « canaliser » les connections vers les serveurs Z39.50 des bibliothèques. Si seulement on pouvait avoir un service de recherche au niveau national, comme le SUDOC mais pour les bibliothèques municipales. Mais je sais que je « rêve » là 🙂 [j’aime bien les rêveurs professionnels, je fais partie de l’espèce, aussi.]
Bon que retenir de cette expérience ? D’abord qu’elle existe, alors courrez voir si votre bibliothèque fait partie des heureux qui peuvent participer d’ores et déjà à cet embryon de SUDOC de la lecture publique !
En réalité ce travail apporte une réponse chiffrée à la question de savoir quelles sont les bibliothèques dont la base de donnée est, techniquement, en 2009, interrogeable depuis l’extérieur du réseau de la collectivité. A ma question d’avoir accès à une liste des bibliothèques accessibles :
Je n’ai pas de liste « présentable » à vous fournir immédiatement mais en allant sur http://bibli.othequ.es/sets » vous pourrez voir une liste brute en XML. Celle qui est utilisée par mon application en fait. Actuellement il y a environ 80 bibliothèques dans cette liste — ou plutôt les bibliothèques de 80 communes, car c’est ainsi que je les range pour le moment. Mais c’est loin d’être une liste exhaustive. Encore aujourd’hui j’en ai rajouté une dizaine et il m’en reste « sur le feu » 🙂 Et je n’ai même pas encore importé les bibliothèques universitaires par exemple. Vous posiez la question : « quelles bibliothèques sont accessibles depuis l’extérieur ? » En fait, ça revient bien souvent à savoir quel SIGB est mis en place. Avec par exemple du MoCCAM, Carthame, Koha et éventuellement Aloès, on s’en sort pour pouvoir interroger « proprement » le catalogue. Avec les autres SIGB (antédiluviens), c’est une autre paire de manche… Mon « problème » vient du fait que j’ai besoin de faire une recherche par ISBN — qui parfois même n’est pas « parfait » — et il semble que les fournisseurs de SIGB aient complètement oublié ce critère de recherche 🙂 Bref, seul du Z39.50 ou SRU/SRW ou approchant (ex: dump UNIMARC par l’OPAC) permet de travailler proprement. Le reste c’est pas très fiable, même si j’ai réussi à me débrouiller avec généralement.
D’après ce travail il n’y a donc qu’environ 80 bibliothèques municipales sur 3 000 pour la plupart dans des petites villes (ah l’absence quasi systématique des grandes villes, ça fait mal quand même !) qui ont un catalogue accessible depuis l’extérieur. A bon entendeur.
Même si je suis bluffé par le résultat, en terme d'ergonomie comme de service, je n'arrive pas à concevoir une situation où ce site rende complètement service : tant qu'on est limité à la recherche par ISBN exclusivement (et je suppose que c'est une contrainte technique, structurelle, et non un choix de paramétrage du formulaire), cela force le lecteur (de lecture publique, donc) à chercher d'abord la notice dans un autre catalogue, pour y trouver l'ISBN, et ensuite revenir sur le site http://bibli.othequ.es.
En outre l'affichage n'indique que "Disponible" / "Non disponible", et ne précise pas dans ce dernier cas si l'ouvrage est emprunté, ou n'est pas en rayon.
Enfin une fois qu'on a repéré que l'ouvrage était disponible quelque part, la cote n'est pas récupérée, je suis obligé de relancer une recherche dans le catalogue de la bibliothèque qui m'intéresse — et aucun lien depuis http://bibli.othequ.es vers ce catalogue n'est fourni.
Donc il faut retourner sur Google, refaire une recherche du site de la bibliothèque, et ensuite faire une recherche dans le catalogue.
Bref, il y a une présentation d'une ergonomie remarquable (l'affichage cartographique est génial de simplicité pour se constituer "son" Z39.50), et des services qui manquent encore pour en faire déjà la publicité : ça me paraît prématuré en l'état.
Sinon, tu t'adresses dans une didascalie à un M. Damasio : tu voulais dire "Damiano" ? ou bien c'est quelqu'un d'autre ?
ca ne parait pas impossible à faire, ni prématuré….
imaginons cet outil sur moccam où toutes les notices sont cherchables par titre et par auteur.
Le bidouilleur, comme il se présente, n'a pas indexé toutes les notices de ces 80 bibluiothèques, ca ne veut pas dire que ca n'est pas faisable… au contraire, c'est juste un début, et quel début !!
@ Lully : Oups, coquille corrigée, merci !
@Lully
Je pense que le M. Damiano a une autre démarche que celle que nous avons actuellement. D'habitude je cherche un livre de tel auteur ou sur tel sujet etc.
M. Damiano propose une autre attitude. Je vais sur des sites internet repérer des ouvrages (par auteur, titre, intérêt et en lisant les critiques) et ensuite je regarde s'il est dans ma bibliothèque. Cette démarche est à rapprocher du plugin libx. Je trouve une référence intéressante et je regarde s'il est dans ma bib.
Par contre je suis d'accord qu'il gagnerait en richesse avec d'autres critères de recherche
Donc le site lui-même n'a d'intérêt que pour sélectionner ses bibliothèques, pas comme interface de recherche.
J'en conclus sereinement que c'est le titre du billet qui m'a induit en erreur 🙂 : je cherchais un Sudoc (un opac personnalisable), alors que la page d'accueil du site dit bien : "naviguez sur Internet" !
Donc la fonction de recherche du site devrait être plus discrète, et il faudrait pouvoir rebondir depuis Alapage.com ou Amazon vers le site de la bibliothèque.
J'ai une question : quand un script Greasemonkey est mis à jour (nouvelle interface paramétrée, par exemple), la màj est proposée automatiquement au lancement du navigateur ?
Oui, pour sélectionner la bib près de chez moi dans laquelle je peux trouver le livre qui m'intéresse.
Mais n'est-ce pas aussi une des principales (si ce n'est la principale) utilité du sudoc?
Par rapport au critère de recherche sur le site Web, uniquement par l'ISBN, c'est "normal". Le site bibli.othequ.es lui-même n'a pas pour vocation de devenir un OPAC ou quelque chose d'approchant. Qu'il y ait la possibilité d'y faire une recherche "manuelle" par ISBN est "un effet de bord", une interface de test si vous préférez 🙂
Mon but est d'aider à "montrer" le contenu des catalogues des bibliothèques quand on navigue sur le Web de façon générale, via le plugin. Pour le moment, cela n'apparait que sur ces quelques sites de vente en ligne car l'information y est bien structurée (notamment présence de l'ISBN). Mais l'idée est de montrer cette information de disponibilité sur tous les pages du Web qui font référence à un ouvrage.
Maintenant, il est clair que des choix/contraintes techniques ont un impact : en clair, l'ISBN me semble la seule information permettant d'identifier un ouvrage et donc de pouvoir faire une recherche "fiable".
Ensuite, à propos de l'affichage assez pauvre "disponible / non disponible", on est d'accord 🙂
Pour ma défense, je dirais que très peu de SIGB, en Z39.50, retourne d'informations "recommandation 995". Difficile de l'inventer dans ce cas…
Ensuite, a été évoqué le manque de lien vers le catalogue de la bibliothèque elle-même, pour connaitre la cote, etc. Là encore, quels SIGB permettent de faire un lien vers une notice ? Pas tous. Et encore faudrait connaitre le n° de la notice, qui n'apparait pas dans l'UNIMARC si je ne me trompes pas.
L'autre solution serait de rediriger vers la page du catalogue montrant le résultat de recherche pour l'ISBN en question. Or le critère ISBN est absent de la quasi totalité des OPAC, donc impossible de proposer un tel lien…
(Pour le SUDOC ça pourrait néanmoins marcher en effet)
Bref, je suis un peu limité par ce permet la technique…
Et puis, c'est écrit sur mon site, c'est un service en version "bêta", il y a largement de la marge pour de l'amélioration 🙂
Pour la recherche par ISBN, j'ignorais qu'elle était si peu courante sur les Opac : il est vrai que j'utilise surtout des Opac de SCD, où cette fonctionnalité se trouve généralement.
En fait, je pense vraiment que le titre du billet présentant une sorte de complément au Sudoc est réellement trompeur puisqu'on ne comprend plus la philosophie du projet.
Il me semble enfin qu'un lien simple vers le site de la bibliothèque ou la page du catalogue serait déjà considérable : en effet pour un roman trouvé sur Amazon, et indiqué comme disponible dans une médiathèque donnée, l'internaute va sans doute avoir plus besoin des heures d'ouvertures que de la cote (qui ne lui apprendra rien).
Sur "indisponible", n'est-il vraiment pas possible de distinguer entre les catalogues qui répondent que l'ouvrage est prêté et celles qui disent qu'elles ne l'ont pas ?
Attention à la notion de "beta" : elle n'a pas la même signification pour Google Scholar et pour la dernière version de Firefox. Je crains que les internautes ne conçoivent plus le "beta" comme étant un produit réellement en cours de développement !
Mais j'insiste : c'est déjà un outil remarquablement conçu.
Sympa cette expérience, avec un peu de pédagogie autour de greasemonkey ça peut devenir très intéressant !
Partant du même constat que l'interface qu'on me proposait ne me convenait pas (trouver la bibliothèque la plus proche de chez moi qui possède un bouquin dans les bibliothèques parisiennes), j'ai commencé un petit mashup de mon côté, compliqué par les problèmes d'accès aux données (nécessité de faire du screen scraping pour récupérer les informations …)
Une petite capture d'écran de ce que ça peut donner : http://tinyurl.com/c72uhn plus d'infos avec une url quand ce sera plus fonctionnel.
@Lully : le projet se présente comme un "projet de recherche géographique fédérée.". J'ai considéré que la recherche fédérée était assimilable au Sudoc, qui a pour fonction de fédérer puis de localiser pour accéder à la ressource. La vraie valeur ajoutée ici réside dans l'approche par dissémination sur les sites à forts trafics, qui est très intéressante et par le fait que le projet s'intéresse aux bibliothèques publiques.
Oui mais justement : la dissémination est (légitimement) le seul objectif de l'outil (du moins tel qu'il existe actuellement).
Ce n'est VRAIMENT pas le cas du Sudoc !
Mais n'épiloguons pas sur la terminologie : l'essentiel était de faire connaître l'outil + de proposer une autre approche dans l'accès et la valorisation de nos collections.
Intéressant : je n'y avais pas pensé suite à la lecture de ton billet cité concernant greasmonkey, mais savoir sur une page amazon, ou autre, quels sont les ouvrages déjà dans une bibliothèque, la notre par exemple (bibli.ec-lyon.fr), peut nous faire gagner un peu de temps en tant…qu'acquéreur (et oui, désolé de proposer une commentaire orienté métier, mais il faut bien acheter des livres de temps à autres ;-)) puisque régulièrement, suite à une recherche de référence sur ces sites (oui, j'avoue, et j'assume), je rebondis sur des ouvrages "conseillés par" ou "qui ont été achetés par les internautes ayant acheté celui dont je consulte la notice" (bref, les outils qui nous manque tant dans nos opac), et j'aimerais bien savoir immédiatement si ces ouvrages sont déjà dans notre catalogue, c'est à dire sans avoir à revenir dans mon opac maison et faire une recherche (par isbn…sous l'interface pro car c’est plus radipe!). Le sudoc devrait proposer ce genre de fonctions et outils dérivés.
A ce titre, je trouve que le sudoc n'est pas du tout, mais alors pas du tout (ça m'étonnera toujours), un outil de gestion de collections de bibliothèque; il est sous-utilisé, alors qu'il devrait nous permettre de piloter la totalité de notre (bibliothèque universitaire, je précise) fonds, de la préparation des commandes au pilon [mais là je dérive; dire que je ne suis même pas passé par l'ENSSIB !]
pour ça y'a LibX. Bon, ça implique un clic pour vérifier quand-même… mais c'est plus rapide que de lancer une recherche sur l'opac directement.
"l'absence quasi-systématique de grandes villes" ? Ben en survolant la carte, je trouve quand même Lyon et Marseille… Cela dit, la démarche est très intéressante non parce qu'elle pourrait se substituer à un OPAC fédéré mais parce qu'elle propose discrètement d'accompagner la navigation sur des sites riches en résumés et commentaires d'un "signalement bibliothèque". Bon, ça ne touchera jamais qu'une frange infime de lecteurs, mais c'est toujours bon à prendre.
Côté OPAC fédérés, voir aussi le portail de Lectura sur les catalogues des villes-centres de Rhône-Alpes : http://www.lectura.fr/fr/catalogues/index.cfm , ou BRAIN, le catalogue des bibliothèques d'étude de Rhône-Alpes – y compris les BM de Lyon et Grenoble : http://mungo.grenet.fr/brainPortal/Brain_SearchSi…
OUI OUI OUI ET REOUI !!!! faut embaucher ce monsieur et vite !!!
Certes on peut toujours améliorer mais quand même … voila une expérience vraiment sympa de dissémination des bibs publiques sur le web. Un outil qui permet de se rappeler au bon souvenir de l'internaute lorsqu' il cherche un doc sur un site marchand … une manière de lui dire " tu n'as pas pensé à ta bib …. ta bib pense à toi ". C'est tout bête mais c'est déjà énorme !
Autre question : l'enrichissement et la mise à jour de la liste des bibliothèques intégrées sont-ils mutualisables ?
Ce pourrait devenir une liste de référence pour exploiter sous d'autres formes les serveurs Z39.50 éparpillés à droite à gauche. Donc éventuellement collaborative ?
@lully : Hubert relaie les infos de mon billet, avec un meilleur titre 😉 http://lafeuille.homo-numericus.net/2009/04/bookc…
Excellente idée de mutualiser cette base, il suffit de partager la liste proposée sur un wiki, par exemple. Damiano t'es d'accord ? (l'initiative de Symac montre que ce genre d'initiative n'est pas isolée). La génération mashup arrive coool ! 🙂
En terme de mutualisation d'informations sur les serveurs z39.50, ce que fait indexdata est pas mal : http://targettest.indexdata.com/
Ils utilisent pour maintenir ce registre un outil qu'ils ont développé : http://www.indexdata.dk/irspy/ . J'ai jamais testé, c'est du perl il doit falloir habiller un peu mais ça permet de tester à intervalles réguliers la disponibilité des serveurs, et récupérer les informations basiques de manière automatique (si j'ai bien tout compris)
Seulement 14 serveurs français sur leur registre, il reste du travail de signalement (dans leur base ou sur une instance française, au sein du bibliolab ?)
En effet, je ne suis pas "propriétaire" de cette liste de serveurs Z39.50, elle peut être mutualisée.
Maintenant il faut savoir que mon site n'interroge pas que des serveurs Z39.50 natifs, en direct, mais fait aussi du "screen scraping" transformé en Z39.50 via SimpleServer, là encore d'Indexdata : http://www.indexdata.dk/simpleserver/
L'idée pourrait être de proposer un service "ouvert" de recherche en Z39.50/SRU/SRW, en documentant quelles sont les catalogues disponibles. A chacun ensuite de faire ce qu'il veut de ces données…
Petite question naïve : cela serait-il possible de récupérer ces infos sur des portails qui proposent des catalogues collectifs ? Je pense au mastodonte CcFr (accès compliqué je suppose) mais aussi à des portails régionaux du type http://www.lectura.fr. Même question pour les entrepôts OAI déjà existants, mais je vais peut-être trop loin…
Pour le CCFr, d'autant que je sache, il n'est pas possible de l'interroger en Z39.50. Mais il devrait être possible d'interroger individuellement chaque catalogue du CCFr… du moment que le service (Z39.50, OAI) est "ouvert" et accessible à tous.
Pour Lectura, il semble qu'il ait un dépôt OAI justement. Si quelqu'un sait comment le moissonner, c'est avec joie que je l'intégrerai sur mon site. Et ça me fera un bon exercice d'entrée en matière sur OAI 🙂