Open library et les bibliothèques géantes du web

closeCet article a été publié il y a 5 ans 10 mois 7 jours, il est donc possible qu’il ne soit plus à jour, ou pas !

J’avais proposé il y a quelques temps un comparatif des possibilités de récupérer des données enrichies dans nos catalogues via des web services. Bien sûr ce type de données n’est intéressant à exploiter qu’à partir d’une taille critique de catalogue qui flirte avec quelques millions de notices, au minimum. Ce qui importe avant tout pour l’utilisateur lambda c’est les données et la couverture la plus complète possible d’un catalogue de bibliothèque : il veut des premières de couverture pour TOUS les documents, M. Lambda. Il veut aussi des tags, des commentaires, des critiques, des conseils, etc. Il faut donc des réservoirs de données énormes avec des métadonnées les plus riches possibles. A propos, j’ai découvert récemment Open Library récente « bibliothèque géante » sur le web aujourd’hui, à une échelle mondiale.

Le projet date de Juillet 2007 et selon cet article de zdnet, on apprend que :

L’internet archive vient de lancer une démo de son nouveau site : Open Library. À l’image du projet gutenberg, de wikisource, ou de wikibooks, l’open library propose de rassembler toute l’écologie informationnelle de l’univers des livres pour en faire un gigantesque wiki. Pour les livres qui ne sont pas diffusés sous licences libres, ou qui ne sont pas encore tombés dans le domaine public, Open Library propose d’accéder à des ressources documentaires permettant de s’informer, de les annoter, et de travailler dessus.

Pour en savoir plus, je vous invite à suivre la visite guidée en Anglais

A lire ce billet de Mon Memex (bon blog d’ailleurs, qui intègre la bibliosphère) il semble que ce projet soit criticable sur certains choix techniques et bibliothéconomiques :

Le projet se veut un effort collaboratif pour le catalogage. Le catalogue initial est un amalgame de notices provenant de la Library of Congress et d’éditeurs ayant contribué avec leurs catalogues. L’énergie des internautes est par la suite dirigée vers un site où il est possible d’ajouter des documents ou d’enrichir les documents existants de nouvelles métadonnées. Le site est en fait un Wiki structuré où les espaces modifiables sont prédéfinis.

Une chose est dérangeante, ils ont créé un nouveau schéma de métadonnées. Plutôt que d’utiliser un format existant et au minimum normalisé, ils ont combiné ce qu’ils considèrent comme étant l’essentiel du MARC avec l’ONIX pour créer futurelib. Les problèmes ont déjà commencé à apparaître. Un commentaire sur la page expliquant le schéma mentionne qu’il n’y a pas de champ dans la base de prévu pour les publications en séries. Si vous souhaitez contribuer à la discussion, vous pouvez rejoindre la liste de discussion sur les questions en lien avec la bibliothéconomie.

Quoi qu’il en soit, il semble qu’Open Library soit bien parti pour concurrencer les 4 autres bibliothèques géantes du web (anglophones hein, nous ne sommes que des crottes de mouches in this english world…) que sont Librarything, Amazon et Worldcat.

Open Library est d’ailleurs le seul catalogue géant entièrement Open Source. Encore une fois, il est vertigineux de constater le nombre de notices qui figurent dans ce catalogue depuis son landcement il y a seulement 6 mois : 13 439 320 notices de livres (dont 234 857 en texte intégral, probablement dans le domaine public).

Si le projet est super efficace pour les notices enrichies, il semble, d’un strict point de vue quantitatif, qu’il le soit moins pour les documents en texte intégral : puisque Europeana annonce 2 millions de ce type de document en Novembre 2008 et que Google Books propose d’ores et déjà plus d’un million de titres en texte intégral.

Mais du point de vue des données bibliographiques enrichies, la question est alors : que vaut Open Library face à ces concurrents? Hé bien voyez ce comparatif (que je ne traduis pas, il est simple à comprendre) publié sur johnmiedema.ca : (cliquez sur l’image pour agrandir). L’auteur a choisi Open Library dont il met les qualités en Vert, il vient de créer un plugin WordPress pour lier les livres dont on parle à Open Library.

Je laisse le dernier mot à Nicolas Morin (dont la voix nous manque, mais plus pour très longtemps paraît-il…) commentant ce projet qu’il considère comme essentiel pour l’avenir du catalogage :

OpenLibrary, par exemple, contient, après avoir démarré il y a quelques mois seulement, plus de 10 millions de livres. Et je vous recommande particulièrement la séance de présentation faite par le leader du projet, Aaron Swartz, au Berkman Center de Harvard (film en .mov). A un moment, quelqu’un autour de la table – pas Tim Spalding dont on voit la tonsure en bas à droite de l’écran ;) – explique très bien quand dans tous ces projets, on ne parle plus d’un livre isolément. On traite de collections massives, quelques centaines de milliers de livres à la fois. Mais en même temps, on peut faire quelque chose de très fin, car OpenLibrary est aussi un wiki (structuré): si je veux changer la date de parution d’un livre individuel, je peux, sans avoir de logiciel client, sans que mon institution appartienne à un réseau, sans même, d’ailleurs, que j’appartienne moi-même à une institution. Plus j’y pense, plus il me semble que c’est ça qui est vraiment nouveau: la massivité des projets, avec un nombre énorme de notices très riches, et en même temps leur grande souplesse, qui fait que je peux individuellement modifier et “prendre” une notice. A mes yeux, l’avenir du catalogage est certainement plus du côté d’OpenLibrary que d’une réforme des formats MARC.


Related Posts with Thumbnails
Auteur : Silvae (1100 Posts)

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

Author Info

If you enjoyed this post, make sure you subscribe to my RSS feed!

This work, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-ShareAlike 3.0 France License.

Tags:, , ,

About Silvère Mercier

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.
  • Pingback: apsed | L’Open Library en perspective sur Bibliobsession

  • Valérie

    Bonjour,

    Cette « bibliothèque géante », outre l’affichage extrêmement pauvre de ses résultats, pose un problème majeur pour les références dans des langues utilisant des caractères accentués, car mal retranscrits, par ex. :

    Commentaire de la Première Epître de Jean par Fleinert-Jensen

    - recherche sous l’auteur : le titre apparaît, mais mal retranscrit
    - recherche sous le titre : résultat nul

    Il y a certaines professions qui ne s’improvisent pas…

    Valérie