De la classification à facettes aux sérendipités documentaires

Intr-sc-info-France_mLa lecture de l’excellent livre Introduction au sciences de l’information (voilà LE livre de référence pour tout étudiant en info-doc qui se respecte) m’a remis les idées en place sur Shiyali Ramamrita Ranganathan (1892 – 1972) ce mathématicien et bibliothécaire indien souvent cité comme l’inventeur des 5 lois des bibliothèques :


1 Les livres sont faits pour être utilisés
2 À chaque lecteur son livre
3 À chaque livre son lecteur
4 Épargnons le temps du lecteur
5 Une bibliothèque est un organisme en développement

Ouais bon, personnellement je les ai jamais trouvées révolutionnaires ces lois, bien qu’elles soient bonnes à rappeler de temps à autre… En revanche, ce qu’on oublie que c’est que le Sieur Ranganathan est l’inventeur d’un système de classification à facettes, la Classification Colon (CC) qu’il finalise en 1933. Sur Wikipédia :

Pour résoudre le problème posé par Jorge Luis Borges : « Comment ranger les livres dans une bibliothèque quand on sait qu’il y en a des grands et des petits, des livres d’histoire et des romans, des auteurs qui ont écrit les deux et des collections reliées qui traitent de tout et que l’on doit y ajouter les dossiers correspondant aux différents sujets ? »

Le document est alors décliné en 5 facettes (PEMST) :

  1. Personnalité : le concept principal du document
  2. Energie : l’opération ou action subie par l’objet
  3. Matière : une substance ou une propriété
  4. eSpace : localisation géographique
  5. Temps : localisation chronologique et temporelle.

Il y a dans ces 5 éléments (nan rien à voir avec le film), la quête du graal : la syntaxe absolue, celle des méta-données fondamentales. J’aime beaucoup cette idée ! 🙂

Sur wikipédia on trouve vraiment des perles puisque l’article propose un lien vers le pfd complet traduit en français de la présentation de la CC par Shiyali Ramamrita Ranganathan le 21 décembre 1951 à l’UNESCO.

Admirez la formulation de ce préambule :

ScreenShot001

Fascinant de noter que cette recherche très bibliothéconomique a inspiré des années plus tard un renouvellement des interfaces d’accès à l’information, bien au delà des bibliothèques : la navigation à facettes (en anglais, faceted browsing oufaceted navigation).

Dans un article du BBF de 2007 intitulé « Nouvelle famille d’OPAC » Marc Maisonneuve et Cécile Touitou font le point sur la notion de facette :

L’Afnor définit les facettes comme étant « des catégories de notions de même nature ou exprimées d’un même point de vue telles que phénomène, processus, propriété, outil, permettant un regroupement des notions indépendamment des disciplines traitées ». Jacques Maniez, dans un article fort éclairant, propose une mise au point terminologique de ce terme souvent appauvri et dévoyé : les facettes d’une classification documentaire doivent être, selon lui, un nombre limité « d’aspects essentiels en contraste interactif les uns avec les autres ». Il en propose la définition suivante : « Gamme d’attributs communs fondamentaux en nombre limité utilisée comme technique d’analyse et de classification des concepts et des sujets. »

(…)

Ne s’appuyant pas nécessairement sur la classification du même nom, la navigation à facettes présente les caractéristiques suivantes :
elle s’appuie sur une recherche sommaire sans possibilité de combinaison de critères, en demandant à l’usager de saisir un mot sur lequel portera la recherche. C’est une recherche à la Google, sans distinction de critères de recherche ;
en réponse, le logiciel donne une vision globale des références répondant à la requête, sous forme d’une ventilation de ces réponses suivant diverses catégories accompagnées du nombre d’occurrences. Ainsi, pour une recherche sur Shakespeare, l’usager sera informé qu’il existe 238 documents dont Shakespeare est l’auteur et 388 documents où il en est le sujet. De multiples possibilités de ventilation des références sont proposées, que nous présentons ci-dessous. Ces différents angles de vue des résultats de la recherche sont les fameuses facettes de la navigation ;
l’usager peut alors sélectionner une facette, par exemple le type de document, et restreindre les résultats de sa recherche aux seules vidéos ;
tant qu’il demeure des références, l’usager se voit proposer des restrictions successives (ne sélectionner que les vidéos d’une période ou d’un réalisateur…), avec possibilité de retour en arrière.

Ne s’appuyant pas nécessairement sur la classification du même nom, la navigation à facettes présente les caractéristiques suivantes :

  • elle s’appuie sur une recherche sommaire sans possibilité de combinaison de critères, en demandant à l’usager de saisir un mot sur lequel portera la recherche. C’est une recherche à la Google, sans distinction de critères de recherche ;

  • en réponse, le logiciel donne une vision globale des références répondant à la requête, sous forme d’une ventilation de ces réponses suivant diverses catégories accompagnées du nombre d’occurrences. Ainsi, pour une recherche sur Shakespeare, l’usager sera informé qu’il existe 238 documents dont Shakespeare est l’auteur et 388 documents où il en est le sujet. De multiples possibilités de ventilation des références sont proposées, que nous présentons ci-dessous. Ces différents angles de vue des résultats de la recherche sont les fameuses facettes de la navigation ;

  • l’usager peut alors sélectionner une facette, par exemple le type de document, et restreindre les résultats de sa recherche aux seules vidéos ;

  • tant qu’il demeure des références, l’usager se voit proposer des restrictions successives (ne sélectionner que les vidéos d’une période ou d’un réalisateur…), avec possibilité de retour en arrière.

Il précise plus loin :

Le défi pour les concepteurs de ces nouveaux produits est à la fois de favoriser l’expression « naturelle » d’une requête par un usager habitué à la logique des moteurs massivement utilisés ; de ne pas l’exposer à une réponse « silencieuse », malgré l’utilisation d’un langage non contrôlé ; de ne pas l’exposer non plus aux recherches « bruyantes » qui, il y a encore quelques années, aboutissaient, après des dizaines de secondes d’attente, au message exaspérant: « Time out. Votre recherche aboutit à plus de 500 réponses, veuillez reformuler votre demande ! »

Ce qu’il s’agit surtout d’éradiquer, c’est bien cette cochonnerie de ce fameux champ « recherche experte/avancée » sans pour autant perdre le bénéfice de l’indexation amoureusement construite pas les bibliothécaires… et potentiellement l’indexation libre proposée par les usagers eux-mêmes.

Constatons que si ce sont des bibliothécaires qui ont pensé les facettes bien avant l’industrie commerciale sur le web, ce sont bien les marchands en ligne qui ont su mieux exploiter le potentiel de la navigation à facettes. Ils ont su mettre en œuvre des ingénieries de la sérendipité selon Olivier Ertzscheid. Marc Maisonneuve précise  :

Sur la plupart des sites, lorsqu’ils offrent un accès à de volumineuses bases encyclopédiques (certains sites marchands ou des catalogues de bibliothèques), la navigation à facettes est proposée après une première expression de la recherche et la fourniture des premiers résultats, afin de permettre à l’usager d’affiner sa recherche, tout en proposant un large panel de réponses proches ou connexes. Cette navigation s’apparente aux promenades dans les rayons de la bibliothèque où le regard traîne à la recherche de l’ouvrage inattendu qui saura fortuitement retenir notre attention

A la liste des 5 exemples d' »ingénieries relationnelles machiniques » citées par Olivier, on pourrait ajouter une sérendipité que l’on pourrait qualifier de « sérendipité documentaire » qui pourrait se caractériser comme le fait de favoriser des rebonds sur le fondement d’un système de classification utilisé par des bibliothécaires pour indexer un corpus = le rebond par sujet.

Il s’agit bien d’une sérendipité machinique mais humaine en quelque sorte. Elle reflète des choix de bibliothécaires sur le mode  : un bibliothécaire décrit une ressource avec un langage jugé universel. Ainsi les bibliothèques ne sont-elles pas stricto sensu appelées à s’approprier ce mouvement sérendipitaire puisqu’il leur est en quelques sorte consubstantiel…. Finalement, ce que nous sommes appelés à faire, c’est mettre en service des techniques documentaires anciennes sur un mode sérendipitaire humain, en quelque sorte(en partie, mais pas seulement hein)

Ce qui se prépare, surtout, avec le web sémantique, c’est bien la généralisation à grande échelle de cette sérendipité documentaire basée sur des concepts associés entre eux par des humains (mais qui sont-ils ?) et reconnus par des machines (mais comment et selon quels critères?).  Ainsi, comme le remarque Sébasien Declercq dans un nouveau biblioblog appelé des TIC au tac :

Une recherche humaine via le graphe mènera à une forte augmentation de la sérendipité : quittant le saut de liens en liens, de serveurs en serveurs, on passera directement de concept à concept. Ceci va, sans aucun doute, nous mener à une plus grande divagation d’esprit : là où pour le moment on clique « pour voir ce que l’autre dit », le web sémantique nous fera cliquer pour voir quel lien existe entre deux concepts.

Au final, la filiation est assez fascinante en Ranganathan et la sérendipité documentaire d’aujourd’hui non ?

Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

6 réponses

  1. manu dit :

    Cool, un article qui va remettre en avant un personnage crucial du monde des sciences de l’information.
    Les facettes de la Colon Classification prennent également tout leur sens avec le FRBR. Et personnellement, je regrette qu’une idée aussi riche n’ai pas été exploitée plus tôt, et regret supplémentaire pour l’exploitation de l’idée par des non spécialistes. Les spécialistes de l’infodoc ont clairement un rôle à jouer dans le monde actuel, mais ce rôle me semble en dessous du potentiel existant. Espérons que cela change. En tout cas, ce bouquin est la base absolue pour tout professionnel.
    Concernant les lois des bibliothèques, elles ne sont effectivement pas révolutionnaires, mais elles sont presque systématiquement bafouées 🙂 Et puis, à l’époque, les bibliothèques de conservation était encore très présentes dans le paysage, et donc, il faut replacer ces lois dans leur contexte.
    Allez, un peu de pub pour un autre grand personnage des sciences de l’information : Paul Otlet, voir http://fr.wikipedia.org/wiki/Paul_Otlet et http://fr.wikipedia.org/wiki/Paul_Otlet pour  plus d’informations.
     
     

  2. amarois dit :

    Il y a quelques temps j’ai cherché à lire la réf. bibliographique suivante citées partout (littérature professionnelle francophone, j’entends) dès qu’il s’agît de facettes :
    J. Maniez, “Des classifications aux thésaurus: du bon usage des facettes,” Documentaliste(Paris),  vol. 36, 1999, p. 249–260.
    Et bien pas moyen de la trouver en ligne; un article aussi cité (…!). Du coup j’en ai été pour une photocopie dans la bibliothèque de  l’enssib (tout un programme).
    Il semble que désormais il soit disponible en pdf sur le site de l’adbs.

  3. JM Salaun dit :

    Merci Sylvère, pour cette appréciation sur le livre rédigé par l’ensemble des profs de l’EBSI. Pour ce qui concerne la classification à facettes, les spécialistes à l’EBSI sont Michèle Hudon et Sabine Mas.

    • ok, merci pour le retour, j’espère ne pas avoir trop dit de bêtises si les spécialistes suscités me lisent ! En tout cas, ils sont bienvenus pour intervenir s’ils le souhaitent ! 🙂

  1. 6 mai 2011

    […] qui ont emprunté ça on aussi emprunté”. Ce qui est nouveau par rapport à un système de recherche à facettes, c’est le fait que ces rebonds ne s’appuient pas sur des critères documentaires […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.