Quels critères pour utiliser la longue traîne ?

Je cite souvent dans mes formations l’exemple de la BU d’Huddersfield qui propose à ses usagers un outil de navigation dans la longue traîne de  ses collections.

La longue traîne c’est, sur un marché donné, le rapport entre la variété des titres et leur consultation que ce soit par achat ou emprunt. Ce rapport à une forme asymptotique qui ressemble à :

Sur Wikipédia on apprend qu’un employé d’Amazon formule la longue traîne d’une manière assez tordue : « Aujourd’hui, nous avons vendu plus de livres qui ne se sont pas vendus hier que nous n’avons vendu de livres que nous avons vendu aussi hier ».  😆

Dans mes formations, j’essaie ensuite de bousculer quelques idées reçues sur l’opposition gros/petits libraires/marchands en soulignant le corollaire de ce modèle : les marchands comme Amazon on un intérêt économique à avoir une offre de contenus la plus large et diverse possible. Certains petits libraires font un chiffre d’affaire non négligeable grâce au marketplace d’Amazon (mais cela ne règle en rien le fait qu’ils puissent être fragilisés par cette dépendance).

Pour les bibliothèques, la partie jaune de la longue traîne est la richesse de nos collections, reste à trouver les moyens d’y faciliter la navigation, ce qui ouvre le champ à des dispositifs de médiation à la fois techniques et éditoriaux.

En matière de dispositifs techniques, il s’agit pour les bibliothèques de proposer des rebonds automatisés dans les catalogues sous la forme : « si vous avez aimez vous aimerez », ou plutôt dans le cas d’Huddersfield : « ceux qui ont emprunté ça on aussi emprunté ». Ce qui est nouveau par rapport à un système de recherche à facettes, c’est le fait que ces rebonds ne s’appuient pas sur des critères documentaires (indexation matière faite par les bibliothécaires), mais sur des critères relatifs à des parcours d’usages au moyen de l’indicateur le plus évident : le nombre d’emprunts pour un titre donné.

Exemple :


Il s’agit donc d’exploiter des historiques d’emprunts anonymisés (nous en avions débattu ici il y a déjà un siècle) de manière à classer des recommandations qui doivent être les plus pertinentes possibles.

Comment ? Dave Pattern, responsable du l’informatique documentaire pour la Bu d’Huddersfield propose un très intéressant billet sur le sujet. Il y explique qu’a partir d’un titre, il repère ceux qui ont le plus grand nombre d’emprunteurs en commun. Ce critère lui permet de classer les titres par ordre décroissant de pertinence sur ce critère. Il faut noter l’importance de l’ordre de classement des recommandations car le dispositif à quelque chose de très visuel : pour être efficaces les recommandations ne doivent pas être trop nombreuses et ordonnées de manière optimale. Sur l’interface du catalogue d’Huddersfield il est proposé deux versions de la liste des rebonds : une courte et une longue.

Or, si on ordonne les titres par le seul critère du nombre d’emprunts en commun, Dave Pattern constate deux écueils :

  • Les titres recommandés sont aussi ceux qui sont souvent empruntés, ce qui est en opposition avec ce qu’on attend d’un tel dispositif de médiation automatisé qui entrîane ce qu’on pourrait appeler un « effet chariot de retour »
  • Le classement des titres fait apparaître des rebonds vers des titres qui traitent le sujet de manière plus générale, ce qui est problématique puisque d’un lecteur s’attend a priori à des recommandations sur le sujet au même niveau de profondeur .

Il a donc cherché un autre moyen d’ordonner les titres aussi empruntés par d’autres usagers. Sa solution : ajouter au nombre d’emprunts en commun entre les deux titres le critère du nombre total d’emprunt du titre recommandé en les ordonnant selon le rapport entre ces deux chiffres.

Autrement dit, les titres sont recommandés parce qu’ils ont certes été empruntés en commun par un nombre de lecteurs important, mais aussi en fonction de la popularité de chaque titre au niveau global, le tout sur une période donnée. Le résultat est tout à fait efficace dans les exemples donnés, à partir du moment où on joue avec un seuil d’emprunts en commun par titre.

Voilà qui me semble tout à fait astucieux. Qu’est-ce qui nous retiens de faire la même chose ? Qu’en pensez-vous ?

Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

10 réponses

  1. Reup dit :

    Bonjour,

    Rhaa, j’ai ramé, mais j’ai fini par comprendre. C’est en effet une technique brillante pour éviter l’effet chariot de retour. Parce que c’est le seul défaut que je trouvais à la recommandation Amazon-like (l’aspect technique, l’aspect nouveau et le fait que ça ait été inventé par des marchands n’en sont pas à mes yeux).

    Effectivement, si la recommandation automatique se bornait à conseiller tout ce que tout le monde lit déjà, elle serait peu utile. Et pire, elle nierait notre boulot, en donnant encore plus de poids aux biblios des profs et au talent marketing des grandes maisons d’éditions. Le lecteur qui aurait échappé à tel ou tel « incontournable » (mais dont nous trouvons, nous, qu’il n’est pas si bien et en tout cas très insuffisant) se le verrait à coup sûr proposer.

    L’argument pour vendre ce type ingénieux de recommandation automatique, c’est qu’en plus il valorise notre travail de recommandation humaine. En choisissant un bon bouquin à acheter, on le rend disponible. En le conseillant à quelques lecteurs, on ne touche que ceux-ci. En le mettant en valeur dans des biblios ou sur des présentoirs, on élargit un peu sa visibilité, mais on restera toujours moins performants (d’un point de vue marketing) que les éditeurs et les profs réunis. Tandis qu’avec cet outil, même s’ils ne sont que 6 à s’être laissé tenter par notre trouvaille, ils deviendront prescripteurs à leur tour.

    Voilà une idée qu’elle est bonne. Bon, ben, y a plus qu’à…

    • Anonyme dit :

      ah, ravi de voir que j’ai pas été le seul à ramer pour comprendre ! 🙂

  2. Sur Bibliosurf, j’utilise plutôt, « ils ont consulté aussi » qui est plus crédible vu le nombre important de consultations.
    Le vrai problème des bibs, c’est qu’elles n’utilisent pas leur indexation.
    L’indexation doit apparaitre sur la notice du livre et non être noyée dans une arborescence incompréhensible ! Ainsi, le lecteur peut continuer son parcours de recherche.
    Sur Bibliosurf, les lecteurs viennent par Google sur une recherche de titre précise et peuvent aller plus loin grâce aux stats de consultation, à une indexation auteur et matière, à la datation ou à la géolocalisation… aux avis des lecteurs postés sur le site ou ailleurs sur le web, aux conseils du libraire…

  3. B. Majour dit :

    C’est vrai ?

    On va vraiment utiliser les données fournies par nos lecteurs ? 🙂
    Chic alors.

    « Qu’est-ce qui nous retient ? »

    Rien. Alors allons-y !
    Intégrons enfin les lecteurs dans nos Opac. 😉

    Bien cordialement
    B. Majour

    P.S. : Ah oui, tu remarqueras que le procédé « lecteurs » peut être appliqué aux bibliothèques elles-mêmes. Chaque bibliothèque a lu (acheté) un ouvrage en commun avec d’autres. Agrémente le tout d’un soupçon de prêts en deuxième colonne, et tu obtiens les recommandations des bibliothécaires, suivant le même principe que précédemment.
    (rajoutons, si nécessaire, une cote pour la discrimination disciplinaire)

    Libérons les données de nos Opac et nous obtiendrons un outil de travail plein de potentialités.
    Quelques grosses bibliothèques peuvent suffire.

  4. atthezoo dit :

    « Il a donc cherché un autre moyen d’ordonner les titres aussi empruntés par d’autres usagers. Sa solution : ajouter au nombre d’emprunts en commun entre les deux titres le critère du nombre total d’emprunt du titre recommandé en les ordonnant selon le rapport entre ces deux chiffres ».

    C’est la fin de journée et déjà que le bon sens me fuit parfois… Là c’est trop pour moi ! Mais l’idée est excellente. Comment l’adapter techniquement à nos Opacs ?

  5. Pierre dit :

    Ca marche dans des cas très précis : bibliothèques universitaires, segments tellement précis que les populations empruntant sont homogènes (oui les étudiants en médecine empruntent des livres de médecine). Et les exemples sont étrangement bien choisis. Mais les recommandations sur statistiques de prêt ne seront pas pertinentes en BM ou sur un catalogue généraliste : la BU d’huddersfield recommande aux lecteurs de 1984 de George Orwell de découvrir un dvd de George Clooney et aux lecteurs de Borges de découvrir Ralph Ellison.

  6. Il y a quand même un problème majeur à la mise en oeuvre de telles recommandations : le SIGB ne stocke pas l’ID du lecteur dans la table « historique des prêts ». C’est le cas chez nous, et vous ?

    • B. Majour dit :

      Bonjour

      Oui, beaucoup de SIGB n’ont pas cette fonctionnalité (dans le respect des droits du lecteur)

      Cependant, on a toujours la liste des prêts en cours.

      A défaut, dans l’historique, on a de grosses masses jour après jour.
      C’est moins fin que le choix du lecteur, mais ça peut faire office de.

      Office de.

      Car le but n’est pas de proposer une ressource fiable à 999/1000, mais de permettre un choix au lecteur. Une certaine présentation.

      Ça m’amuse beaucoup quand Pierre déclare tout de go (après un test sur une BU) que ça ne marchera jamais en BM. Ça m’amuse, parce que c’est juste vouloir que l’outil soit fiable à 100 %.

      Or, ça n’a rien à voir.
      On cherche des liens potentiels entre les documents, pas une certitude absolue.
      On cherche des chemins, des sentiers à parcourir pour ceux qui le souhaitent.

      Une bibliographie, des liens tracés au hasard sont tout aussi pertinents que des ouvrages mis sur des présentoirs, ou encore que des documents rangés en thématique.

      Dans une BU, on cherche une certaine pertinence.

      Et si on gratte un peu plus loin : une pertinence en rapport avec les études suivies, ce qui est somme toute logique.

      Dans une BM (ou même dans le fonds « annexe », hors étude, d’une BU), le choix n’est plus du tout le même.

      Ce qui m’amène souvent à penser : en quoi notre présentation en rayonnage est-elle pertinente ?
      En quoi un rangement en alpha d’auteur est-il plus pertinent qu’un rangement par collections ? par thématique ? par facettes ?

      D’autres chemins de traverses sont possibles.
      D’autres rangements !

      Quelques cotes colorées, quelques pastilles de couleurs et on propose autre chose.

      Alors oui, ce système marche.
      Et il marche partout.

      Ça marche… comme tout outil probabiliste. Il ne faut pas se leurrer.

      Mais c’est clair que ça ne vaut pas la liste d’un prof, ni la liste des recommandations des anciens élèves, ou même la sélection des bibliothécaires.
      (la sélection/l’acquisition des bibliothécaires, ce petit pourcentage de documents sélectionnés face à l’univers du Web et de la documentation générale… ce reste de l’iceberg dont on n’a pas les liens en bibliothèque. Comme si les étudiants ne lisaient ni ailleurs, ni n’achetaient d’ouvrages par leurs propres moyens. 🙂 )

      Ça marchera d’autant mieux quand nos rayonnages se seront dématérialisés, et quand on sera passé aux hyper-cotes. Ces tags du livre qui vont renvoyer la cotation Dewey à ce qu’elle est : « une » présentation, parmi bien d’autres.

      Un chemin de traverse et non l’unique chemin de rayonnement d’une bibliothèque.

      Bien cordialement
      B. Majour

  7. Anthony dit :

    Autre limite : les documents n’ayant jamais été empruntés depuis l’informatisation du catalogue sont mis de côté par ce système de recommandation. Or, dans ma bibliothèque du moins, ceux-ci sont très nombreux et constituent une bonne partie de la longue traîne. Bien sûr, cela n’enlève pas tout son intérêt à cette piste de travail…

  1. 29 avril 2014

    […] delà des algorithmes de pertinence, on pourrait aussi citer le cas des algorithmes de recommandation qui permettent de naviguer dans la longue traîne des bibliothèqu…. J’avais écrit un article à ce sujet il y a déjà quelques années en essayant de […]