Quels critères pour utiliser la longue traîne ?

Je cite souvent dans mes formations l’exemple de la BU d’Huddersfield qui propose à ses usagers un outil de navigation dans la longue traîne de  ses collections.

La longue traîne c’est, sur un marché donné, le rapport entre la variété des titres et leur consultation que ce soit par achat ou emprunt. Ce rapport à une forme asymptotique qui ressemble à :

Sur Wikipédia on apprend qu’un employé d’Amazon formule la longue traîne d’une manière assez tordue : « Aujourd’hui, nous avons vendu plus de livres qui ne se sont pas vendus hier que nous n’avons vendu de livres que nous avons vendu aussi hier ».  😆

Dans mes formations, j’essaie ensuite de bousculer quelques idées reçues sur l’opposition gros/petits libraires/marchands en soulignant le corollaire de ce modèle : les marchands comme Amazon on un intérêt économique à avoir une offre de contenus la plus large et diverse possible. Certains petits libraires font un chiffre d’affaire non négligeable grâce au marketplace d’Amazon (mais cela ne règle en rien le fait qu’ils puissent être fragilisés par cette dépendance).

Pour les bibliothèques, la partie jaune de la longue traîne est la richesse de nos collections, reste à trouver les moyens d’y faciliter la navigation, ce qui ouvre le champ à des dispositifs de médiation à la fois techniques et éditoriaux.

En matière de dispositifs techniques, il s’agit pour les bibliothèques de proposer des rebonds automatisés dans les catalogues sous la forme : « si vous avez aimez vous aimerez », ou plutôt dans le cas d’Huddersfield : « ceux qui ont emprunté ça on aussi emprunté ». Ce qui est nouveau par rapport à un système de recherche à facettes, c’est le fait que ces rebonds ne s’appuient pas sur des critères documentaires (indexation matière faite par les bibliothécaires), mais sur des critères relatifs à des parcours d’usages au moyen de l’indicateur le plus évident : le nombre d’emprunts pour un titre donné.

Exemple :


Il s’agit donc d’exploiter des historiques d’emprunts anonymisés (nous en avions débattu ici il y a déjà un siècle) de manière à classer des recommandations qui doivent être les plus pertinentes possibles.

Comment ? Dave Pattern, responsable du l’informatique documentaire pour la Bu d’Huddersfield propose un très intéressant billet sur le sujet. Il y explique qu’a partir d’un titre, il repère ceux qui ont le plus grand nombre d’emprunteurs en commun. Ce critère lui permet de classer les titres par ordre décroissant de pertinence sur ce critère. Il faut noter l’importance de l’ordre de classement des recommandations car le dispositif à quelque chose de très visuel : pour être efficaces les recommandations ne doivent pas être trop nombreuses et ordonnées de manière optimale. Sur l’interface du catalogue d’Huddersfield il est proposé deux versions de la liste des rebonds : une courte et une longue.

Or, si on ordonne les titres par le seul critère du nombre d’emprunts en commun, Dave Pattern constate deux écueils :

Il a donc cherché un autre moyen d’ordonner les titres aussi empruntés par d’autres usagers. Sa solution : ajouter au nombre d’emprunts en commun entre les deux titres le critère du nombre total d’emprunt du titre recommandé en les ordonnant selon le rapport entre ces deux chiffres.

Autrement dit, les titres sont recommandés parce qu’ils ont certes été empruntés en commun par un nombre de lecteurs important, mais aussi en fonction de la popularité de chaque titre au niveau global, le tout sur une période donnée. Le résultat est tout à fait efficace dans les exemples donnés, à partir du moment où on joue avec un seuil d’emprunts en commun par titre.

Voilà qui me semble tout à fait astucieux. Qu’est-ce qui nous retiens de faire la même chose ? Qu’en pensez-vous ?

Quitter la version mobile