• Non classé
  • 3

Clusteriser pour affiner et/ou recommander

FutureLib est un Wiki anglosaxon oeuvrant à dessiner le futur des bibliothèques. En furetant dans la section "Next generation catalogs", je suis tombé sur ce prototype :  National Library of Australia Lucene Demonstrator

Il s’agit, si j’ai bien compris le billet de Figoblog, d’indexer un grand nombre de données à la fois primaires (texte intégral) et secondaires (notices bibliographiques), le défi étant comme toujours d’en ressortir des données exploitables.

Le résultat va très très loin dans les suggestions post recherche (ou le Service Après Recherche Initiale) puisque les réponses possibles sont clusterisées pour affiner la recherche par sujets, mots matières, dates, auteurs, formes, etc. Tous sont bien sur liés d’une manière ou d’une autre à la recherche initiale. On trouve aussi dans ces catégories un schéma des années d’éditions (particulièrement intéressant pour suivre le rythme de désherbage sur un sujet…) mais aussi le domaine conspectus ainsi que l’indice de classification.

En fait, ce que l’on apelle la "clusterisation", (affreux anglicisme!)  "c’est partitionner une base de données en un petit nombre de sous-bases". C’est donc très utile pour les recommandations.

Bon je serai bien incapable de rentrer dans les détails techniques sur comment tout ça fonctionne, mais voici ce que ça donne lorsqu’on fait une recherche, par exemple Landscape :

Si ça vous intéresse de creuser le modèle conceptuel d’organisation de l’information bibliographique qui est derrière tout ça je vous invite à lire ce billet sur les FRBR, sujet complexe que personne d’autre n’explique mieux que Figoblog.

Questions que je me pose sur tout ça:

  • La "clusterisation" destinée à affiner d’une requête est-elle de la même nature que la recommandation de type "sérendipité" (celle qui permet d’exploiter la longue traîne)?
  • Comment différencier clairement ces différents niveaux de "suggestions" dans l’interface?
  • A quel moment la recommandation tue la recommandation?
  • Qu’est ce que je vais bien pouvoir demander au  Père Noël?


Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

3 réponses

  1. Manue dit :

    Quelques réponses ? La clusterisation est au niveau de la collection (montrer les "étagères" qui existent dans la bibliothèque virtuelle) alors que la recommandation est au niveau du document (quel document est virtuellement "à côté" de quel autre). A quel moment la recommandation tue la recommandation : une question qui a été assez bien traitée par Christian Fauré dans ce billet http://www.christian-faure.net/2... . Il faut demander au Père Noël de FRBRiser les catalogues 😉 Et merci pour les fleurs !!!

  2. bibliobsession dit :

    De rien! Effectivement, c’est bien la première fois que je lis une analyse prolétarienne du moteur de recherche! : Utiliseriez-vous un moteur de recherche ne sachant pas comment il traite vos requêtes ? Je cite souvent l’exemple de ces utilisateurs révoltés de se voir retourner des documents dans lequel le mot clé recherché n’était même pas présent. Un tel moteur vous déposséderai immédiatement de toutes les stratégies de recherche que vous utilisez habituellement. Vous seriez prolétarisés, c’est-à-dire privés de l’exercice de vos connaissances, de vos compétences et de vos savoir-faire.

  3. oroypjoxbg dit :

    Clusteriser pour affiner et/ou recommander –
    oroypjoxbg http://www.g3z75a34n2hv2jx62so78c4du0f37x3os.org/
    aoroypjoxbg
    [url=http://www.g3z75a34n2hv2jx62so78c4du0f37x3os.org/]uoroypjoxbg[/url]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.