Luttons contre le OU par défaut dans les moteurs de recherche

Intéressant billet trouvé dans la lettre territoriale documentation : (Il)logique booléenne. Il s’agit de faire comprendre aux développeurs qui contruisent des moteurs de recherche un élément de base. D’abord un petit rappel sur les opérateurs Booléen :


Quel est le problème ?

Mais pourquoi les développeurs sont-il allés nous mettre du « OU » par défaut ? Le « ET » semble pourtant s’être imposé comme la norme à peu près partout sur Internet et c’est heureux : il faut bien faire ressortir ce qui répond le mieux à une recherche parmi des milliards de pages ; et, surtout, le « ET » est l’opérateur qui correspond le plus au langage naturel. En effet, si j’associe deux termes ou plus, ce n’est pas un hasard : faire une recherche sur les voitures rouges ce n’est pas faire une recherche sur les voitures en général ou sur la couleur rouge…

Je partage pleinement la conclusion :

Côté enseigne commerciale, j’y vois plutôt la volonté de mettre en avant l’abondance, comme si l’affichage de rayons bien remplis était un signe de bonne santé économique… ou l’illusion d’un choix dont le client n’a la plupart du temps que faire. Une logique sans doute valable pour acheter une télé ou un lecteur MP3 mais complètement hors de propos dans le cas d’un livre ou d’un disque. Quel est l’intérêt de comparer des livres entre eux, selon des critères qui en plus sont totalement inadaptés ? L’écrit, tout comme l’image et le son, est donc devenu un « produit culturel » comme les autres…

Développeurs, commerçants en ligne, laissez le OU à sa place, c’est-à-dire dans la recherche avancée (qui n’existe d’ailleurs pas sur le site dont il a été question plus haut). Libérez le ET et ne craignez pas la réaction de l’internaute qui ne voit qu’un ou deux résultats à sa recherche. Il sera au contraire ravi d’une réponse aussi ciblée, signe de la performance du site interrogé…


(152)

This work, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-ShareAlike 3.0 France License.

Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

8 Responses

  1. Filca dit :

    Le billet est effectivement intéressant. Cependant, Google et Exalead (pour ne citer qu’eux) utilisent explicitement le « et » par défaut.

  2. Oui bien sûr Google et Exalead utilisent le ET par défaut. Quant Google est apparu ce fut la 1e qualité qui m’a frappé. Mais je continue à pester contre ce OU imbécile. C’était le cas de l’annuaire sur Minitel et c’est toujours le cas des pages jaunes et blanches sur le Net. Totalement contreproductif. Quant aux moteurs internes des sites, ils ont souvent ce OU implicite.

  3. Oui, c’est par peur que la quantité de documents indexés ne soit pas suffisante pour que le ET content le (re)chercheur.
    Ceci dit, la version 1.4 de DSpace configurait Lucene avec un OU par défaut (qu’il nous a fallu changer, en pestant) et imbécile.

    • Tiens merci c’est intéressant de voir que la raison évoquée pour le OU par défaut est de perdre en pertinence pour éviter le silence et donc favoriser la sérendipité (c une raison valable mais ça change pas le fait qu’il faille proscrire ces pratiques).

  4. arnaud dit :

    Je peux comprendre vos demandes, mais comme vous le savez les moteurs de recherche actuels ne sont plus booléen mais vectoriels ou probabilistes. En fait, cela revient à faire du OU qui rank optimalement le ET lorsque c’est le cas. Bien entendu on peu les configurer pour faire du ET par défaut, ou pour l’utilisateur connaitre la syntaxe du moteur pour faire explicitement du ET. Ce n’est pas sans raison que ces moteurs de recherche ce sont imposés, car plus pertinent du point de vu de la plupart des utilisateurs. Mais je suis d’accord avec vous les utilisateurs détestent le silence des moteurs de recherche. Mais finalement, tout dépend de la tâche à réaliser et des données à indexer.

  5. Bonjour,
    le sujet est fort intéressant mais cette question du OU et ET passe bien au dessus de la majorité des internautes qui pensent que le moteur peut faire tout le travail à leur place. Trop de gens se figurent que la machine TROUVERA à leur place alors qu’il ne s’agit que d’outils de RECHERCHE.

  6. Risu dit :

    Comme le dit Arnaud, l’intérêt des Google et consorts c’est qu’ils gèrent le Et et le Ou, plaçant les résultats du premier vers le haut. C’est vers cela qu’il faut aller dans nos interfaces de recherche, vers ces affichages par pertinence (et faire disparaitre nos affichages par ordre alphabétique).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>