Luttons contre le OU par défaut dans les moteurs de recherche

closeCet article a été publié il y a 2 ans 6 mois 15 jours, il est donc possible qu’il ne soit plus à jour. Les informations proposées sont donc peut-être expirées.

Intéressant billet trouvé dans la lettre territoriale documentation : (Il)logique booléenne. Il s’agit de faire comprendre aux développeurs qui contruisent des moteurs de recherche un élément de base. D’abord un petit rappel sur les opérateurs Booléen :


Quel est le problème ?

Mais pourquoi les développeurs sont-il allés nous mettre du « OU » par défaut ? Le « ET » semble pourtant s’être imposé comme la norme à peu près partout sur Internet et c’est heureux : il faut bien faire ressortir ce qui répond le mieux à une recherche parmi des milliards de pages ; et, surtout, le « ET » est l’opérateur qui correspond le plus au langage naturel. En effet, si j’associe deux termes ou plus, ce n’est pas un hasard : faire une recherche sur les voitures rouges ce n’est pas faire une recherche sur les voitures en général ou sur la couleur rouge…

Je partage pleinement la conclusion :

Côté enseigne commerciale, j’y vois plutôt la volonté de mettre en avant l’abondance, comme si l’affichage de rayons bien remplis était un signe de bonne santé économique… ou l’illusion d’un choix dont le client n’a la plupart du temps que faire. Une logique sans doute valable pour acheter une télé ou un lecteur MP3 mais complètement hors de propos dans le cas d’un livre ou d’un disque. Quel est l’intérêt de comparer des livres entre eux, selon des critères qui en plus sont totalement inadaptés ? L’écrit, tout comme l’image et le son, est donc devenu un « produit culturel » comme les autres…

Développeurs, commerçants en ligne, laissez le OU à sa place, c’est-à-dire dans la recherche avancée (qui n’existe d’ailleurs pas sur le site dont il a été question plus haut). Libérez le ET et ne craignez pas la réaction de l’internaute qui ne voit qu’un ou deux résultats à sa recherche. Il sera au contraire ravi d’une réponse aussi ciblée, signe de la performance du site interrogé…




Related Posts with Thumbnails

If you enjoyed this post, make sure you subscribe to my RSS feed!

Cette oeuvre, sauf mention contraire expresse, est publié sous licence Creative Commons Attribution-ShareAlike 3.0 France Licence.

Tags:
  • Filca

    Le billet est effectivement intéressant. Cependant, Google et Exalead (pour ne citer qu’eux) utilisent explicitement le « et » par défaut.

  • http://lahary.wordpress.com Dominique lahary

    Oui bien sûr Google et Exalead utilisent le ET par défaut. Quant Google est apparu ce fut la 1e qualité qui m’a frappé. Mais je continue à pester contre ce OU imbécile. C’était le cas de l’annuaire sur Minitel et c’est toujours le cas des pages jaunes et blanches sur le Net. Totalement contreproductif. Quant aux moteurs internes des sites, ils ont souvent ce OU implicite.

    • Filca

      C’est pourquoi je les utilise quasiment jamais ! :)

  • http://hachis.viabloga.com/ François Parmentier

    Oui, c’est par peur que la quantité de documents indexés ne soit pas suffisante pour que le ET content le (re)chercheur.
    Ceci dit, la version 1.4 de DSpace configurait Lucene avec un OU par défaut (qu’il nous a fallu changer, en pestant) et imbécile.

    • http://www.bibliobsession.net bibliobsession

      Tiens merci c’est intéressant de voir que la raison évoquée pour le OU par défaut est de perdre en pertinence pour éviter le silence et donc favoriser la sérendipité (c une raison valable mais ça change pas le fait qu’il faille proscrire ces pratiques).

  • arnaud

    Je peux comprendre vos demandes, mais comme vous le savez les moteurs de recherche actuels ne sont plus booléen mais vectoriels ou probabilistes. En fait, cela revient à faire du OU qui rank optimalement le ET lorsque c’est le cas. Bien entendu on peu les configurer pour faire du ET par défaut, ou pour l’utilisateur connaitre la syntaxe du moteur pour faire explicitement du ET. Ce n’est pas sans raison que ces moteurs de recherche ce sont imposés, car plus pertinent du point de vu de la plupart des utilisateurs. Mais je suis d’accord avec vous les utilisateurs détestent le silence des moteurs de recherche. Mais finalement, tout dépend de la tâche à réaliser et des données à indexer.

  • http://traducteurpro.wordpress.com adam traducteur

    Bonjour,
    le sujet est fort intéressant mais cette question du OU et ET passe bien au dessus de la majorité des internautes qui pensent que le moteur peut faire tout le travail à leur place. Trop de gens se figurent que la machine TROUVERA à leur place alors qu’il ne s’agit que d’outils de RECHERCHE.

  • http://benoit.roucou.fr/blog_risu/ Risu

    Comme le dit Arnaud, l’intérêt des Google et consorts c’est qu’ils gèrent le Et et le Ou, plaçant les résultats du premier vers le haut. C’est vers cela qu’il faut aller dans nos interfaces de recherche, vers ces affichages par pertinence (et faire disparaitre nos affichages par ordre alphabétique).

Bibliobsession © 2013 All Rights Reserved

Designed by WPSHOWER

Powered by WordPress