De la granularité de l’information

A une récente journée d’étude, a été employé ce chouette concept de "granularité de l’information". Alors qu’est-ce que la granularité de l’information?



Une définition moissonnée dans les champs du web:

Niveau de détails contenus dans une unité d‘information. Plus il y a de détails, plus bas sera le niveau de la granularité. Inversement, moins il ya de détails, plus haut sera le niveau de la granularité.

Je ne suis pas sûr que cette définition soit la meilleure (et je n’ai pas dictionnaire des sciences de l’information sous la main, mais n’hésitez pas, c’est disponible dans toutes les bonnes bibliothèques…;-))…en voici donc une autre,

La granularité de l’information, en s’appuyant sur la structure implicite ou explicite des documents, permet de manipuler l’information à différents niveaux de granularité en fonction des besoins de l’utilisateur.

ça me semble mieux, en tout cas plus clair puisqu’on a la notion de structure et de besoins des utilisateurs.

Une dernière définition plus conceptuelle montre que le concept porte aussi sur l’organisation des systèmes, comme c’est indiqué dans ce Dictionnaire des arts médiatiques (non non c’est pas une secte). Attention accrochez vous c’est tordu :


Degré d’interactivité d’un programme, représenté par la quantité de points décisionnels qu’il comporte. Un grain est en ce sens l’unité fondamentale d’interaction dans un programme interactif. Un programme interactif (hypertexte ou hypermédia) à granularité élevée comporte un grand nombre de points décisionnels, ce qui correspond à un réseau dense de relations entre les noeuds. Un programme interactif à granularité faible comporte peu de points décisionnels et présente un réseau plus clairsemé de relations entre les noeuds.


Bon ok à quoi ça sert? Et ben c’est un concept et donc ça sert à exprimer des idées. Par exemple, appliqué aux blogs, par Olivier Ertzscheid
voilà ce que ça donne :

La granularité de l’information sur laquelle les weblogs permettent de travailler dans une optique de réingénierie se décline selon deux axes :

         en termes de contenu tout d’abord : il est possible en sus des fils d’information standards fournis par les sites web, de mettre en place des filtres internes au contenu même du site. Le magazine américain « wired » propose ainsi de syndiquer uniquement les articles de l’éditorialiste Meg Ryan (spécialiste de la question des weblogs). Et cela est bien entendu possible pour d’autres éditorialistes et journalistes de Wired

         en terme de format ensuite, la plupart des sites proposant des contenus à syndiquer le font sous différentes options : syndication longue (contenu des billets postés), syndication courte (titre du billet seulement), syndication longue avec commentaires (tous les commentaires postés sont à leur tour syndiqués)

On comprend ainsi que la "granularité de l’information" permet d’exprimer le point d’où l’on se place pour structurer l’information en se posant la question du "niveau" ou du "grain" de l’unité de sens d’un document. En fait il s’agit de répondre à la question  : Qu’est-ce qu’on veut repérer et indexer, pour quels usages? (le paragraphe? le mot? le chapitre? le livre? etc.) C’est un concept qui est très utile aujourd’hui et qui peut également servir à déterminer la manière dont on peut pérénniser le document numérique, comme le souligne Figoblog.

En substance :

Granularité. Les identifiants doivent être applicables à n’importe quelle échelle de la ressource : la ressource elle-même mais aussi la collection dont elle fait partie, les articles qu’elle rassemble, et pourquoi pas, le paragraphe de l’article (ou le commentaire du billet), et également différentes versions d’une même ressource. Il faut donc définir les différents niveaux de granularité de l’information qui doivent être identifiés, et comment cela va se décliner dans le système d’identification : le choix peut aller de l’attribution d’identifiants complètement indépendants à chaque niveau, jusqu’à un système hiérarchisé qui reflète l’organisation de la collection.

(je suis pas un spécialiste des sciences de l’information, merci de le préciser dans les commentaires si ce que j’ai compris de ce concept vous semble inexact…)

Silvae

Je suis chargé de la médiation et des innovations numériques à la Bibliothèque Publique d’Information – Centre Pompidou à Paris. Bibliothécaire engagé pour la libre dissémination des savoirs, je suis co-fondateur du collectif SavoirsCom1 – Politiques des Biens communs de la connaissance. Formateur sur les impacts du numériques dans le secteur culturel Les billets que j'écris et ma veille n'engagent en rien mon employeur, sauf précision explicite.

3 réponses

  1. Dalb dit :

    On est encore au stade de la granularité du *document* avec collection/livre/chapitre ; dans l’audiovisuel, le grain peut être une séquence de qq secondes, un plan. On va plus loin avec le noeud d’un hypertexte qui peut être un mot dans une phrase. J’aime bien aussi l’exemple du PV d’un Conseil municipal : un beau document d’un seul tenant constitué d’un nombre important de points traités ce jour-là. Si vous voulez suivre les questions de voiries (au hasard), il faut tout passer en revue ou tout recevoir. Un petit fil uniquement sur ce thème….Structurer et même saucisonner le document…SD

  1. 27 novembre 2009

    […] pas de réponses toutes faites à ces questions qui dépendent de la manière dont on souhaite granulariser ce dispositif de médiation (ouais je jargonne, une fois n’est pas […]

  2. 29 janvier 2010

    […] marque-page pour les livres. C’est chose faite avec celui-ci qui en plus de marquer la page, descend d’un niveau de granularité et indique la ligne et le paragraphe. Il fallait juste y penser […]