dimanche 20 février 2011

Séquence 6 : la folksonomie

 Une fois n'est pas coutume, je délaisse un peu aujourd'hui les aspects pratiques du sujet pour m'intéresser davantage aux enjeux. Car la folksonomie n'est pas un sujet anodin, ni  (seulement) un gadget web 2.0 de plus. La folksonomie, ou taxonomie populaire (de folk : "peuple" et "taxonomie") désigne une pratique d'indexation collaborative par l'attribution de mots clés librement choisis. Ce processus est rendu possible par la plupart des applications du web social telles que Delicious, Youtube, Flickr, Furl, Technorati, les blogs, etc. Le résultat de ce processus  (les ensembles de tags -mots-clés- générés par ces applications ) est également désigné par le terme "folksonomie". On peut donc également parler de folksonomieS au pluriel, la diversité de ces taxonomies n'étant pas le plus petit défi pour la normalisation et le web sémantique.

 Cette pratique qui emprunte à la fois au web sémantique et au web social est à l'origine de l'émergence de ce qu'on appelle le web socio sémantique. Pour certains, les folksonomies sont en effet en train de devenir le chaînon manquant entre web social et web sémantique.


Puisque c'est un usage web 2.0, il va de soi que les folksonomies sont "user oriented" et "user driven". Le web sémantique lui, développe des systèmes d'indexation "machine oriented", puisqu'ils sont destinés à rendre intelligibles les contenus et  les relations entre ces contenus à la machine, même si en dernier ressort le but est d'améliorer les performances de la machine pour l'utilisateur. Le web socio sémantique est en revanche une approche résolument "humaine". Contrairement au web sémantique qui est constitué d'ontologies très formelles, puisque devant être comprises par la machine, le web socio sémantique développe des sortes d'ontologies semi-formelles, empiriques,  principalement à usage personnel. En d'autre termes, les folksonomies sont une approche bottom-up, les ontologies formelles une approche top-down.

Les folksonomies sont un défi pour la normalisation : elles ne sont, en effet, pas très interopérables. De fait, l'attribution d'un mot clé est une opération très subjective.  L'indexation par mots-clés est en outre horizontale ("flat taxonomy"). En effet, il n'y a pas de relation hiérarchique entre les tags, bien qu'une forme de hiérarchie élémentaire soit respectée spontanément par les utilisateurs, par exemple l'hyperonomie : un contenu traitant des loisirs en général a peu de chances d'être tagué  par l'hyponyme "pêche" ou "piano", par exemple. Mais on est loin de relations sémantiques et hiérarchiques élaborées. Il n'y a aucune gestion des synonymes ou de la polysémie, et aucun système de coordination du lexique utilisé. Ne parlons pas des conventions typographiques qui diffèrent selon l'application utilisée. Cette indexation horizontale et empirique manque donc cruellement de métadonnées exploitables par la machine pour être réellement efficace. 

A première vue, tout cela est donc un peu brouillon. La navigation par tags est aléatoire ; on la qualifie également d'opportuniste, ou de sérendipité. Mais la sérendipité, ou "fortuitude", si elle peut s'avérer productive en recherche où l'indice inattendu nous met parfois sur la voie d'une découverte, devient vite dans la blogosphère l'art de trouver l'information inutile que l'on ne cherchait pas...

On comprend au vu de toutes ces lacunes que la folksonomie soit souvent surnommée "lazy tagging". Du côté des ontologistes et des internautes lassés de l'information "sérendipiteuse" s'élèvent donc des voix pour dénoncer ce mode d'indexation comme une défaite de la connaissance, puisqu'il confond  popularité et pertinence de l'information, (ce qui est le plus vu est le plus tagué, et devient donc encore plus vu, ce qui ne veut pas dire que c'est le plus pertinent), et privilégie l'usage amateur au détriment des pratiques expertes, et donc au détriment de la qualité.

Pourtant, on ne peut pas dire que la folksonomie soit un échec. Elle fonctionne selon la loi  n°1 du web 2.0 : l'usage, et tend donc à s'autoréguler. Lorsqu'un nombre significatif d'utilisateurs s'accordent pour taguer un même contenu avec les mêmes mots clés, on observe une certaine stabilisation de la taxonomie. Les folksonomies offrent également une plus grande flexibilité que les ontologies formelles, dont le language, simple pour une machine, est complexe pour les utilisateurs.  

Il semblerait donc intéressant, plutôt que tout le monde apprenne à parler le langage de la machine, d'apprendre à la machine à parler celui de l'utilisateur...La logique veut bien sûr que  web sémantique et web socio sémantique finissent par se rejoindre. Une rencontre réussie pourrait créer un web sémantique puissant : à partir du moment où les ontologies formelles sont capables de prendre en compte les folksonomies, elles n'en sont que plus performantes. Plusieurs projets ont vu le jour pour tenter de dériver des ontologies à partir des folksonomies. Les approches diffèrent : Social Network Analysis est un projet visant à analyser les tags de la folksonomie de façon automatique pour les intégrer à des thésaurus en RDF/OWL. Une autre approche consisterait à avoir des spécialistes pour analyser manuellement les tags. Enfin, une dernière possibilité est de laisser les utilisateurs créer leur propre ontologie. 

Il est temps qu'institutions et experts s'intéressent au langage de l'utilisateur, sans quoi l'écart risque de se creuser entre, d'une part, l'indexation d'autorité, l'indexation compétente, de plus en plus inaccessible, et, d'autre part, une information indexée de façon médiocre par les utilisateurs. De plus en plus de bibliothèques, de musées, de bases de données scientifiques, commencent  par exemple à se pencher sur une indexation utilisateur et  reconnaissent l'importance d'être présents sur les sites de social bookmarking. Pour l'instant, on en est un peu au stade de l'observation...Le Metropolitan Museum of Art rapporte ainsi que "sur 30 oeuvres d'art indexées par les usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée."  

Une chose est sûre : plus machines, experts et utilisateurs parleront le même langage, plus le web sémantique sera puissant.



Pour en savoir plus :

Alexander Mikroyannidis, "Toward a Social Semantic Web," Computer, vol. 40, no. 11, pp. 113-115, Oct. 2007
Vers le Web Socio Sémantique : introduction aux ontologies sémiotiques, Manuel Zacklad 
Controlled natural language meets the semantic web
Indexation sociale et folksonomies : le monde comme catalogue. Présentation d'Olivier ERTZSCHEID. 
Article Social Semantic Web de Wikipédia
 Article Sérendipité de Wikipédia
 The need for creating tag standards

Aucun commentaire:

Enregistrer un commentaire

Sliderocket

 Bon je sais, je viens de poster un message pour vilipender Powerpoint, et Sliderocket, c'est du Powerpoint en ligne.  Tout de...