vendredi 28 octobre 2011

Taxinomie dynamique et théorie des graphes

Une toute nouvelle fonctionnalité vient d'être ajoutée à Etaamb, qui sous ses airs innocents donne une toute nouvelle direction à la plateforme.


Il s'agit d'une petite et première étape, dont la mise en place fut néanmoins laborieuse: en partant d'une idée très ambitieuse et complexe (extraction d'expressions), elle à été itérativement affinée à sa plus simple expression (taxinomie par termes simples): des mots-clés.

Mots-Clés

Intitulé "Mots-clés" dans l'interface, semblables aux "Tags" ou encore "Marqueurs" dans d'autres domaines, il s'agit d'une taxinomie dynamique. Les mots sont extraits du texte, analysés, comparés, puis attribués.

Elle est dynamique car chaque nouveau texte analysé à une influence, et aucune attribution n'est fixe: les mots-clés sont en relation les uns avec les autres, faisant apparaitre des structures relationnelles mouvantes entre les marqueurs ainsi qu'entre les textes.



Les possibilités qui en découlent

En appliquant plusieurs concepts sur ces réseaux de relations - tel que la théorie des graphes - des possibilités très intéressantes devient réalisables: une taxinomie par termes composés,  la définition de concepts autour des marqueurs-clés, l'attribution indirecte des marqueurs, etc...

Un véritable système de catégorisation pourrait ainsi en découler, bien qu'un tel système est bien loin de l'idéal qu'on pourrait s'en faire: il serait illusoire de vouloir le comparer à une classification organisée, réfléchie et humaine.

Cependant, en pré-digérant une partie du travail, les possibilités de consultation et de recherche par les utilisateurs s'élargissent, lui permettant d'être plus efficace. Cette recherche de l’efficacité de l'utilisateur constitue un des fondements de la plateforme.

 Un aspect assez prometteur, dont la faisabilité est tout sauf certaine, serait l'application en parallèle des théories relationnelles aux textes, permettant de concevoir un ensemble de textes centraux, fondateurs, et d'ainsi proposer un "guide de lecture" pour chaque concept/catégorie préalablement définie. Ce n'est pas de la science fiction, mais il est fort probable que les ressources dont dispose la plateforme soient trop limitées que pour y aboutir.



Côté technique

Techniquement Etaamb à subi plusieurs améliorations. Ainsi, quelques fonctionnalités auparavant écrites en PHP ont étés transférés en extensions, écrites en C.

Ce transfert vise une meilleure utilisation des ressources dont dispose la plate-forme, accélérant les traitements de pré-calcul et d'affichage.

D'autres améliorations concernent des optimisations des bases de données, de gestion d'erreurs et d'autres opérations de maintenance.



Avenir de la plateforme

Etaamb est un projet technique, une série d'expériences sur un contenu vaste et intéressant (le Moniteur Belge). Tant qu'il reste des concepts et théories à explorer (dont l'aspect mathématico-relationnel abstrait ci-dessus n'est qu'une partie), il est probable qu'elle dure.

Mais malgré cela des pistes de monétisation sont explorées, car tout cela à forcément un prix. Si de futures étapes veulent être franchies, les besoins en ressources nécessiteront forcément un effort financier plus important. Si rien n'aboutit dans ce sens, aucune garantie à long terme ne peut être donnée quant à la subsistance de la plate-forme.

Aucun commentaire:

Enregistrer un commentaire