mercredi 27 juillet 2016

Support des écrans (très) larges

Affichage en colonnes

Cela fait quelques années que les navigateurs permettent un affichage en colonnes. De plus, les écrans larges disponibles aujourd'hui permettent d'afficher plus d'informations, offrant un meilleur confort d'utilisation.

En combinant ces deux avancées, Etaamb affiche désormais, si l'espace disponible le permet, les textes en plusieurs colonnes, pour une plus grande facilité d'utilisation:

Affichage en plein écran 21:9, 3440x1440

Bientôt 6 ans

Etaamb est disponible depuis bientôt 6 ans (ayant été lancé le 2 août 2010), bien que ces 5 dernières années n'ont vu que peu d'évolutions.

Le nombre de visites n'a cependant cessé de croître, atteignant régulièrement les 50.000 par mois (plus de 2.000 par jour, en fonction des périodes de l'année), ce qui a permis de le maintenir.

Cependant, son avenir toujours incertain: son auteur ayant d'autres tâches et responsabilités, sa continuité n'est toujours pas assurée.

jeudi 15 décembre 2011

C'est l'hiver

Mots-clés désactivés
Les mots-clés ont étés désactivés, suite à la charge de travail que leur gestion imposait sur le serveur, déjà fort sollicité.

Bien que plusieurs mécanismes de filtrage étaient en place afin de limiter leur nombre, il s'est avéré que le serveur n'a pas la capacité d'effectuer, en plus du reste, les nombreuses opérations nécessaires à les rendre un tant soit peu utiles.

Le principe n'est pas pour autant perdu: les efforts effectués et les concepts imaginés se retrouveront sans doute dans une forme ou une autre ailleurs.


Stagnation

S'ouvre maintenant une période de stagnation des possibilités offertes par Etaamb, dont le développement va plutôt s'orienter dans les prochains mois vers une amélioration de ce qui existe déjà.

Cela permettra un fonctionnement plus stable et cohérent (la plateforme peine toujours à servir des textes très longs), et peut-être de récupérer des ressources serveur si critiques.

Cette révision du code source de la plateforme lui donnera aussi plus de flexibilité afin d'acceuillir dans des conditions encore meilleures de futures extensions.


Visites
Etaamb vient de franchir, en novembre, le cap des 20.000 pages vues par mois pour plus de 10.000 visiteurs uniques.

Les récentes modifications des algorithmes d'indexation de Google ainsi que les efforts d'anonymisation d'Etaamb semblent avoir apportés des visiteurs en moyenne moins nombreux mais plus intéressés, qui poursuivent leur consultation ou qui reviennent par après sur le site.

Actuellement, le nombre de visiteurs uniques quotidiens approche le millier.


Avenir de la plateforme
De récents évènements, non liés à Etaamb, ont permis d'assurer encore une certaine continuité à la plateforme, en attendant que de réelles solutions à moyen et à long terme ne se dégagent.

vendredi 28 octobre 2011

Taxinomie dynamique et théorie des graphes

Une toute nouvelle fonctionnalité vient d'être ajoutée à Etaamb, qui sous ses airs innocents donne une toute nouvelle direction à la plateforme.


Il s'agit d'une petite et première étape, dont la mise en place fut néanmoins laborieuse: en partant d'une idée très ambitieuse et complexe (extraction d'expressions), elle à été itérativement affinée à sa plus simple expression (taxinomie par termes simples): des mots-clés.

Mots-Clés

Intitulé "Mots-clés" dans l'interface, semblables aux "Tags" ou encore "Marqueurs" dans d'autres domaines, il s'agit d'une taxinomie dynamique. Les mots sont extraits du texte, analysés, comparés, puis attribués.

Elle est dynamique car chaque nouveau texte analysé à une influence, et aucune attribution n'est fixe: les mots-clés sont en relation les uns avec les autres, faisant apparaitre des structures relationnelles mouvantes entre les marqueurs ainsi qu'entre les textes.



Les possibilités qui en découlent

En appliquant plusieurs concepts sur ces réseaux de relations - tel que la théorie des graphes - des possibilités très intéressantes devient réalisables: une taxinomie par termes composés,  la définition de concepts autour des marqueurs-clés, l'attribution indirecte des marqueurs, etc...

Un véritable système de catégorisation pourrait ainsi en découler, bien qu'un tel système est bien loin de l'idéal qu'on pourrait s'en faire: il serait illusoire de vouloir le comparer à une classification organisée, réfléchie et humaine.

Cependant, en pré-digérant une partie du travail, les possibilités de consultation et de recherche par les utilisateurs s'élargissent, lui permettant d'être plus efficace. Cette recherche de l’efficacité de l'utilisateur constitue un des fondements de la plateforme.

 Un aspect assez prometteur, dont la faisabilité est tout sauf certaine, serait l'application en parallèle des théories relationnelles aux textes, permettant de concevoir un ensemble de textes centraux, fondateurs, et d'ainsi proposer un "guide de lecture" pour chaque concept/catégorie préalablement définie. Ce n'est pas de la science fiction, mais il est fort probable que les ressources dont dispose la plateforme soient trop limitées que pour y aboutir.



Côté technique

Techniquement Etaamb à subi plusieurs améliorations. Ainsi, quelques fonctionnalités auparavant écrites en PHP ont étés transférés en extensions, écrites en C.

Ce transfert vise une meilleure utilisation des ressources dont dispose la plate-forme, accélérant les traitements de pré-calcul et d'affichage.

D'autres améliorations concernent des optimisations des bases de données, de gestion d'erreurs et d'autres opérations de maintenance.



Avenir de la plateforme

Etaamb est un projet technique, une série d'expériences sur un contenu vaste et intéressant (le Moniteur Belge). Tant qu'il reste des concepts et théories à explorer (dont l'aspect mathématico-relationnel abstrait ci-dessus n'est qu'une partie), il est probable qu'elle dure.

Mais malgré cela des pistes de monétisation sont explorées, car tout cela à forcément un prix. Si de futures étapes veulent être franchies, les besoins en ressources nécessiteront forcément un effort financier plus important. Si rien n'aboutit dans ce sens, aucune garantie à long terme ne peut être donnée quant à la subsistance de la plate-forme.

jeudi 15 septembre 2011

L'abonnement via RSS

La plate-forme Etaamb propose désormais l'abonnement RSS aux sommaires du Moniteur Belge, dans les deux langues.

Bien qu'il s'agit encore d'une fonctionnalité en cours de développement, le service est d'ores et déjà utilisable.

Les flux, ainsi que quelques informations supplémentaires, sont disponibles sur cette page.

Really Simple Syndication

RSS est une méthode de syndication de contenu, tel qu'il en existe sur internet depuis 1999. Il permet à un logiciel, un agrégateur RSS, de suivre automatiquement la publication de nouveaux contenus sur les sites auquel il est abonné, évitant à l'utilisateur de se rendre sur le site concerné.

Elle prend tout son sens lorsqu'un utilisateur désire suivre plusieurs sources d'information, le permettant d'ainsi tout centraliser en un seul endroit, comme par exemple son client e-mail (la plupart des clients e-mail offrent des fonctionnalités d'agrégateurs RSS).

mardi 16 août 2011

Barre de recherche

La plate-forme Etaamb vient de se voir enrichi d'une barre de recherche.

Cette nouvelle fonctionnalité n'en est pas réellement une, car la recherche à proprement parler est effectuée par le moteur de recherche de Google, dans les limites du contenu proposé par le site.

Cette approche a comme avantage de ne pas demander de développement supplémentaire, permettant de se concentrer sur des fonctionnalités particulières plus intéressantes à la consultation et l'utilisation des textes.

Elle a par contre comme désavantage de dépendre de l'état de l'indexation du site par les services de Google.

samedi 13 août 2011

QR Code !

Voilà enfin une fonctionnalité qui me démangeait depuis l'adaptation d'Etaamb aux plateformes mobiles: la plate-forme intègre depuis aujourd'hui les codes QR (documentation).

Cet technologie, loin d'être récente et qui se répand lentement en Europe par le biais du marketing, permet à un utilisateur équipé d'un smartphone et de l'application idoine de scanner ce code-barres 2D et d'ouvrir ainsi la page internet qui y est encodée.

Dans le cas d'Etaamb, scanner le QR Code (sur écran ou imprimé sur papier) avec un smartphone ouvrira le document concerné dans ce dernier, pratique pour passer de l'ordinateur ou du papier au smartphone.

Par exemple, en scannant le code en haut à droite de ce message, votre appareil mobile ouvrira automatiquement la page suivante:
http://www.etaamb.be/fr/circulaire-du-27-octobre-2003_n2003000858.html


Au niveau des scanneurs QR gratuits, j'ai repéré une application iPhone et une autre pour Android. Les Codes QR fonctionnent bien sur également sur les tablettes équipées d'un capteur optique.

mardi 9 août 2011

Anonymisation automatisée

Le procédé d'anonymisation automatisée vient d'être activé.

Concrètement, les textes jusqu'à présent inaccessibles en raison de leur contenu sensible se voient filtrés par un algorithme qui reconnaît les mots ou séquences de mots qui peuvent correspondre à une donnée à caractère personnel.

A titre d'exemple, un échantillon de textes ainsi traités:

Le prochains développements relatifs à la protection de la vie privée viseront à étendre le champ d'application du filtrage ainsi qu'à en améliorer la qualité.

Techniquement
L'algorithme lui-même est au final remarquablement primitif dans son fonctionnement. Des approches complexes, basés sur des analyses statistiques et probabilistiques appliqués à la linguistique, étaient à l'étude mais se sont avérés au mieux équivalents à des méthodes plus naïves et bien plus rapides à mettre en application.

De plus, ce n'est pas l'algorithme lui-même mais son insertion dans la plate-forme qui demanda le plus d'efforts. Ceux-ci effectués, des raisonnements plus poussés de traitement du langage naturel permettront d'en augmenter la qualité.

Plusieurs procédés de contrôle permettent de vérifier l'application du filtrage afin d'éviter toute propagation préjudiciable. A la moindre défaillance, l'accès aux textes concernés est bloqué, et une système autonome, indépendant du site, veillera également à son bon fonctionnement.