mardi 16 août 2011

Barre de recherche

La plate-forme Etaamb vient de se voir enrichi d'une barre de recherche.

Cette nouvelle fonctionnalité n'en est pas réellement une, car la recherche à proprement parler est effectuée par le moteur de recherche de Google, dans les limites du contenu proposé par le site.

Cette approche a comme avantage de ne pas demander de développement supplémentaire, permettant de se concentrer sur des fonctionnalités particulières plus intéressantes à la consultation et l'utilisation des textes.

Elle a par contre comme désavantage de dépendre de l'état de l'indexation du site par les services de Google.

samedi 13 août 2011

QR Code !

Voilà enfin une fonctionnalité qui me démangeait depuis l'adaptation d'Etaamb aux plateformes mobiles: la plate-forme intègre depuis aujourd'hui les codes QR (documentation).

Cet technologie, loin d'être récente et qui se répand lentement en Europe par le biais du marketing, permet à un utilisateur équipé d'un smartphone et de l'application idoine de scanner ce code-barres 2D et d'ouvrir ainsi la page internet qui y est encodée.

Dans le cas d'Etaamb, scanner le QR Code (sur écran ou imprimé sur papier) avec un smartphone ouvrira le document concerné dans ce dernier, pratique pour passer de l'ordinateur ou du papier au smartphone.

Par exemple, en scannant le code en haut à droite de ce message, votre appareil mobile ouvrira automatiquement la page suivante:
http://www.etaamb.be/fr/circulaire-du-27-octobre-2003_n2003000858.html


Au niveau des scanneurs QR gratuits, j'ai repéré une application iPhone et une autre pour Android. Les Codes QR fonctionnent bien sur également sur les tablettes équipées d'un capteur optique.

mardi 9 août 2011

Anonymisation automatisée

Le procédé d'anonymisation automatisée vient d'être activé.

Concrètement, les textes jusqu'à présent inaccessibles en raison de leur contenu sensible se voient filtrés par un algorithme qui reconnaît les mots ou séquences de mots qui peuvent correspondre à une donnée à caractère personnel.

A titre d'exemple, un échantillon de textes ainsi traités:

Le prochains développements relatifs à la protection de la vie privée viseront à étendre le champ d'application du filtrage ainsi qu'à en améliorer la qualité.

Techniquement
L'algorithme lui-même est au final remarquablement primitif dans son fonctionnement. Des approches complexes, basés sur des analyses statistiques et probabilistiques appliqués à la linguistique, étaient à l'étude mais se sont avérés au mieux équivalents à des méthodes plus naïves et bien plus rapides à mettre en application.

De plus, ce n'est pas l'algorithme lui-même mais son insertion dans la plate-forme qui demanda le plus d'efforts. Ceux-ci effectués, des raisonnements plus poussés de traitement du langage naturel permettront d'en augmenter la qualité.

Plusieurs procédés de contrôle permettent de vérifier l'application du filtrage afin d'éviter toute propagation préjudiciable. A la moindre défaillance, l'accès aux textes concernés est bloqué, et une système autonome, indépendant du site, veillera également à son bon fonctionnement.