jeudi 15 septembre 2011

L'abonnement via RSS

La plate-forme Etaamb propose désormais l'abonnement RSS aux sommaires du Moniteur Belge, dans les deux langues.

Bien qu'il s'agit encore d'une fonctionnalité en cours de développement, le service est d'ores et déjà utilisable.

Les flux, ainsi que quelques informations supplémentaires, sont disponibles sur cette page.

Really Simple Syndication

RSS est une méthode de syndication de contenu, tel qu'il en existe sur internet depuis 1999. Il permet à un logiciel, un agrégateur RSS, de suivre automatiquement la publication de nouveaux contenus sur les sites auquel il est abonné, évitant à l'utilisateur de se rendre sur le site concerné.

Elle prend tout son sens lorsqu'un utilisateur désire suivre plusieurs sources d'information, le permettant d'ainsi tout centraliser en un seul endroit, comme par exemple son client e-mail (la plupart des clients e-mail offrent des fonctionnalités d'agrégateurs RSS).

mardi 16 août 2011

Barre de recherche

La plate-forme Etaamb vient de se voir enrichi d'une barre de recherche.

Cette nouvelle fonctionnalité n'en est pas réellement une, car la recherche à proprement parler est effectuée par le moteur de recherche de Google, dans les limites du contenu proposé par le site.

Cette approche a comme avantage de ne pas demander de développement supplémentaire, permettant de se concentrer sur des fonctionnalités particulières plus intéressantes à la consultation et l'utilisation des textes.

Elle a par contre comme désavantage de dépendre de l'état de l'indexation du site par les services de Google.

samedi 13 août 2011

QR Code !

Voilà enfin une fonctionnalité qui me démangeait depuis l'adaptation d'Etaamb aux plateformes mobiles: la plate-forme intègre depuis aujourd'hui les codes QR (documentation).

Cet technologie, loin d'être récente et qui se répand lentement en Europe par le biais du marketing, permet à un utilisateur équipé d'un smartphone et de l'application idoine de scanner ce code-barres 2D et d'ouvrir ainsi la page internet qui y est encodée.

Dans le cas d'Etaamb, scanner le QR Code (sur écran ou imprimé sur papier) avec un smartphone ouvrira le document concerné dans ce dernier, pratique pour passer de l'ordinateur ou du papier au smartphone.

Par exemple, en scannant le code en haut à droite de ce message, votre appareil mobile ouvrira automatiquement la page suivante:
http://www.etaamb.be/fr/circulaire-du-27-octobre-2003_n2003000858.html


Au niveau des scanneurs QR gratuits, j'ai repéré une application iPhone et une autre pour Android. Les Codes QR fonctionnent bien sur également sur les tablettes équipées d'un capteur optique.

mardi 9 août 2011

Anonymisation automatisée

Le procédé d'anonymisation automatisée vient d'être activé.

Concrètement, les textes jusqu'à présent inaccessibles en raison de leur contenu sensible se voient filtrés par un algorithme qui reconnaît les mots ou séquences de mots qui peuvent correspondre à une donnée à caractère personnel.

A titre d'exemple, un échantillon de textes ainsi traités:

Le prochains développements relatifs à la protection de la vie privée viseront à étendre le champ d'application du filtrage ainsi qu'à en améliorer la qualité.

Techniquement
L'algorithme lui-même est au final remarquablement primitif dans son fonctionnement. Des approches complexes, basés sur des analyses statistiques et probabilistiques appliqués à la linguistique, étaient à l'étude mais se sont avérés au mieux équivalents à des méthodes plus naïves et bien plus rapides à mettre en application.

De plus, ce n'est pas l'algorithme lui-même mais son insertion dans la plate-forme qui demanda le plus d'efforts. Ceux-ci effectués, des raisonnements plus poussés de traitement du langage naturel permettront d'en augmenter la qualité.

Plusieurs procédés de contrôle permettent de vérifier l'application du filtrage afin d'éviter toute propagation préjudiciable. A la moindre défaillance, l'accès aux textes concernés est bloqué, et une système autonome, indépendant du site, veillera également à son bon fonctionnement.

mardi 19 juillet 2011

Vie privée & Anonymisation, 2ème.

Le procédé d'anonymisation automatisée est pleinement fonctionnel, et sera prochainement disponible.

Une fois mis en place, les documents actuellement indisponibles seront remis sur la plateforme, et son aire d'application sera également étendu progressivement à tout les textes pouvant contenir des données à caractère personnel.

En marge de ce procédé un formulaire de demande de retrait de données personnelles vient d'être ajouté (sous l'onglet "vie privée"), pour les cas ou un document n'aurait pas encore été répertorié comme contenant des données à caractère personnel.

Les autres développements sont évidemment ralentis par cette évolution du site, bien qu'extrêmement intéressante et avant tout importante, car du succès de cette étape dépend sans doute la suite du projet.

vendredi 10 juin 2011

Etaamb sur petits écrans

Le site etaamb.be a été adapté pour smartphone (baptisé "ordiphone" en français contemporain).

Les divers contenus ont été replacés et redimensionnés afin d'offrir une consultation plus aisée sur des écrans de taille réduite (moins de 480 pixels de large).

Mais le monde du smartphone est particulier, et vu la grande variété de plateformes et la diversité plus grande encore de leur navigateurs internet - chacun avec ses particularités et incompatibilités (on se croirait revenu fin des années '90) - , il est impossible de garantir une même expérience d'utilisation sur chaque plateforme sans y consacrer d'énormes efforts. Selon l'ordiphone utilisé, Etaamb peut donc varier, voir sembler inadapté.

Etaamb a été testée sur iOS4 (iPhone) et Android 2.2. Et encore, il n'y est pas tout à fait identique, les propriétaires d'iPhone ne verront par exemple pas la flêche permettant de remonter d'un coup en tête de page (mais il leur est possible de le faire d'un seul geste).

Le site peut aussi être visualisé sous les deux orientations, portrait et paysage. Le mode portrait convient dans ce cas mieux à la navigation (profitant de la verticalité pour afficher plus d'informations, de contexte), et le mode paysage, de par son léger effet d'agrandissement, semble plus confortable pour la lecture des textes.

Pour un aperçu, de décembre 2010, du paysage des navigateurs des "ordiphones":
http://www.alistapart.com/articles/smartphone-browser-landscape/

Problèmes à prévoir
Mais tout n'est pas rose dans le monde du développement internet. Il se peut que certains navigateurs ne sachent différencier l'affichage pour ordiphones de celui prévu pour écrans, voir n'affichent que le contenu textuel.

Internet Explorer (l'éternel) en souffrait, mais un correctif spécifique a déjà été mis en place.

D'autres navigateurs, et sans doute des version plus anciennes, pourraient également souffrir de cette mise à jour.

mardi 7 juin 2011

Vie privée & Anonymisation

Tous les documents (quelques milliers) pouvant contenir des informations sensibles pouvant porter atteinte à la vie privée ont étés rendus temporairement inaccessibles sur Etaamb.

Temporairement ?

Oui, le temps de développer un procédé automatisé d'anonymisation desdits textes.

Etaamb est un exercice technique, et ce développement imprévu constitue un défi intéressant. Après les procédés de data mining (exploration de données) c'est désormais autour du npl (Natural Language Processing - Traitement automatique du langage naturel) que le développement d'Etaamb va s'articuler.

Une fois que celui-ci sera fonctionnel et offrira le résultat recherché, les textes concernés pourront alors à nouveau être consultés, intégralement anonymisés.