Plusieurs point ont étés adressés par la dernière mise à jour:
Extraction de liens:
L'algorithme d'extraction de liens à encore été sensiblement amélioré.
Pour exemple:
http://nl.etaamb.be/koninklijk-besluit-van-27-november-1998_n1998003608.html
Dans ce texte néerlandophone, Etaamb avait jusqu'à présent un peu de peine à trouver l'arrêté royal du 8 octobre 1998 mentionné par le texte, et en proposait 45. Désormais, il en propose un seul, le bon.
Précalcul:
Cette amélioration de la pertinence des liens extraits ne s'est pas faite sans quelques sacrifices au niveau de la performance de rendu d'Etaamb.
Désormais, les textes peuvent être pré-analysés afin d'accélérer le fonctionnement d'Etaamb.
Miscellanées:
A divers endroits, l'affichage du pied de page, de la barre d'adresse, du titre de la page ont subis quelques petites modifications. De même, certains documents très anciens peuvent apparaitre dans la liste des documents (le document le plus ancien de la version en ligne du Moniteur Belge à été promulgué en 1803), souvent dans le cadre d'une coordination en langue allemande.
http://fr.etaamb.be/loi-du-_n2009000678.html
lundi 18 avril 2011
lundi 28 mars 2011
Pas à pas.
Les liens intégrés au texte viennent de voir le jour suite à une mise à jour d'Etaamb.
Seulement, il ne s'agit pas de liens directs, mais plutôt de cadres qui reprennent les liens déjà proposés. L'amélioration s'inscrit donc dans la facilité d'utilisation et de consultation du texte.
Exemple:
http://www.etaamb.be/arrete-royal-du-07-fevrier-2002_n2002009044.html
(Ce texte est assez particulier: il propose 3 arrêtés royaux du même jour. Etaamb réussit à ne proposer que les 3 arrêtés visés, des 5 publiés ce jour-là).
Au passage, la vitesse de rendu à encore été améliorée, certains textes pouvant être très lourds à traiter. Etaamb se dirige progressivement vers une précalculation du contenu.
Exemple de page au traitement conséquent (typique de la législation de fin d'année civile):
http://www.etaamb.be/loi-du-29-decembre-2010_n2010021133.html
Seulement, il ne s'agit pas de liens directs, mais plutôt de cadres qui reprennent les liens déjà proposés. L'amélioration s'inscrit donc dans la facilité d'utilisation et de consultation du texte.
Exemple:
http://www.etaamb.be/arrete-royal-du-07-fevrier-2002_n2002009044.html
(Ce texte est assez particulier: il propose 3 arrêtés royaux du même jour. Etaamb réussit à ne proposer que les 3 arrêtés visés, des 5 publiés ce jour-là).
Au passage, la vitesse de rendu à encore été améliorée, certains textes pouvant être très lourds à traiter. Etaamb se dirige progressivement vers une précalculation du contenu.
Exemple de page au traitement conséquent (typique de la législation de fin d'année civile):
http://www.etaamb.be/loi-du-29-decembre-2010_n2010021133.html
samedi 19 mars 2011
Correction & amélioration
Une des fonctionnalités particulières d'Etaamb est d'extraire les références vers d'autres documents du texte visualisé.
Récemment, cette fonctionnalité fut mis à mal par quelques erreurs introduites lors de l'ajout massif de contenu dernièrement effectué. Le nombre de références extractibles fut réduit.
Les données erronées sont en cours de traitement, et cette réparation à même provoqué la mise à disposition de nouveaux algorithmes d'extraction de références, bien plus performants:
Non seulement les liens extraits seront plus nombreux, mais ils seront d'une bien meilleure qualité: dans l'immense majorité des cas testés, le premier lien proposé fut le bon.
Dans certains cas, Etaamb réussit l'exploit de ne proposer qu'un seul document par référence détectée:
http://fr.etaamb.be/loi-du-16-mars-2007_n2007011143.html
Vu les ressources informatique limitées dont dispose Etaamb, c'est assez édifiant. De plus, l'analyse en temps réel n'a encore qu'un impact minime sur la vitesse de rendu de la page, ouvrant la porte à d'autres améliorations.
Seuls inconvénients de cette mise à jour: les algorithmes sont encore à l'essai: ils peuvent porter atteinte à la stabilité de l'application, et nécessiterons encore quelques calibrages.
Récemment, cette fonctionnalité fut mis à mal par quelques erreurs introduites lors de l'ajout massif de contenu dernièrement effectué. Le nombre de références extractibles fut réduit.
Les données erronées sont en cours de traitement, et cette réparation à même provoqué la mise à disposition de nouveaux algorithmes d'extraction de références, bien plus performants:
Non seulement les liens extraits seront plus nombreux, mais ils seront d'une bien meilleure qualité: dans l'immense majorité des cas testés, le premier lien proposé fut le bon.
Dans certains cas, Etaamb réussit l'exploit de ne proposer qu'un seul document par référence détectée:
http://fr.etaamb.be/loi-du-16-mars-2007_n2007011143.html
Vu les ressources informatique limitées dont dispose Etaamb, c'est assez édifiant. De plus, l'analyse en temps réel n'a encore qu'un impact minime sur la vitesse de rendu de la page, ouvrant la porte à d'autres améliorations.
Seuls inconvénients de cette mise à jour: les algorithmes sont encore à l'essai: ils peuvent porter atteinte à la stabilité de l'application, et nécessiterons encore quelques calibrages.
vendredi 11 mars 2011
Contenu manquant
Il manquait jusqu'à présent une bonne partie du contenu du Moniteur Belge à Etaamb.
Tous les documents au type non clairement défini (issus du pouvoir judiciaire, des commissions, classements du Selor et autres communications diverses) n'étaient pas repris dans l'interface.
Ce contenu assez conséquent, représentant grossièrement la moitié des documents disponibles, est maintenant accessible, prêt pour indexation par les moteurs de recherche.
Plutôt que de les départager, ils sont repris sous le type "document":
http://fr.etaamb.be/2007/03/13.html#document
Tous les documents au type non clairement défini (issus du pouvoir judiciaire, des commissions, classements du Selor et autres communications diverses) n'étaient pas repris dans l'interface.
Ce contenu assez conséquent, représentant grossièrement la moitié des documents disponibles, est maintenant accessible, prêt pour indexation par les moteurs de recherche.
Plutôt que de les départager, ils sont repris sous le type "document":
http://fr.etaamb.be/2007/03/13.html#document
dimanche 6 février 2011
Amélioration.
Je parlais dans le précédent message de l'arrêté royal du 8 avril 2000, et comment celui-ci cite un autre arrêté royal du 22 juillet 1999.
http://fr.etaamb.be/arrete-royal-du-08-avril-2000_n2000021192.html
J'expliquais qu'Etaamb pouvait proposer une liste de 3 arrêtes royaux potentiels correspondant à l'A.R. du 22 juillet 1999.
Etaamb vient d'être légèrement amélioré pour qu'il puisse prendre en compte un peu de contexte, de façon à pouvoir filtrer les textes proposés.
Il en ressort qu'Etaamb est, dans beaucoup de cas (si le texte est cité avec assez de précision et présent dans la base de données), capable d'identifier précisément le texte cité.
Ainsi, dans l'arrêté royal du 8 avril 2000, Etaamb ne propose plus qu'un seul arrêté royal du 22 juillet 1999, celui spécifiquement visé par l'arrêté. Le mécanisme est bien sur perfectible, mais dans l'ensemble il fonctionne assez bien.
http://fr.etaamb.be/arrete-royal-du-08-avril-2000_n2000021192.html
J'expliquais qu'Etaamb pouvait proposer une liste de 3 arrêtes royaux potentiels correspondant à l'A.R. du 22 juillet 1999.
Etaamb vient d'être légèrement amélioré pour qu'il puisse prendre en compte un peu de contexte, de façon à pouvoir filtrer les textes proposés.
Il en ressort qu'Etaamb est, dans beaucoup de cas (si le texte est cité avec assez de précision et présent dans la base de données), capable d'identifier précisément le texte cité.
Ainsi, dans l'arrêté royal du 8 avril 2000, Etaamb ne propose plus qu'un seul arrêté royal du 22 juillet 1999, celui spécifiquement visé par l'arrêté. Le mécanisme est bien sur perfectible, mais dans l'ensemble il fonctionne assez bien.
dimanche 30 janvier 2011
Enfin quelque chose d'utile.
Un document sur Etaamb peut désormais proposer un lien vers un texte auquel il fait allusion.
Il ne s'agit que d'un premier essai de la technique, simple et primitive, qui à néanmoins une certaine efficacité. Elle pourrait être plus efficace avec plus de temps et de moyens, mais la raison d'être d'Etaamb est de lancer des idées, les essayer, plutôt que de les développer.
Concrètement, à la droite d'un document s'affiche maintenant une liste de textes dont Etaamb pense qu'ils pourraient être cités par le document visionné, sans vérification de pertinence (ne sont traités que le type de texte et sa date de promulgation).
Dans les faits, cela peut se présenter comme ceci:
http://fr.etaamb.be/arrete-royal-du-08-avril-2000_n2000021192.html
Le texte parle d'un arrêté royal du 22 juillet 1999; Etaamb présente une liste de tous les arrêtés royaux du 22 juillet 1999. Dans ce cas assez simple, c'est le troisième arrêté qui est visé par le texte.
Bien sur, dans d'autres cas tels que celui-ci:
http://fr.etaamb.be/loi-du-13-decembre-2010_n2010011511.html
La liste devient conséquente, et sans développer des critères plus avancés de pertinence, la fonctionnalité perd un peu de son intérêt.
Et forcément, le tout est limité aux textes publiés après Juin 1997, d'où l'absence caractéristique de la Loi du 4 août 1996 concernant le Conseil d'État, souvent citée mais absente de la base de données, contrairement à d'autres lois promulguées le 4 août 1996 mais publiées bien plus tard.
A titre d'illustration:
http://fr.etaamb.be/arrete-royal-du-15-mars-2000_n2000012080.html
Cependant, malgré les limites et obstacles, je pense qu'il s'agit d'une aide non négligeable à la consultation, et j'espère qu'elle n'en restera pas la seule.
Il ne s'agit que d'un premier essai de la technique, simple et primitive, qui à néanmoins une certaine efficacité. Elle pourrait être plus efficace avec plus de temps et de moyens, mais la raison d'être d'Etaamb est de lancer des idées, les essayer, plutôt que de les développer.
Concrètement, à la droite d'un document s'affiche maintenant une liste de textes dont Etaamb pense qu'ils pourraient être cités par le document visionné, sans vérification de pertinence (ne sont traités que le type de texte et sa date de promulgation).
Dans les faits, cela peut se présenter comme ceci:
http://fr.etaamb.be/arrete-royal-du-08-avril-2000_n2000021192.html
Le texte parle d'un arrêté royal du 22 juillet 1999; Etaamb présente une liste de tous les arrêtés royaux du 22 juillet 1999. Dans ce cas assez simple, c'est le troisième arrêté qui est visé par le texte.
Bien sur, dans d'autres cas tels que celui-ci:
http://fr.etaamb.be/loi-du-13-decembre-2010_n2010011511.html
La liste devient conséquente, et sans développer des critères plus avancés de pertinence, la fonctionnalité perd un peu de son intérêt.
Et forcément, le tout est limité aux textes publiés après Juin 1997, d'où l'absence caractéristique de la Loi du 4 août 1996 concernant le Conseil d'État, souvent citée mais absente de la base de données, contrairement à d'autres lois promulguées le 4 août 1996 mais publiées bien plus tard.
A titre d'illustration:
http://fr.etaamb.be/arrete-royal-du-15-mars-2000_n2000012080.html
Cependant, malgré les limites et obstacles, je pense qu'il s'agit d'une aide non négligeable à la consultation, et j'espère qu'elle n'en restera pas la seule.
jeudi 27 janvier 2011
Prochain chapitre
J'ai donné, depuis hier, une nouvelle direction à Etaamb.
C'est une toute nouvelle piste que j'essaye maintenant avec Etaamb. Plutôt que de développer un moteur de recherche spécifique, Etaamb offre un contenu optimisé pour les "spiders", les robots d'indexation des moteurs de recherche (ie. Google, Bing, ...).
L'aspect "moteur de recherche" ainsi délégué, Etaamb pourra se concentrer sur l'aspect consultation, utilisation. Un utilisateur devrait pouvoir, après une recherche sur un moteur de recherche majeur, trouver directement le document qu'il souhaite, sans avoir à parcourir le reste du site.
C'est une toute nouvelle piste que j'essaye maintenant avec Etaamb. Plutôt que de développer un moteur de recherche spécifique, Etaamb offre un contenu optimisé pour les "spiders", les robots d'indexation des moteurs de recherche (ie. Google, Bing, ...).
L'aspect "moteur de recherche" ainsi délégué, Etaamb pourra se concentrer sur l'aspect consultation, utilisation. Un utilisateur devrait pouvoir, après une recherche sur un moteur de recherche majeur, trouver directement le document qu'il souhaite, sans avoir à parcourir le reste du site.
Inscription à :
Articles (Atom)