Articles étant taggés ‘web-sémantique’

Système de recherche et XML

Tim Bray du site OnGoing vient de publier un article sur les systèmes de recherche et la technologie XML : On Search: XML. Dans cet article, il est rappelé les vertus de l’XML en tant que technologie de gestion d’une couche sémantique ainsi que le potentiel d’un système de recherche basé sur les méta données par rapport à un système de recherche plain texte. Cependant, l’auteur se fait l’avocat du diable et précise deux inconvénients majeurs à l’utilisation d’XML :

  • Premièrement, les systèmes de recherche basés sur les méta données ne peuvent révéler leur potentiel que si les requêtes sont conformes à la sémantique utilisée par les méta données. En d’autres termes, si vous avez utilisé une liste de mots contrôlés ou un thesaurus pour décrire des ressources d’informations, vous devrez forcement utiliser ce même vocabulaire pour vos recherches.
  • Deuxièmement, la syntaxe même des recherche devra être très précise pour obtenir un résultat des plus efficace. Si vous deviez faire une recherche sur les mots ‘Utilisabilité’ ou ‘Architecture de l’information’ sur mon site, presque toutes les pages serait inclus dans les résultats. Il y a donc tout un travail à faire, soit en éduquant les utilisateur à bien structurer leurs équations de recherche soit en mettant au point un moteur de recherche en langage naturel suffisamment souple pour orienter les utilisateurs vers la bonne information. Vous par exemple qui lisez ces lignes, à quoi ressemblent vos équations de recherche sur Google ? Utilisez-vous les opérateurs booléens (+ – =) ? Utilisez vous les guillemets et autres options de recherche avancée ? N’oublions pas que les utilisateurs sont des fainéants et qu’ils n’aiment pas trop se creuser la tête. Pour la majeure partie d’entre eux les ordinateurs et l’Internet en général est un monde magique ou l’ordinateur doit être capable de satisfaire tous leurs besoins même s’ils sont mal formulés.
  • Enfin, l’utilisation d’XML et des méta données en général est très coûteuse : entre la mise en point d’une liste de mots clés ou d’un thesaurus, le marquage des sources d’informations (pages, documents…) avec les bonnes méta données, l’implémentation et le paramétrage de l’outils de recherche, l’addition est assez élevée pour peu que l’on veuille faire les choses correctement.

Bref, je vous recommande vivement cet article pour bien appréhender les enjeux des méta données, d’XML et des systèmes de recherche intelligents.

Meta-données et Dublin Core

Un très bon article vient de sortir sur Boxes And Arrows : 2003 Dublin Core Conference Summary. On y parle bien sûr de meta-données et de Dublin Core. Il est en ressort que si la norme DC a été adoptée par les professionnels du mode de la documentation et des sciences de l’information, son utilisation dans un contexte autre (comprenez par là en entreprise, où plus particulièrement dans les sites Web et les SI des entreprises) reste très marginale. Il est vrai qu’il n’existe pas moult solutions prêtes à l’emploi pour implémenter un couplet gestionnaire de meta-données / moteur de recherche sémantique.

Si vous souhaitez en savoir plus sur les meta-données, je vous recommande l’article de synthèse disponible sur OpenWeb : Métadonnées et Dublin Core. Il existe également le site iMotep qui dispose d’une section dédiée aux meta-données (aussi bien Dublin Core que des meta-données appliquées à un secteur d’activité en particulier, en l’occurrence TourinFrance pour le tourisme institutionnel. Sinon, vous pouvez toujours allez voir le code source de ma page d’accueil pour voir comment ça se présente.

Lancement officiel d’XForms

Suite à un pré-lancement en août dernier, le W3C vient de publier un communiqué de presse intitulé : La nouvelle génération de formulaires Web est prête à l’emploi, tout est dis, ou presque… Rappelons qu’XForms désigne un ensemble de recommandations sur l’utilisation de balises structurelles pour la conception de formulaires. Pour caricaturer, XForms est au formulaire ce que le XML est aux pages Web : Une révolution sémantique. En gros, XForms permet de créer des formulaires où modèle, données, et interface sont séparées. Pour plus d’informations, allez donc voir la page dédiée à ces recommandations.

Amazon en XML

Depuis peu, Amazon (que l’on ne présente plus) propose une version allégée de son interface entièrement générée à partir de fichiers XML. Le Look & Feel caractéristique du site s’en trouve très légèrement modifié, mais il faut avouer que le résultat est très prometteur et surtout encourageant pour le couple XSLT / CSS (qui permet de transformer des fichiers XML et HTML). Je ne sais pas pour vous, mais j’ai l’impression qu’Amazon va bientôt nous proposer une version Web Service tout comme Google avant lui.

Le Web sémantique en effervescence

Une actualité riche cette semaine dans le cadre du Web Sémantique, vous savez, l’utilisation d’une couche sémantique (meta-données) pour rendre le contenu plus intelligent et surtout réutilisable. Premièrement, la publication par le W3C d’un nouvel outil : OWL (Web Ontology Language, voir l’article du Journal du Net) dont la fonction première est de prendre en charge la couche sémantique de contenus au travers d’un système de classification et de catégories (une ontologie quoi !). J’ai du mal à comprendre comment cette nouvelle technologie va cohabiter avec les standards déjà existants (Dublin Core, RDF, Topic Maps…). Deuxièmement, le lancement par le consortium SWAD-Europe (la branche européenne de l’initiative Semantic Web du W3C) du TIF (Thesaurus Interchange Format) qui comme son nom l’indique permet de standardiser les thesaurus selon un schéma RDF pour les rendre inter-opérables. Voilà un projet qui me semble un peu plus concret. Dans tous les cas de figure, ça fait beaucoup de jargon et de termes compliqués, je vous recommande de jette un oeuil au glossaire présent sur mon site pour vous y retrouver.