Auteur :
Tannier
X .
Année de Publication :
2006
Type : Rapport
Thème : Structure des données et des métadonnées
Sommaire :
1 Les documents semi-structurées
1.1 Le langage XML
1.2 Du document plat au document structuré
1.3 La sémantique du balisage
1.3.1 Généralités
1.3.2 Balises dures, balises de saut, balises transparentes
2 Recherche d'information et structure
2.1 Introduction
2.2 Les spécificités de la recherche d'information semi-structurée
2.2.1 L'unité d'information pertinente
2.2.2 Recherche sur contenu et structure
2.2.3 Interprétation de la requête
2.2.4 Bilan
2.3 Indexation
2.3.1 Pondération des termes
2.3.2 Indexer le contenu et la structure
2.4 Interrogation
2.4.1 Modèles traditionnels
2.4.2 Les langages de requêtes
2.4.2.1 XPath
2.4.2.2 NEXI
2.4.3 Le traitement des requêtes
2.4.3.1 Extension des modèles traditionnels
2.4.3.2 Le système GPX
2.5 Évaluation
2.5.1 L'évaluation ou la dictature de l'humain
2.5.2 Mesures d'évaluation des systèmes classiques
2.5.3 Mesures d'évaluation des systèmes de RI structurée
2.5.4 La campagne d'évaluation INEX
2.5.4.1 Les documents utilisés par INEX en 2005
2.5.4.2 Les requêtes
2.5.4.3 Les jugements de pertinence
2.5.4.4 Les métriques d'évaluation
2.5.4.5 Les différentes tâches