Abhatoo - Centre Nationale de Documentation

Accueil >
Maalama Textuelle >
Sciences de l'info... >
Recherche, diffusi... >
Sructure des donné... >
Classification de documents XML à partir d’une représentation linéaire des arbres de ces documents

Classification de documents XML à partir d’une représentation linéaire des arbres de ces documents

Auteur : Vercoustre Anne-Marie, Fegas Mounir, Lechevallier Yves ...[et al.]
Année de Publication : 2006
Type : Article
Thème : Structure des données et des métadonnées
Couverture : France

URL Article :

https://hal.archives-ouvertes.fr/inria-00000840/document

URL Source :

https://hal.archives-ouvertes.fr

Télécharger le document :

(437,31 kB) Classification de documents XML à partir d’une représentation linéaire des arbres de ces documents.pdf

Résumé/Sommaire :

Cet article présente un nouveau modèle de représentation pour la classification de documents XML. Notre approche permet de prendre en compte soit la structure seule, soit la structure et le contenu de ces documents. L’idée est de représenter un document par l’ensemble des sous-chemins de l’arbre XML de longueur comprise entre n et m, deux valeurs fixées a priori. Ces chemins sont ensuite considérés comme de simples mots sur lesquels on peut appliquer des méthodes standards de classification, par exemple K-means.
Nous évaluons notre méthode sur deux collections : la collection INEX et les rapports d’activité de l’INRIA. Nous utilisons un ensemble de mesures bien connues dans le domaine de la recherche d’information lorsque les classes sont connues a priori. Lorsqu’elles ne sont pas connues, nous proposons une analyse qualitative des résultats qui s’appuie sur les mots (chemins) les plus caractéristiques des classes générées.

Traduire le résumé vers :

Filtrer votre recherche

Sélectioner un domaine *

Développement durable
Développement économique et social
Sciences de l'information
Sciences et technologies

Sélectionner une thematique

thématique

Sélectionner une rubrique

sthematique

*Champs obligatoires

Chercher sur Abhatoo avec Google :