Retour à la liste de résultats

Clusterisation du Web en vue d’extraction de corpus homogènes

Auteur : Prime-Claverie Camille Beigbeder Michel Lafouge Thierry
Collectivite Auteur : RIM, Ecole Nationale Supérieure des Mines de Saint Etienne RECODOC, Université Claude Bernard Lyon 1
Date de publication : 31/12/2004
Année de Publication : 0
Type : Article
Thème : Outils de traitement des informations
Couverture : Suisse

Résumé/Sommaire :

Les ressources disponibles sur le Web sont de plus en plus diverses aussi bien d’un point de vue thématique, qu’au niveau de leur type, de leur origine géographique, etc. Cependant, les outils de recherche ne prennent pas en compte cette hétérogénéité et ne proposent qu’un accès par mots-clés aux documents du web. Cet article présente une méthode basée sur les hyperliens, permettant d’extraire du graphe Web des sous-corpus de documents homogènes. L’expérience décrite ici utilise la méthode des co-citations et s’intéresse plus spécialement à la notion de genre (type) de document web.
Traduire le résumé vers :
Recherche

Recherche

Recherche avancée
Navigation par

Navigation par :

Filtrer votre recherche

Sélectioner un domaine *

Sélectionner une thematique

Sélectionner une rubrique

Sélectionner une sous-rubrique

*Champs obligatoires
Chercher sur Abhatoo avec Google :