Retour à la liste de résultats

Une méthode d'indexation sémantique adaptée aux corpus multilingues

Auteur : Roussey Catherine
Collectivite Auteur : LISI de l'INSA de Lyon.
Date de publication : 09/12/2001
Année de Publication : 0
Type : Thèse / Mémoire
Thème : Indexation
Couverture : France
Langue : FR

Résumé/Extrait :

Ces travaux de thèse s'inscrivent dans la problèmatique générale liée a l'indexation d'un corpus de texte pour la recherche d'information multilingue. Le but de l'indexation est d'identifier la connaissance contenue dans un texte et de la représenter par des mots clés appelés descripteurs. Or, la composante multilingue ajoute une complexité supplémentaire au processus d'indexation car une étape de traduction est obligatoire pour représenter document et requête par des descripteurs appartenant au même espace d'indexation. Pour traduire correctement un terme, it est préférable de reconnaître le concept dénoté par celui-ci. Actuellement, une recherche d'information pertinente représente le contenu des documents par des concepts et non plus par des termes.

Cette thèse propose une methode d'indexation semantique pour les documents XML permettant de caracteriser le contenu documentaire par des connaissances, non dependante de la langue des documents. Ces connaissances sont declinees en deux types :

– Les connaissances du domaine sont utilisées pour représenter les documents et les requétes dans le méme espace de représentation non dépendant des langues.

– Les connaissances terminologiques constituent plusieurs langages de présentation des connaissances du domaine.

Notre méthode d'indexation se veut générique car elle peut être utilisée aussi bien dans un système de recherche d'information multilingue que dans un hypertexte a base de connaissances.

Traduire le résumé vers :
Recherche

Recherche

Recherche avancée
Navigation par

Navigation par :

Filtrer votre recherche

Sélectioner un domaine *

Sélectionner une thematique

Sélectionner une rubrique

*Champs obligatoires
Chercher sur Abhatoo avec Google :