Abhatoo - Centre Nationale de Documentation

Accueil >
Maalama Textuelle >
Sciences de l'info... >
Analyse de l'infor... >
Indexation >
Une approche linguistique et statistique pour l’analyse de l’information en corpus

Une approche linguistique et statistique pour l’analyse de l’information en corpus

Auteur : Toussaint Yannick, Namer Fiammetta, Daille Béatrice ...[et al.]
Date de publication : 12/06/1998
Type : Actes de congrès / Séminaire / Atelier
Thème : Indexation
Couverture : France

URL Article :

http://perso.limsi.fr/jacquemi/FTP/toussaintetal-TALN98.pdf

URL Source :

http://perso.limsi.fr

Télécharger le document :

(86,45 kB) Une approche linguistique et statistique pour l'analyse de l'information en corpus.pdf

Résumé/Sommaire :

Cet article présente une chaîne de traitement automatique réalisée dans le cadre du projet ILIAD (Informatique Linguistique et Infométrie pour l’Analyse de grands fonds Documentaires) du GIS Sciences de la Cognition. Cette chaîne est dédiée à l’analyse de l’information à partir de corpus de textes de très grand volume, en français. Elle est expérimentée sur un corpus de 2,5 Mb et a conduit à la création de 50 classes de termes. Ces classes sont construites sur la base de la cooccurrence des termes et représentent des connaissances du domaine. Les différentes étapes de la chaîne associent des méthodes linguistiques informatiques et des méthodes statistiques : pré-traitement des textes, étiquetage, morphologie, terminologie et analyse des documents. Pour chacune d’entre elles, nous présentons les méthodes, les outils ainsi que leur évaluation.

Traduire le résumé vers :

Filtrer votre recherche

Sélectioner un domaine *

Développement durable
Développement économique et social
Sciences de l'information
Sciences et technologies

Sélectionner une thematique

thématique

Sélectionner une rubrique

sthematique

*Champs obligatoires

Chercher sur Abhatoo avec Google :