Auteur :
Teisseire
Maguelonne
Delorme
Jean-Michel
Collectivite Auteur :
Cnam
Date de publication : 24/04/2002
Année de Publication :
0
Type : Rapport
Thème : Langage naturel et TALN (Traitement Automatique de la Langue Naturelle)
Table des matières 2
Introduction : 3
- Définition de la fouille de donnée. 3
- Les enjeux économiques 3
- Les moyens techniques et technologiques 4
- Problématique de l’analyse de texte. 4
Techniques de fouille : 5
- Objectifs 5
- Les méthodes utilisées 6
Typologie 6 Description de méthodes 7
- Synthèses 16
Techniques de l’analyse de texte 18
- Comment obtenir les mesures de similarité 18
Pré-traitements 19 Représentation et mesures de similarité 20
- Les traitements sur les textes 23
Regroupements 23 Règles d’association 24 Classification 24
- Synthèses 24
Conclusion : 26
- Les apports de la fouille de données dans l’analyse de texte 26
- Une adaptation possible des pré-traitements 26
Annexes : 27
- Glossaire 27
- Bibliographie 31