Auteur :
Huot
Charles,
Coupet
Pascal
Type : Article
Thème : Outils de traitement des informations
Les évènements dramatiques du 11 septembre 2001 ont forcé les gouvernements et notamment le gouvernement Américain à renforcer ses investissements dans les logiciels de traitement automatique du langage à des fins d’intelligence et de contre terrorisme.
Le Text Mining fait appel à diverses méthodes d’analyse, comme la linguistique, la classification automatique ou la catégorisation. L’application de ces méthodes, nécessite en fonction du type d’indicateur que l’on souhaite mettre en place, une plus ou moins grande connaissance formalisée du domaine couvert par les documents à analyser.
Nous présenterons dans cet article, la combinaison de 2 méthodes, l’analyse linguistique de
l’Arabe et la classification automatique. L’objectif est de mettre en place une chaîne de traitement capable d’analyser de manière automatique des textes en langue Arabe en provenance de sources ouvertes.