Auteur :
Jacquenet
François,
Largeron
Christine,
Chapaux
Stéphanie
Type : Article
Thème : Outils de traitement des informations
Le domaine de la veille technologique vise à récolter, traiter, et analyser des informations scientifiques et techniques utiles aux acteurs économiques. Dans cet article, nous proposons d’utiliser des techniques de fouille de textes pour automatiser le processus de traitement des données issues de bases de textes scientifiques. Toutefois, la veille introduit une difficulté inhabituelle par rapport aux domaines d’application classiques des techniques de fouille de textes, puisqu’au lieu de rechercher de la connaissance fréquente cachée dans les données, il faut rechercher de la connaissance inattendue. Les mesures usuelles d’extraction de la connaissance à partir de textes doivent de ce fait être revues. Pour ce faire, nous avons développé le système UnexpectedMiner dans lequel de nouvelles mesures permettent d’estimer le caractère inattendu d’un document. Notre système est évaluè sur une base de résumés d’articles dans le domaine de l’apprentissage automatique.