Auteur :
Coupet
Pascal,
Buschbeck
Bianka,
Six
Amandine
...[et al.]
Type : Article
Thème : Intelligence économique
Couverture : France
Le text mining a démontré depuis quelques années son efficacité dans la génération de valeur ajoutée lors de l’analyse automatique de flux de presse économique. Dans la majorité des cas, ces flux de presse sont monolingues. Les règles d’extraction d’information ainsi que les lexiques utilisés sont le plus souvent dépendants de la langue que l’on souhaite analyser.
Nous présentons dans cet article les réalisations de la société TEMIS, ainsi que le modèle que nous avons développé et mis en place afin d’analyser la façon homogène des flux de presse économique en 5 langues. Nous présenterons notamment la technologie dite des cartouches de connaissances TM ou skill cartridges TM qui permet ce nouveau type d’extraction multilingue. A titre d’exemple, nous présenterons les résultats obtenus sur l’analayse d’un corpus en Français, Anglais, Espagnol, Italien et Allemand.