Retour à la liste de résultats
L'indexation conceptuelle de documents multilingues et multimédias
Auteur :
Hermes
Mumis
Année de Publication :
0
Type : Chapître / Extrait
Thème : Indexation
Résumé/Sommaire :
Cet article décrit le rôle que peut jouer le traitement automatique du langage (TAL) pour l'indexation conceptuelle de documents multimédias et multilingues, et ainsi permettre une recherche intelligente au sein d'archives digitales de tels documents. Nous allons ici prendre comme exemple les techniques utilisées par les systèmes d'extraction de l'information (EI) et donc nous limiter à l'analyse linguistique dite superficielle (shallow analysis) de documents, qui est favoriséepar les systèmes EI.
Dans un premier temps nous allons décrire les techniques de base utilisées dans un système d'extraction de l'information, une discipline d'ingénierie linguistique visant à identifier, rassembler et normaliser les informations pertinentes pour des utilisateurs ou des applications spécifiques. L'information extraite est typiquement représentée sous formes de formulaires (templates) pré-définis et remplis par les résultats de l'analyse linguistique des documents concernés.
Traduire le résumé vers :