Retour à la liste de résultats

Un modèle de données pour la textométrie : contribution à une interopérabilité entre outils

Auteur : Heiden Serge
Année de Publication : 2006
Type : Actes de congrès / Séminaire / Atelier
Thème : Langage naturel et TALN (Traitement Automatique de la Langue Naturelle)

Résumé/Sommaire :

La communauté des chercheurs en analyse de données textuelles s’organise afin d’unir les efforts de développement et de diffusion des outils de textométrie ainsi que l’échange des données textuelles qu’ils traitent. L’effort nécessaire pour rendre les calculs et les données interopérables est important pour clarifier les architectures de traitement textométrique complexes intégrant les outils de TAL et pour la capitalisation du travail de préparation des données. Afin de pouvoir comparer globalement les fonctionnalités des outils, nous proposons 4 axes de synthèse fonctionnels : Synthèses statistiques, Édition de texte, Moteur de recherche et Annotation de texte. Il existe différentes initiatives internationales de standardisation de la description (métadonnées) et du codage du contenu des données textuelles. Vue la grande diversité dans l’usage de ces standards et leur évolution permanente, nous proposons de situer l’effort d’interopérabilité avec les données à un niveau synthétique composé de 11 rubriques générales. Elles ont été construites à partir d’une synthèse des différents formats de données des outils de textométrie. Nous proposons de situer le travail d’interopérabilité des données à ce niveau de description.

Traduire le résumé vers :
Recherche

Recherche

Recherche avancée
Navigation par

Navigation par :

Filtrer votre recherche

Sélectioner un domaine *

Sélectionner une thematique

Sélectionner une rubrique

*Champs obligatoires
Chercher sur Abhatoo avec Google :