Retour à la liste de résultats

La conception de bases de données infométriques hybrides : analyse de la pratique de trois observatoires européens

Auteur : Grivel Luc, Fagherazzi Hélène, Fourneret Philippe ...[et al.]
Date de publication : 01/10/1999
Type : Actes de congrès / Séminaire / Atelier
Thème : Banques de données et bases de connaissances

Résumé/Sommaire :

Les méthodes employées pour le calcul d’indicateurs de politique scientifique sont fondées sur les lois bibliométriques (loi de Zipf pour les mots-clés, loi de Lotka pour les auteurs, loi de Bradford pour les périodiques). Elles s’appliquent en particulier à la littérature scientifique et nécessitent une normalisation des champs de données bibliographiques. Rassemblant des informations scientifiques et techniques normalisées et codifiées, une base est dite ‘infométrique’ ou ‘bibliométrique’ lorsque sa structure a été conçue pour obtenir des indicateurs infométriques ou bibliométriques. Il n’existe pas de producteurs directs de bases infométriques mais des bases constituées à partir de données fournies par les producteurs de bases de données bibliographiques.
Le besoin croissant d’indicateurs européens, nationaux, régionaux, institutionnels demande, pour être satisfait, la mise en place de nouvelles bases de données, hybrides (multi-sources), adaptées au calcul d’indicateurs. Comment les concevoir ? Comment les alimenter ?
L’objectif de l’article est double, mettre en évidence quelques points clés et les difficultés pour construire ce type de base et tirer les leçons d’expériences offrant une certaine similarité avec cette problématique.
L’article aborde les problèmes de la couverture et de l’organisation de bases infométriques hybrides en analysant dans un premier temps les pratiques de trois observatoires des sciences et technologies. Après avoir mis en évidence les difficultés liées à l’hétérogénéité des données dans un tel contexte, nous proposons une approche développée dans le cadre de la veille scientifique. Nous en montrons les avantages et les limites pour la constitution de bases infométriques hybrides adaptées au calcul d’indicateurs. Cette approche est basée sur une représentation des documents par une structure d’arbre étiqueté couramment employée pour décrire des documents SGML. La méthode proposée permet de spécifier de manière déclarative les relations entre les éléments de données et leur représentation dans le système de gestion de base de données (SGBD). Cette technique s’intègre parfaitement avec le choix des observatoires de s’appuyer sur les SGBD pour l’exploitation de leurs données. Plus généralement, nous montrons que l’emploi de SGML en association avec un système de gestion de base de données (si possible orienté objet) améliore significativement les possibilités d’exploitation des données. Les autres avantages sont non seulement de permettre l’intégration de données hétérogènes dans une base, mais aussi de distribuer des informations extraites de la base de données sous forme de données SGML pour des traitements ultérieurs ou pour naviguer dans la base infométrique à travers une interface hypertexte.

Traduire le résumé vers :
Recherche

Recherche

Recherche avancée
Navigation par

Navigation par :

Filtrer votre recherche

Sélectioner un domaine *

Sélectionner une thematique

Sélectionner une rubrique

*Champs obligatoires
Chercher sur Abhatoo avec Google :