Retour à la liste de résultats
Détection et visualisation d’agrégats de documents web
Auteur :
GHITALLA
Franck
JACOMY
Mathieu
PFAENDER
Fabien
Collectivite Auteur :
Maison des Sciences de l’Homme, Paris-Sud
Université de Technologie de Compiègne.
Date de publication : 31/12/2005
Année de Publication :
0
Type : Article
Thème : Internet
Couverture : France
Résumé/Sommaire :
Les principes d’organisation de cet espace documentaire ouvert et dynamique qu’est le web restent encore aujourd’hui un objectif d’investigation scientifique. Différents modèles d’organisation documentaire ont été proposés ces dernières années, au niveau macroscopique du web mais aussi à des niveaux plus « locaux ». Ces travaux intègrent la prise en compte du contenu des documents web (via notamment l’indexation fulltext) mais aussi la distribution des liens hypertextes en mobilisant la théorie des graphes.
Nous présentons ici une expérimentation basée sur l’exploration locale d’un sous-graphe du web construit à partir de l’extraction et de l’indexation d’un ensemble de documents consacrés sur le web francophone à la Culture Scientifique Technique et Industrielle (CSTI). Cette expérimentation poursuit trois objectifs :
A) contribuer à une compréhension plus approfondie de l’architecture documentaire du web.
B) confronter les principes de « géographie documentaire » issus de notre investigation du web à des classements traditionnels et reconnus du domaine de la CSTI.
C) Tester différents modes de traitement et de visualisation des données web pour explorer ses structures documentaires, sachant qu’il est constitué de données en grandes masses, peu structurées et dynamiques temporellement.
Traduire le résumé vers :