Abhatoo - Centre Nationale de Documentation

Accueil >
Maalama Textuelle >
Sciences de l'info... >
Recherche, diffusi... >
Veille >
Approche innovante pour la recherche et l'extraction coopérative et dynamique d'informations sur Internet

Retour à la liste de résultats

Approche innovante pour la recherche et l'extraction coopérative et dynamique d'informations sur Internet

Auteur : Denis Xavier, Simon Gaele, Chanchevrier Nicolas
Type : Article
Thème : Veille
Couverture : France

URL Article :

http://ses.enst.fr/AS_fluxinternet/docs/EGC_Xavier.pdf

URL Source :

http://ses.enst.fr/

Télécharger le document :

(196,01 kB) Approche innovante pour la recherche et l'extraction coopérative et dynamique d'informations sur internet.pdf

Résumé/Sommaire :

Il existe de nombreuses techniques qui permettent de classifier des documents textuels en fonction du centre d’intérêt d’un utilisateur (kNN, SVM, . . .). Malheureusement, l’intégration de ces méthodes dans des plate-formes de textmining est souvent très statique et ne permet pas facilement d’affiner les traitements et/ou résultats au cours du temps. Le but de cet article est de présenter une plate-forme de webmining dans laquelle les données hétérogènes sont représentées uniformément selon un formalisme XML/TEI et ou l’utilisateur peut interagir sur les processus de récupération et d’analyse de ces données. Pour cela, les modules de traitements sont représentés par des agents fonctionnant sur la plate-forme MadKit et l’apprentissage se fait sur une méthode dérivée de VSM et TFIDF utilisant un principe de listes noires pondérées permettant la reconnaissance de documents indésirables. La dynamique de la plate-forme repose principalement sur la possibilité d’ajouter à la volée des agents de traitement et de pouvoir modifier l’ordre et les paramètres d’analyse des documents.

Traduire le résumé vers :

Filtrer votre recherche

Sélectioner un domaine *

Développement durable
Développement économique et social
Sciences de l'information
Sciences et technologies

Sélectionner une thematique

thématique

Sélectionner une rubrique

sthematique

Sélectionner une sous-rubrique