Auteur :
Rousse
Guillaume,
De la Clergerie
Éric
Date de publication : 05/04/2005
Type : Actes de congrès / Séminaire / Atelier
Thème : Langages documentaires
Couverture : France
À l’heure actuelle, seule une infime partie des connaissances sur la biodiversité sont numérisées. L’écrasante majorité se trouve toujours sous forme de documents papier uniquement, et la saisie manuelle de cette information n’est guère envisageable. Pourtant, la forme hautement structurée de ces documents se prête aisément à l’extraction informatisée. Le projet Biotim essaye justement de s’attaquer à ce problème, en réunissant différentes équipes spécialisées dans l’analyse automatique du texte et de l’image. Cet article présente le travail mené au sein de l’équipe Atoll, concernant l’analyse du langage, et plus particulièrement l’extraction terminologique, en exposant l’originalité du sujet et l’état d’avancement actuel des travaux.