 
               
                
    
     
    
            
        
    
    
    
    
    
    
									Auteur :
                Rousse
                    Guillaume,
        
                De la Clergerie
                    Éric 
        
																										Date de publication : 05/04/2005
																	Type :     Actes de congrès / Séminaire / Atelier
													Thème :     Langages documentaires
													Couverture :                    France
          
								
			
 Télécharger le document :
 Télécharger le document :À l’heure actuelle, seule une infime partie des connaissances sur la biodiversité sont numérisées. L’écrasante majorité se trouve toujours sous forme de documents papier uniquement, et la saisie manuelle de cette information n’est guère envisageable. Pourtant, la forme hautement structurée de ces documents se prête aisément à l’extraction informatisée. Le projet Biotim essaye justement de s’attaquer à ce problème, en réunissant différentes équipes spécialisées dans l’analyse automatique du texte et de l’image. Cet article présente le travail mené au sein de l’équipe Atoll, concernant l’analyse du langage, et plus particulièrement l’extraction terminologique, en exposant l’originalité du sujet et l’état d’avancement actuel des travaux.
