Auteur :
Benzitoun
Christophe
Date de publication : 21/04/2004
Type : Article
Thème : Langage naturel et TALN (Traitement Automatique de la Langue Naturelle)
Dans cet article, nous présentons une typologie des phénomènes qui posent problème pour
l'annotation syntaxique de corpus oraux. Nous montrons également que ces phénomènes, même s'ils y sont d'une fréquence moindre, sont loin d'être absents à l'écrit (ils peuvent même
être tout à fait significatifs dans certains corpus : e-mails, chats, SMS…), et que leur prise en
compte peut améliorer l'annotation et fournir un cadre intégré pour l'oral et l'écrit.