Invité: Didier Bourigault (1/12)
Séminaire du jeudi 1er décembre 15h, salle C212.
Didier Bourigault (ERSSS, Toulouse)
Analyse syntaxique de corpus
Didier Bourigault (ERSSS, Toulouse)
Analyse syntaxique de corpus
Nous présentons Syntex, un analyseur syntaxique en dépendance. Syntex reçoit en entrée un corpus étiqueté et fournit en sortie l’analyse syntaxique en dépendance des phrases du corpus. L’analyseur ne s’appuie sur aucune grammaire formelle. Il est organisé sous la forme d’un ensemble de modules qui traitent de façon séquentielle le corpus, chaque module prenant en charge un type de relation syntaxique. Nous décrirons les principes de base de l’analyseur, son architecture modulaire, les heuristiques implémentées dans les différents modules et les ressources linguistiques exploitées. Nous détaillerons plus précisément le traitement de la coordination, ainsi que la résolution des ambiguïtés de rattachement prépositionnel. Nous dirons quelques mots de l’adaptation de Syntex au traitement de corpus oraux retranscrits.