Atelier DELIC du 11 janvier
Atelier segmentation de l'oral
Jeudi 11/01/07, C212, 14h.
Objectifs : définir une méthodologie de segmentation (automatique) des énoncés oraux
Corpus : FREF, environ 10.000 mots, soit 54,31 min de parole (oral spontané), annotations prosodiques.
Méthodologie : approche de segmentation sur 2 niveaux :
1) Unités micro et macro-syntaxiques
2) Unités de « discours », « périodes » (unités au delà de la macro, qui permettent de limiter la portée de la macro)
Il sera question de préciser ces deux notions/démarches et de voir comment elles peuvent être amenées à se compléter.
Jeudi 11/01/07, C212, 14h.
Objectifs : définir une méthodologie de segmentation (automatique) des énoncés oraux
Corpus : FREF, environ 10.000 mots, soit 54,31 min de parole (oral spontané), annotations prosodiques.
Méthodologie : approche de segmentation sur 2 niveaux :
1) Unités micro et macro-syntaxiques
2) Unités de « discours », « périodes » (unités au delà de la macro, qui permettent de limiter la portée de la macro)
Il sera question de préciser ces deux notions/démarches et de voir comment elles peuvent être amenées à se compléter.