<body><script type="text/javascript"> function setAttributeOnload(object, attribute, val) { if(window.addEventListener) { window.addEventListener('load', function(){ object[attribute] = val; }, false); } else { window.attachEvent('onload', function(){ object[attribute] = val; }); } } </script> <div id="navbar-iframe-container"></div> <script type="text/javascript" src="https://apis.google.com/js/platform.js"></script> <script type="text/javascript"> gapi.load("gapi.iframes:gapi.iframes.style.bubble", function() { if (gapi.iframes && gapi.iframes.getContext) { gapi.iframes.getContext().openChild({ url: 'https://www.blogger.com/navbar.g?targetBlogID\x3d9182671\x26blogName\x3dDelic-Actu\x26publishMode\x3dPUBLISH_MODE_BLOGSPOT\x26navbarType\x3dBLUE\x26layoutType\x3dCLASSIC\x26searchRoot\x3dhttps://delic-actu.blogspot.com/search\x26blogLocale\x3dfr_FR\x26v\x3d2\x26homepageUrl\x3dhttp://delic-actu.blogspot.com/\x26vt\x3d-2826767133127056376', where: document.getElementById("navbar-iframe-container"), id: "navbar-iframe" }); } }); </script>

Delic-Actu

lundi, octobre 16, 2006

Atelier DELIC du 19 octobre

Des grilles pour le traitement automatique du français parlé
Segmentation et structuration interne des énoncés

Jeudi 19/10, s. C212, 14h.

Cet axe de recherche pour l’année universitaire 2006-2007 sera consacré aux analyses en grille dans le cadre plus général du problème de la segmentation des énoncés oraux. Il prendra la forme d’un atelier où chacun sera amené à réfléchir sur la manière dont on peut segmenter les textes oraux, faire des grilles de manière étendue et surtout élaborer les grilles elles-mêmes. Une partie logicielle sera aussi abordée, car nous avons l’objectif d’élaborer un éditeur de grilles permettant de normaliser le travail. Cet atelier est facultatif et ne s’adresse qu’aux membres de l’équipe intéressés par ces problèmes.

Problématique

Il est étrange de constater qu’il n’existe pas à ce jour de vastes banques de données d’énoncés oraux. Or, dans une science expérimentale telle que la linguistique, il est inconcevable de se passer de telles ressources afin de mieux appréhender la structuration interne des énoncés et de déterminer les indices qui intuitivement nous permettent de les segmenter de manière apparemment inconsciente. L’intérêt pour ce type de travaux ne s’arrête pas à la seule linguistique, car en Traitement Automatique de la Parole, une telle banque de données serait aussi utile pour mieux appréhender les régularités formelles de la langue parlée.

L’outil pratique que sont les analyses en grille, utilisées par notre équipe pour représenter visuellement les régularités dans les énoncés oraux spontanés, sont aptes à remplir cet objectif car elles sont une représentation fidèle de la manière dont les locuteurs exploitent les axes syntagmatique et paradigmatique, dimensions fondamentales pour la langue parlée.

Organisation

Le travail s’articulera autour des deux axes suivants :

Partie description : présentation et élaboration des grilles en essayant d’articuler l’analyse en grille classique et son adaptation au travail de segmentation effectué par DELIC en 2004. Une fois que le nombre d’énoncés sera significatif, se lancer dans la recherche d’indices permettant la segmentation et des généralisations descriptives. Il faudra évidemment avoir une réflexion sur ce qu’il sera pertinent d’annoter : Utilisera-t-on la prosodie ? A priori oui, mais sous quelle forme ? Marquerons-nous les unités macrosyntaxiques ? etc.
Les résultats attendus peuvent être quantitatifs (degré de complexité des énoncés, par exemple) et qualitatifs (indices formels pour la segmentation, par exemple).

Partie informatique : l’élaboration d’un éditeur de grille serait le bienvenu avec génération automatique d’un fichier xml permettant de normaliser les sorties. Si c’est possible, une interface permettant des requêtes serait aussi utile. Il reste bien évidemment à déterminer avec précision ce que l’on retiendra comme étant pertinent et ce que l’on cherche. Avant de se lancer dans l’élaboration de telles ressources et outils, il faudra donc délimiter précisément les besoins et les résultats attendus. Le travail initial de cet atelier sera donc consacré à une réflexion autour des éléments qu’il est pertinent d’annoter.