<body><script type="text/javascript"> function setAttributeOnload(object, attribute, val) { if(window.addEventListener) { window.addEventListener('load', function(){ object[attribute] = val; }, false); } else { window.attachEvent('onload', function(){ object[attribute] = val; }); } } </script> <div id="navbar-iframe-container"></div> <script type="text/javascript" src="https://apis.google.com/js/platform.js"></script> <script type="text/javascript"> gapi.load("gapi.iframes:gapi.iframes.style.bubble", function() { if (gapi.iframes && gapi.iframes.getContext) { gapi.iframes.getContext().openChild({ url: 'https://www.blogger.com/navbar.g?targetBlogID\x3d9182671\x26blogName\x3dDelic-Actu\x26publishMode\x3dPUBLISH_MODE_BLOGSPOT\x26navbarType\x3dBLUE\x26layoutType\x3dCLASSIC\x26searchRoot\x3dhttps://delic-actu.blogspot.com/search\x26blogLocale\x3dfr_FR\x26v\x3d2\x26homepageUrl\x3dhttp://delic-actu.blogspot.com/\x26vt\x3d-2826767133127056376', where: document.getElementById("navbar-iframe-container"), id: "navbar-iframe" }); } }); </script>

Delic-Actu

jeudi, janvier 20, 2005

Corpus C-ORAL-ROM (4 langues romanes) disponible

Le corpus C-ORAL-ROM est disponible chez Elra/Elda (voir catalogue pour les détails).

C-ORAL-ROM est un corpus multilingue de parole spontanée pour les principales langues romanes composé d'environ 1 200 000 mots (IST 2000-26228). Le corpus est composé de quatre collections d'enregistrements comparables de sessions de parole spontanée pour l'italien, le français, le portugais et l'espagnol (environ 300 000 mots par langue). Les collections ont été fournies par les organismes suivants :

  • Università di Firenze (Dipartimento di Italianistica, LABLITA);
  • Université de Provence (DELIC, Description Linguistique Informatisée sur Corpus);
  • Fundação da Universidade de Lisboa/Centro de Linguística da Universidade de Lisboa
  • Universidad Autónoma de Madrid (Departamento de Lingüística, Lenguas Modernas, Lógica y F. de la Ciencia, Laboratorio de Lingüística Informática).

Le corpus C-ORAL-ROM offre la source acoustique de chaque session ainsi que les annotations principales suivantes :

  • La transcription orthographique, au format CHAT, enrichie de l'étiquetage des pauses prosodiques terminales et non terminales
  • Un metadata des sessions
  • La synchronisation du texte par rapport à la parole, au format WIN PITCH CORPUS, basée sur l'alignement de chaque occurrence transcrite. Le logiciel est fourni avec le corpus.

vendredi, janvier 14, 2005

Eurom4 dans le Monde Diplomatique

La méthode Eurom4 est à l'honneur dans le Monde Diplomatique du mois de janvier, dans l'article Esprit de famille par Françoise Ploquin (rédactrice en chef du Français dans le monde), qui fait partie d'un dossier sur le multilinguisme et la "dictature" de l'anglais.

Quelques extraits :
On éprouve un sentiment de malaise lorsqu'un Français utilise l'anglais pour demander un renseignement dans une rue de Florence, de Séville ou de Coimbra [...]

Au cours de la dernière décennie, d'intéressantes recherches ont été menées sur l'apprentissage à l'intercompréhension des langues romanes. Dans le cadre du programme européen Lingua, deux projets menés en liaison avec des équipes des autres pays de langues latines d'Europe ont permis nombre d'obervations et d'expérimentations : Galatea [...] et Eurom4, sous la direction de Mme Claire Blanche-Benveniste [...]

Les travaux menés avec des équipes d'étudiants volontaires mais non spécialistes (Eurom4) montrent qu'en soixante heures un locuteur d'une langue romane parvient à lire et à comprendre des textes dans trois autres langues (livre, encyclopédie, article de presse). [...]
Une bibliographie est fournie dans un encadré (textes de Claire Blanche Benveniste, André Valli, Eric Castagne).

Voir la page Eurom4 sur le site de l'équipe.

Journée d'étude du 21 janvier

Journée d'étude semestrielle de l'équipe DELIC
Vendredi 21 janvier 2005, 9:00 - 17:00 - Salle C212
Voir le programme sur le site de l'équipe.