Journée ATALA "Le Web comme ressource pour le TAL"
Date : 11 mars 2006.
Organisation : N. Gala (DELIC, Univ. Provence) et G. Grefenstette (CEA).
Lieu : amphi Estaunié, ENST, 46 rue Barrault 75 013 Paris (le samedi il faut entrer par "derrière" : 49 rue Vergnaud).
Programme : http://www.atala.org/article.php3?id_article=292
La journée commencera avec un conférencier invité (Adam Kilgarriff) qui donnera une perspective globale des travaux en cours ainsi que des possibilités offertes par le Web.
La journée se poursuivra par des exposés et démos parmi les thèmes suivants :
- construction de corpus à partir du web
- outils, interfaces, etc. de « butinage du web » (Web crawling) à des fins linguistiques
- création d’ontologies et de bases terminologiques à partir du web
- extraction de connaissances
- utilisation du web dans des systèmes question-réponse
- indexation et extraction d’information à partir de grandes collections de données
- quantité et la qualité des données disponible sur le Web
- exploitation de données bruitées
Organisation : N. Gala (DELIC, Univ. Provence) et G. Grefenstette (CEA).
Lieu : amphi Estaunié, ENST, 46 rue Barrault 75 013 Paris (le samedi il faut entrer par "derrière" : 49 rue Vergnaud).
Programme : http://www.atala.org/article.php3?id_article=292
La journée commencera avec un conférencier invité (Adam Kilgarriff) qui donnera une perspective globale des travaux en cours ainsi que des possibilités offertes par le Web.
La journée se poursuivra par des exposés et démos parmi les thèmes suivants :
- construction de corpus à partir du web
- outils, interfaces, etc. de « butinage du web » (Web crawling) à des fins linguistiques
- création d’ontologies et de bases terminologiques à partir du web
- extraction de connaissances
- utilisation du web dans des systèmes question-réponse
- indexation et extraction d’information à partir de grandes collections de données
- quantité et la qualité des données disponible sur le Web
- exploitation de données bruitées