Jour 2 (AM) - Ateliers > 9h30 - Annotation TAL

Annotation pour le Traitement Automatique de la Langue: éthique, modélisation et pratique
 
Aurélie Névéol (contact)
Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)
Université Paris Saclay, Centre National de la Recherche Scientifique (CNRS)

Présentation

La production de corpus annotés est une tâche importante pour le développement et l'évaluation d'outils de traitement automatique de la langue pour des applications aussi diverses que la transcription, la traduction automatique ou l'extraction d'information.

Dans cet atelier, les enjeux du développement de telles ressources seront présentés et vous apprendrez les bonnes pratiques de mise en oeuvre d'une campagne d'annotation.

Programme

Introduction sur la place de l'annotation dans le TAL: d'où viennent les annotations, comment sont-elles utilisées, pour combien de temps ?

Exercices d'annotations:

  • Activité 1 : transcription de parole
  • Activité 2 : analyse d'un besoin d'annotation
  • Activité 3 : annotation en entités

En pratique, comment mettre en oeuvre une campagne d'annotation?

  • Point sur les aspects éthiques en TAL et autour de l'annotation
  • Point sur les aspects techniques et logistiques: outils d'annotation, évaluation des annotations, calcul d'accord inter-annotateur
Personnes connectées : 2 Vie privée
Chargement...