Jour 2 (AM) - Ateliers > 9h30 - Plateforme Notebook

Environnement Notebook : l'apprentissage automatique pour la classification textuelle
 
Patrice Bellot (contact)
Laboratoire d'informatique et systèmes (LIS)
Aix-Marseille Université (AMU), Université de Toulon, Centre National de la Recherche Scientifique (CNRS)
 
Patrice Bellot est Professeur en informatique à Aix-Marseille Université, membre du Laboratoire d'Informatique et Systèmes (LIS) et chargé de mission « fouille de données textuelles » à l'Institut INS2I du CNRS. Ses travaux de recherche portent sur les méthodes numériques de recherche d’information et de recommandation automatique de contenus mais aussi sur l’analyse automatisée des sentiments et des émotions.

Présentation

L'objectif de l'atelier est de présenter, sous forme de démonstrations et de notebooks partagés, deux environnements logiciels permettant la classification automatisée de données textuelles selon des approches d'apprentissage automatique incluant les réseaux neuronaux. Cela permettra aux auditeurs de comprendre la nature et les objectifs des traitements mis en oeuvre et d'estimer l'effort nécessaire pour expérimenter les approches les plus actuelles sur ses propres données.

Programme

  • Manipulation des outils d'apprentissage automatique de classification supervisée (catégorisation) ou non supervisée (partionnement en classes proches) à partir de textes.
  • Classification supervisée de document (des textes annotés et des représentations vectorielles des mots et des documents)
    Expérimentation avec l'environnement Weka.
  • La mise en oeuvre d'une approche neuronale pour la classification automatique
    Expérimentation à partir d'un Notebook en Python.
  • De nombreuses tâches de la fouille de textes vues comme des problèmes de classification.

Vidéothèque

Atelier ANF TDM 2020 (1h30)
Atelier ANF TDM 2021 (1h30)

Personnes connectées : 2 Vie privée
Chargement...