Workshop Deep Learning Avancé – Traitement du Langage – NLP
De nos jours, le NLP est partout que ce soit dans les outils de traduction automatique, de vérification orthographique, d’aide à la rédaction, de génération automatique de texte, de reconnaissance vocale, etc.
Vous connaissez d’ores et déjà les principes fondamentaux de l’apprentissage automatique et vous avez déjà mis en oeuvre différentes architectures de réseaux de neurones, mais vous souhaitez en savoir plus sur les opportunités proposées par le Machine et le Deep Learning dans le domaine du traitement naturel du langage, cette formation est faite pour vous.
A l’issue de cette formation, vous serez capables de pré-traiter des données textuelles et vous serez en mesure d’implémenter des modèles permettant de les valoriser : classification de texte, recherche d’informations, analyse de sentiments, extraction d’informations, traduction, résumé de texte, etc.
- %de travaux pratiques
- jours
À qui s’adresse cette formation au NLP ?
Description de la formation au NLP
Présentation
Le traitement naturel du langage est un domaine à part entière de l’intelligence artificielle à l’intersection de l’informatique, des mathématiques, de la linguistique et des sciences cognitives. L’objectif est de construire des applications capables d’analyser, de modéliser, de comprendre et d’imiter le langage humain.
Depuis les années 1950, du test de Turing à la création des premiers agents conversationnels comme le chatbot ELIZA, le NLP s’est progressivement sophistiqué. De véritables avancées ont eu lieu avec la mise en place de modèles de Machine Learning et de Deep Learning permettant d’adresser un large ensemble de tâches de syntaxe, de sémantique, de discours et de parole. De nos jours, le NLP est partout que ce soit dans les outils de traduction automatique, de vérification orthographique, d’aide à la rédaction, de génération automatique de texte, de reconnaissance vocale, etc.
Vous connaissez d’ores et déjà les principes fondamentaux de l’apprentissage automatique et vous avez déjà mis en oeuvre différentes architectures de réseaux de neurones, mais vous souhaitez en savoir plus sur les opportunités proposées par le Machine et le Deep Learning dans le domaine du traitement naturel du langage, cette formation est faite pour vous.
A l’issue de cette formation, vous serez capables de pré-traiter des données textuelles et vous serez en mesure d’implémenter des modèles permettant de les valoriser : classification de texte, recherche d’informations, analyse de sentiments, extraction d’informations, traduction, résumé de texte, etc.
Méthode pédagogique
La formation se passe en mode présentiel ou distanciel, et se compose de 60% de travaux pratiques (Mises en situation, débats, exercices). Le formateur alterne entre théorie et pratique ; chaque participant dispose d’un ordinateur sur lequel il réalisera les exercices proposés.
Une évaluation quotidienne de l’acquisition des connaissances de la veille est effectuée.
Une synthèse est proposée en fin de formation. Une évaluation à chaud sera proposée au stagiaire à la fin du cours.
Un support de cours sera remis à chaque participant comprenant les slides sur la théorie, les exercices et les corrigés de ces derniers. Une feuille d’émargement par demi-journée de présence est fournie en fin de formation ainsi qu’une attestation de formation.
Objectifs
- Mettre en place un prétraitement efficace d’un jeu de données textuelles
- Maîtriser les architectures de réseaux de neurones récurrents et des transformers
- Mettre en œuvre des cas concrets pour chaque type de réseaux
- Réutiliser des modèles existants avec du transfer learning
- Mesurer la pertinence des modèles mis en œuvre & Visualiser l’apprentissage
Audience
- Data Analysts
- Data Scientists
- Développeurs
Pré-requis
Les stagiaires doivent avoir une expérience en Deep Learning ou avoir suivi la formation Workshop Deep Learning (maîtrise des concepts du machine learning et avoir mis en œuvre différentes architectures de réseaux de neurones : convolutionnels, récurrents, …)
La connaissance du langage Python, des librairies scientifiques (scikit-learn, pandas, numpy) et du framework Deep Learning TensorFlow est nécessaire.
Le formateur
Le formateur est un expert du domaine qui intervient sur le sujet depuis plusieurs années en formation mais aussi en conseil.
Doté d’une grande qualité d’écoute, sa pédagogie et sa compétence technique vous permettront d’acquérir les compétences sur le traitement du langage – NLP.
Il saura alterner entre théorie, pratique, et retours d’expérience.
Le programme
Introduction
- Les bases de la linguistique
- Introduction au Text Mining / Fouille de texte (Data Mining pour le texte)
- Extraction d’informations
- Recherche d’informations
- Catégorisation du texte
- Résumé du texte
Text Normalisation / Normalisation du texte
- n-grams
- Tokenization
- Stop Word
- Stemming
- Part-Of-Speech (POS) tagging
- Lemmatization
Vectorisation du texte
- Analyse de la fréquence des termes (Counter, TF-IDF, Word vectors)
- Bag of word
- Word Embedding : Word2vec, GloVe, FastText, etc.
- Création d’une pipeline de préprocessing
Les réseaux de neurones récurrents
- Principes fondamentaux des RNN
- LSTM et GRU
- Approches Encodeur-Decodeur
- Utilisation de connexions résiduelles (skip connections)
- Named Entity Recognition (NER)
- Analyse de sentiment
Les transformers
- Attention is All You Need
- BERT, GPT, etc.
- Transfer Learning
- Generation de texte
- Text summarization (Seq2Seq Model avec attention)
Tarif
2400 € HT