Formation Pensez comme un Data Scientist – Machine Learning & Python

Plus d’un tiers des ventes sur Amazon est généré grâce à leur moteur de recommandations, ce qui illustre à quel point les algorithmes de Machine Learning sont partout, mais surtout à quel point ils sont générateurs de valeur ! 

Cette formation vous introduit le Machine Learning et l’Intelligence Artificielle. Au travers de cas concrets, elle vous permet d’apprendre, entre autres, le langage Python et à traiter de gros volumes de données. Au terme de ces 4 jours avec nous, vous serez opérationnels, au point d’être en capacité de déployer un modèle en production !

%

de pratique

#01

formation la plus populaire 

jours de formation

À qui s’adresse cette formation Pensez comme un Data Scientist ?

développeur web, full stack, android, ios - portrait

Chefs de projet technique

développeur web, full stack, android, ios - portrait

Architectes

développeur web, full stack, android, ios - portrait

Développeurs

Description de la formation

Pensez comme un Data Scientist

Présentation

Plus d’un tiers des ventes du site Amazon.com est généré grâce à leur moteur de recommandation. Leurs algorithmes de Machine Learning leur a aussi révélé que les recommandations sont d’autant plus efficaces que lorsqu’elles sont faîtes lors d’une campagne mail plutôt qu’un affichage sur la page web. 

Segmentation (clustering), prédiction, estimation, recommandation, ces méthodes d’analyse sont aujourd’hui utilisées dans l’objectif d’apporter de la valeur aux données détenues par l’entreprise. 

Si l’implémentation de ces algorithmes reste de la responsabilité du mathématicien, leurs usages est maintenant rendu possible par l’apparition de librairies masquant une partie de leur complexité. A l’issue de cette formation vous aurez appris les activités du Data Scientist : Choix et préparation des données, sélection des algorithmes, apprentissage, scoring, industrialisation.

Méthode pédagogique

Composée à 70% de pratique, cette formation utilise des exercices illustrés et didactiques.

Une évaluation quotidienne de l’acquisition des connaissances de la veille est effectuée.

Une synthèse est proposée en fin de formation. 

Une évaluation à chaud sera proposée au stagiaire à la fin du cours. Un support de cours sera remis à chaque participant comprenant les slides sur la théorie, les exercices. Une feuille d’émargement par demi-journée de présence est fournie en fin de formation ainsi qu’une attestation de fin de formation si le stagiaire a bien assisté à la totalité de la session. 

Un suivi et un échange avec les participants seront mis en place quelques jours après la formation.

Objectifs

  • Comprendre le Machine Learning et l’Intelligence Artificielle
  • Catégoriser les différentes approches : clustering, classification, régression…
  • Choisir, structurer et adapter les données pertinentes pour des résultats pertinents
  • Apprendre le langage python et ses librairies scientifiques (scikit-learn, pandas)
  • Mettre en œuvre des cas concrets (prédiction, clustering)
  • Mesurer la pertinence des modèles mis en œuvre
  • Traiter des gros volumes de données en parallélisant les traitements : Spark et Dask
  • Déployer un modèle en production
  • Introduction au Deep Learning

Audience

  • Chefs de projet technique
  • Architectes
  • Développeurs

Pré-requis

La connaissance d’un langage de programmation structuré est nécessaire.

Le formateur

Le formateur est un expert du domaine qui intervient sur le sujet depuis plusieurs années en formation mais aussi en conseil. Doté d’une grande qualité d’écoute, sa pédagogie et sa compétence technique vous permettront d’acquérir les compétences sur le sujet. Il saura alterner entre théorie, pratique, et retours d’expérience.

Le programme

Les bases du machine learning
  • Quelques exemples en guise d’introduction
  • Généraliser : un principe fondateur du Machine Learning pour permettre la prédiction et la segmentation
  • Algorithmes supervisés et non supervisés
  • Appropriation du vocabulaire du Data Scientist
Premiers pas
  • Collecter et stocker les données
  • Analyser, comprendre, nettoyer et structurer les données : Le Feature Engineering 
  • Apprentissage et création d’un modèle
  • Evaluation du modèle
  • Amélioration du modèle
Le langage python
  • La syntaxe du langage
  • Les outils de développement : Jupyter notebook
  • Les librairies du data scientist : Pandas, Scikit-learn
  • Analyser et comprendre les données
  • Matplotlib et Seaborn : Des librairies de data visualisation pour Python
Choisir les algorithmes de machine learning
  • Comprendre les enjeux
  • Tour d’horizon des principaux algorithmes
  • Classification : k-Nearest Neighbors (k-NN),
  • Arbre de décision, Random Forest, XGBoost
  • Régression : Régression logistique
  • Clustering : K-Means, DBScan
  • Les différentes méthodes de scoring
Concepts avancés
  • Validation croisée
  • Ensemble Machine Learning : cumulez les algorithmes pour une meilleure précision
  • Automatiser les manipulations de données avec un pipeline
Traiter les données en parallèle
  • Pourquoi paralléliser ?
  • Adapter les algorithmes
  • Une complexité complémentaire
  • Les frameworks de distribution à disposition : Spark et Dask
Déployer en production 
  • Intégrer un pipeline à une chaine de déploiement automatisée (continuous delivery)
  • Packager un modèle : Predicive Model Markup Language
  • Créer un endpoint REST avec python Flask
  • Déployer dans le cloud
Le Deep Learning 
  • Présentation générale : les réseaux de neurones
  • Les réseaux convolutionnels : Analyse d’images
  • Les réseaux récurrents
  • Comprendre par l’exemple : Pytorch & Keras

Tarif

2400 € HT

Formation à distance

Retengr vous permet aussi de suivre cette formation à distance, sous forme de classe virtuelle (6 participants maximum), avec un formateur expert sur le sujet. La formation se déroule via une connexion en visio conférence (ZOOM, GoogleMeet, Teams ou autres) et vous permet d’alterner théorie et pratique de façon accompagnée ou autonome, le tout dans le respect des objectifs pédagogiques et des évaluations des acquis.

Les émargements, évaluations, attestation de formation, remises des supports de cours et autres documents se feront en ligne.

En ce qui concerne le matériel informatique du participant, il est seulement préconisé un ordinateur et une connexion internet. Nous nous chargeons du reste.

Chaque participant se verra attribuer une Machine Virtuelle qui sera exécutée dans le Cloud d’Amazon. Il disposera alors de la puissance et des outils nécessaires pour le bon déroulement de la formation. Aucune installation de la part du participant n’est requise avant la formation.

Une journée type de formation à distance se décompose de la façon suivante :

Matin :

  • 2h de théorie en visioconférence
  • 10 à 15 minutes de présentation d’exercices en visio
  • 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d’écran à distance pour une assistance efficace).

Après-midi :

  • 2h de théorie en visioconférence
  • 10 à 15 minutes de présentation d’exercices en visio
  • 1h de TP en autonomie avec possibilité de solliciter le formateur (partage d’écran à distance pour une assistance efficace).

Les prochaines dates pour cette formation

Pas d'événement actuellement programmé.

Nos clients parlent de nous

“Le point fort de cette formation est la transition entre une partie théorique riche avec une mise en pratique qui permet la démystification des outils/langages et donc un réel usage de ces concepts (même si, bien sûr, il reste beaucoup de chemin pour devenir datascientist !)”

Stéphane
Thalès
“Je n’avais pas forcément d’attentes précises dans le sens où je ne connaissais rien du sujet avant de débuter cette formation.
Cette formation a complètement répondu à mes attentes dans la mesure où je comprends maintenant le métier de data scientist, et les différentes étapes à mettre en œuvre dans un projet.”

Florian
Axiodis
“Les modules m’ont permis de nous introduire à une grande panoplie d’outils data analyse et algorithmes de machines learning accompagné de la théorie pour leur donner un sens, et la présentation de site Dataiku ou Kaggle nous offre de quoi continuer à apprendre et pratiquer. Bilan : très satisfait de ces quatre jours.”

Jean-Baptiste
Celad
“Globalement, je pense être capable de décrire le métier de datascientist et des compétences mises en œuvre. Je pense appliquer certaines connaissances acquises surtout dans la mise en forme des données pour une exploitation plus efficace à court terme.”

Fabienne
CS Group

Nos autres formations en hautes technologies

Formations agilité, Safe et scrum master

Architecture

formations big data - Retengr - icone

Data

Formation Devops Toulouse et Paris - Retengr

DevOps

Formation web mobile, android et ios -  Toulouse et Paris - Retengr

Agilité

Formation web Html, css, javascript, angular - Retengr

Web client

pictogramme formations développement applications mobiles

Web mobile

Prêt(e) à penser comme un Data Scientist ?

Contactez-nous !

1.

Vous remplissez ce formulaire

2.

Nous vous recontactons sous 48h

3.

Nous finalisons ensemble votre inscription