Certification Datascience et intelligence artificielle

 

Contexte

La maîtrise de la data est l’un des enjeux majeurs des décennies à venir.

En effet, depuis quelques années, la nature, le format et la quantité des données augmentent rapidement grâce à la multiplication des flux d’informations et des NTIC (Nouvelles Technologies de l’Information et de la Communication).

La croissance de ces données et le potentiel commercial qu’elles représentent appellent nécessairement des fonctions professionnelles capables de les exploiter, quel que soit le format sous lequel elles se présentent.
On assiste, au sein des entreprises, à une hausse des besoins pour traiter ces grands volumes de données hétérogènes (Big Data).

Bien que la majorité des entreprises aient conscience de l’incroyable opportunité que représentent les données, il existe un écart entre leurs aspirations à être pilotées par la donnée et la capacité de leurs collaborateurs à créer de la valeur commerciale avec ces données.

Les données sont généralement le point de départ de toute stratégie en IA, car de leur disponibilité dépendent de nombreux usages et applications. L’exploitation des données permet notamment d’assurer un meilleur suivi de leur performance, d’analyser les comportements des consommateurs, d’identifier des opportunités de marché…

En convertissant ces masses de données en enseignements commercialement exploitables, la data science et l’intelligence artificielle émergent dans ce contexte comme un levier et un relais de croissance économique. Elles facilitent la prise de décision au sein des entreprises confrontées aux Big Data, qui évoluent sur des marchés très concurrentiels.

Ces pratiques ont engendré la naissance d’un tout nouveau secteur et de nouveaux emplois : la data science.

Cette nouvelle branche étant au cœur de la chaîne d’exploitation de la donnée, cela explique la hausse de la demande de profils compétents dans ce domaine.L’industrie de la donnée propose de nombreuses opportunités en matière d’emploi : les spécialistes des données sont particulièrement recherchés par les entreprises de tous les secteurs, avides d’organiser, d’analyser et de comprendre la multitude d’informations dont elles disposent afin de développer de nouveaux modèles économiques.

Les emplois proposés dans l’intelligence artificielle sont nombreux mais les professionnels dotés des bonnes compétences sont rares. Sans être forcément développeur, il faut être à la fois axé data, mais aussi bien connaître les disciplines de l’IA comme le machine learning.

Confrontées à une évolution de plus en plus rapide du marché, les entreprises doivent se montrer agiles et ingénieuses afin de créer de la valeur autour de la donnée. Créer de la valeur revient à placer la donnée au cœur du projet d’entreprise : en interne, les efforts doivent être réalisés de concert entre les différents postes clés.
L’entreprise est également tenue de déterminer son usage des flux de données générés par les canaux spécifiques (réseaux sociaux, moteurs de recherche), et s’en servir comme avantage concurrentiel. Elle doit donc s’appuyer sur des compétences particulières touchant notamment l’analyse et l’exploitation des données.

Ces compétences pointues et nouvelles dans l’exploitation des données sont fortement plébiscitées et pourtant trop rares.

Celles-ci relèvent de trois domaines : celui de la collecte et du stockage des données, celui du traitement et de la modélisation des données et celui de la protection des données.

L’ingénieur informatique au sens large et les nouveaux métiers tels que Data Engineer, Data Scientist, Développeur, Administrateur/intégrateur, Architecte, doivent maîtriser ces nouvelles compétences autour de la data et de l’Intelligence Artificielle.

 

Compétences certifiées :

 

  • Identifier les besoins et la problématique à résoudre d’un service ou d’une direction métiers pour définir avec justesse le périmètre des données nécessaires à leur résolution et en adéquation avec la RGPD (Règlement Général sur la Protection des Données)
  • Sélectionner, extraire, nettoyer, structurer, analyser des volumes importants de données pour en faciliter l’exploitation et la valorisation
  • Créer des modèles d’Intelligence Artificielle , notamment des modèles prédictifs afin d’anticiper l’évolution de la data et des tendances relatives à l’activité de l’entreprise, en optimisant le fonctionnement des algorithmes et en sélectionnant le type de machine learning qui répond aux besoins
  • Mesurer la performance des modèles construits
  • Développer des modèles d’intelligence artificielle en s’appuyant sur une programmation en langage Python

 

Activités visées

 

  • Sélection des données, en adéquation avec la RGPD (Extraction, nettoyage, uniformisation et structuration des données).
  • Création de modèles d’Intelligence Artificielle.
  • Mesure de la performance des modèles construits
  • Programmation en langage Python pour développer des modèles d’intelligence artificielle

 

Compétences attestées

 

  • Identifier les besoins et la problématique à résoudre d’un service ou d’une direction métiers pour définir avec justesse le périmètre des données nécessaires à leur résolution et en adéquation avec la RGPD (Règlement Général sur la Protection des Données).
  • Collecter les données en déterminant les outils et méthodes d’acquisition les plus appropriés depuis un ensemble de bases hétérogènes afin de permettre la mise en place d’un modèle d’IA
  • Analyser, comprendre, nettoyer (feature engineering) de façon adaptée en fonction des algorithmes de machine learning qui seront utilisés
  • Élaborer des modèles prédictifs afin d’anticiper l’évolution de la data et des tendances relatives à l’activité de l’entreprise.
  • Sélectionner les algorithmes statistiques et/ou mathématiques pertinents afin de mettre en place la phase d’apprentissage préalable à la prédiction.
  • Adapter la structure des données issue de la sélection des données (feature engineering) aux différents algorithmes utilisés pour en améliorer l’efficacité·
  • Optimiser le fonctionnement des algorithmes en adaptant la valeur de leurs méta-paramètres
    Sélectionner le type de machine learning qui répond à son besoin parmi les stratégies « classification, régression ou clustering »
  • Automatiser les manipulations de données avec un pipeline
  • Mettre en œuvre les jeux d’apprentissage et de test afin de permettre à la fois la construction d’un modèle par apprentissage mais aussi la mesure de son efficacité
  • Respecter les bonnes pratiques de construction du jeu de données d’apprentissage afin de s’assurer de l’obtention d’un modèle réaliste
  • Mesurer l’efficacité des modèles produits et les mettre à jour régulièrement afin d’en assurer la continuité.
  • Collaborer par une meilleure communication autour des données avec les différents métiers, services, … afin de mettre en place des modèles d’intelligence artificielle réalistes et performants.
  • Utiliser le langage Python et ses librairies scientifiques (scikit-learn, pandas, tensorflow) afin de permettre la mise en place des activités liées à l’intelligence artificielle
  • Exploiter les avantages du langage Python pour analyser et visualiser plus facilement les données.

 

 

Modalités d’évaluation

 

L’évaluation de l’acquisition des compétences se fera en deux phases :

  • Un QCM de synthèse de fin de parcour :Sur une durée d’une heure, le stagiaire doit répondre à 20 questions (questions à choix multiple, questions ouvertes ou exercices à résoudre ). Une note sur 20 est attribuée à l’issue de ce QCM. Un résultat de 10 sur 20 minimum est exigé sur cette épreuve.
  • Une étude de cas fil rouge durant la formation avec pour livrables attendus :
    • Utilisation de python et pandas pour sélectionner des données : extraction, nettoyage, uniformisation pour un traitement ultérieur
    • Création d’un modèle de visualisation des données à partir de Python
    • Choix d’algorithmes pour créer un modèle d’intelligence artificielle
    • Création du modèle en utilisant le langage de programmation python et la librairie scikit-learn
    • Proposition et mise en place de la mesure de la performance du modèle réalisé

A l’issue de ce fil rouge, les participants auront conçu une solution basée sur la datascience et l’intelligence artificielle. La construction de cette solution se décomposera en plusieurs étapes pratiques (exercices). Ces étapes seront précédées par une présentation théorique des concepts nécessaires à leur mise en œuvre. Un résultat de 10/20 minimum sur cette épreuve est exigé.

La certification sera attribuée à tous les candidats ayant obtenu une note minimale de 20/ 40 correspondant au cumul des deux notes.

 

Valeur de la certification

 

Pour le certifié

 

  • L’acquisition de ces nouvelles compétences en très forte demande sur le marché de l’emploi
    Le renforcement de sa crédibilité au sein de l’entreprise
  • Pour les personnes en insertion ou en reconversion, cette compétence augmente l’employabilité dans tous les secteurs d’activités et quelle qu’elle soit la taille de la société (Indépendant, PME/PMI, Grande entreprise, Institution, domaine Public, ESN…)
  • Pour un salarié, cette certification assurera des meilleures possibilités d’évolution de carrière
  • La possibilité d’exercer comme travailleur indépendant
  • La confiance en soi est dans le savoir-faire acquis.

 

Pour l’entité utilisatrice

 

  • La garantie pour l’entreprise des compétences des collaborateurs
  • La confiance des entités en leurs personnels informatiques
  • L’intégration des compétences nouvelles et en pleines évolutions
  • L’autonomie et la réactivité à accomplir les tâches
  • La garantie d’un meilleur retour sur investissement
  • Anticiper les besoins et l’évolution de technologies d’analyse d’information
  • Guider et optimiser les opérations marketing, commerciales, financières