1. Contexte

A l’heure des BigData, il devient primordial d’avoir la capacité d’analyser et de traiter vos données volumineuses.
L’exploitation des données n’est pas une science nouvelle : Depuis longtemps, la « business intelligence » adresse ce problème.
Mais force est de constater que l’évolution d’internet, l’apparition des objets connectés, la multiplications des API, ainsi que les technologies de stockage (cloud, Hadoop) et de traitement de masse offrent d’immenses perspectives.
Le consultant BigData doit avoir des compétences pluri-disciplinaires : A la fois sur la partie infrastructure & outils, mais aussi sur la partie gestion des données et datascience.
Cette certification sera le gage de vos compétences transverses sur les technologies qui concourent à la manipulation des Bigdata.

 

2. Compétences certifiées :

  • Gérer un projet Bigdata
  • Collecter et stocker des données
  • Traiter des données volumineuses
  • Mettre en place un projet de Datascience

 

3. Capacités évaluées

  • Utiliser le vocabulaire afférent au domaine
  • Choisir et orchestrer les différents outils de l’écosystème Bigdata.
  • Déterminer une feuille de route pour un projet Bigdata
  • Définir les sources de données intéressantes : OpenData, Objets Connectés, …
  • Mettre en œuvre les solutions efficaces pour collecter les données
  • Traiter les données en continue
  • Structurer et stocker des données volumineuses
  • Mettre en œuvre des traitements de masse
  • Paramétrer un environnement de traitements distribués pour en améliorer les performances
  • Déterminer les données pertinentes pour mettre en œuvre des modèles prédictifs
  • Préparer, nettoyer, transformer les données
  • Sélectionner les algorithmes d’intelligence artificielle adaptés
  • Déployer des algorithmes prédictifs en production

 

4. Modalités d’évaluation

Une soutenance est organisée afin d’évaluer les compétences acquises et valider la certification.

 

1 – Composition du Jury

Le jury est composé de trois rôles :

  • Président du jury : Il est sélectionné en fonction de sa capacité à piloter les échanges durant l’entretien afin que ces derniers restent toujours en phase avec l’évaluation des compétences requises pour la certification. Il devra avoir une connaissance parfaite du contenu de la certification en termes de compétences cibles.
  • Expert technique industriel : Il devra avoir plusieurs années d’expérience dans l’industrie, notamment dans les domaines de compétences couverts par la certification. Avoir lui-même obtenu la certification sera un plus quant à sa sélection.
  • Responsable technique & pédagogique : Impliqué durant le cursus du candidat il pourra apporter des éclaircissements sur le cursus de formation ainsi que le projet mis en place par le candidat.

 

2 – Détail de l’organisation de l’épreuve

En amont de la session d’évaluation, le candidat a réalisé un projet en entreprise concernant le développement d’une application utilisant, tout ou partie, les compétences requises à l’obtention de la certification. Il a préparé un dossier de projet ainsi qu’un support de présentation.

Au moins 10 jours avant la session d’examen, le candidat a remis à l’organisateur son dossier de projet.

Lors de la session d’examen, le candidat présente son projet à l’aide d’un support de présentation.

 

3 – Informations complémentaires concernant la présentation d’un projet réalisé en amont de la session :

L’entreprise fournit au candidat le cahier des charges du projet. Le candidat s’assure au moyen des référentiels de compétence et de certification que le projet répond aux attendus concernant la mise en œuvre des compétences de l’une ou l’autre des activités (Bigdata ou Datascience).

 

4 – Mise en œuvre des compétences lors de la réalisation du projet

Le candidat se verra confier des responsabilités sur un projet. Ces responsabilités pourraient ne pas couvrir l’ensemble des compétences requises pour l’obtention de la certification. Aussi, nous proposons une segmentation de ces compétences en deux parties. Au moins l’une de ces deux parties devra être intégralement couverte par le projet qui sera présenté. Les compétences non couvertes feront l’objet de questions techniques durant l’entretien avec le jury.

 

PARTIE 1 : BIGDATA

  • Définir les sources de données intéressantes : OpenData, Objets Connectés, …
  • Mettre en œuvre les solutions efficaces pour collecter les données
  • Structurer et stocker des données volumineuses
  • Mettre en œuvre des traitements de masse
  • Paramétrer un environnement de traitements distribués pour en améliorer les performances
  • Mettre en œuvre des mécanismes de traitement des données en continue

 

PARTIE 2: DATASCIENCE

  • Extraire efficacement des données d’un référentiel d’entreprise (datalake)
  • Déterminer les données pertinentes pour mettre en œuvre des modèles prédictifs
  • Préparer, nettoyer, transformer les données
  • Sélectionner les algorithmes d’intelligence artificielle adaptés
  • Déployer des algorithmes prédictifs en production
  • Le projet donne lieu à deux productions :
  • Un dossier de projet à remettre à l’organisateur en amont de la session d’examen
  • Une présentation orale du projet, basée sur un support de présentation, à réaliser devant le jury

 

5 – Contenu du dossier de projet

Le dossier de projet respecte ce plan type :

  • Liste des compétences du référentiel qui sont couvertes par le projet
  • Résumé du projet en français d’une longueur d’environ 20 lignes soit 200 à 250 mots, ou environ 1200 caractères espaces non compris
  • Cahier des charges, expression des besoins, ou spécifications fonctionnelles du projet
  • Spécifications techniques du projet, élaborées par le candidat, y compris une proposition d’infrastructure technique
  • Réalisations du candidat comportant les extraits de code les plus significatifs et en les argumentant
  • Présentation du jeu d’essai élaboré par le candidat de la fonctionnalité la plus représentative (données en entrée, données attendues, données obtenues)

La longueur du dossier de projet hors annexes est de 30 à 35 pages, soit environ 48 750 caractères espaces non compris.7

 

6 – Contenu de la présentation orale

Le candidat présente son projet à l’aide d’un support de présentation réalisé en amont de la session d’examen, et selon ce canevas :

  • Présentation de l’entreprise et/ou du service
  • Présentation du contexte(cahier des charges, environnement humain et technique)
  • Présentation de l’architecture technique et fonctionnelle retenue
  • Explication de la nature des données manipulées et des mécanismes de stockage utilisés
  • Description des usages des différentes technologies
  • Synthèse et conclusion (satisfactions et difficultés rencontrées)

Cette présentation inclut, au choix du candidat, une illustration ou une démonstration du projet. Une combinaison des deux est possible. Leur durée cumulée dans la présentation ne doit pas excéder 15 minutes.

Dans le cas où l’entreprise dans laquelle le projet a été réalisé souhaite empêcher la divulgation de données confidentielles, la démonstration sera remplacée par un exposé. Ce dernier traitera d’une difficulté rencontrée en cours de projet et de comment cette difficulté a été surmontée.

Dans le cadre de la présentation et de la démonstration, le candidat peut apporter son équipement en tenant compte des contraintes du plateau technique du centre organisateur.

L’entretien technique se déroule obligatoirement à l’issue de la présentation du projet réalisé en amont de la session. Cet entretien pourra porter sur n’importe laquelle des compétences exigées pour l’obtention de la certification.

 

5. Valeur de la certification :

 

Pour le certifié :

  • L’acquisition de ces nouvelles compétences en très forte demande sur le marché de l’emploi
  • La capacité à gérer un projet et à atteindre un objectif
  • Le renforcement de sa crédibilité au sein de l’entreprise
  • Pour les personnes en insertion ou en reconversion, cette compétence augmente l’employabilité dans tous les secteurs d’activités et quelle qu’elle soit la taille de la société (Indépendant, PME/PMI, Grande entreprise, Institution, domaine Public, ESN…)
  • Pour un salarié, cette certification assurera des meilleures possibilités d’évolution de carrière
  • La possibilité d’exercer comme travailleur indépendant
  • La confiance en soi est dans le savoir-faire acquis.

 

Pour l’entité utilisatrice :

  • La garantie pour l’entreprise des compétences des collaborateurs
  • La confiance des entités en leurs personnels informatiques
  • L’intégration des compétences nouvelles et en pleines évolutions
  • L’autonomie et la réactivité à accomplir les tâches
  • La garantie d’un meilleur retour sur investissement
  • Anticiper les besoins et l’évolution de technologies d’analyse d’information
  • Guider et optimiser les opérations marketing, commerciales, financières