Big Data

big data définition

 

Le Big Data (ou mégadonnées) désigne un ensemble très volumineux de données qui ne peuvent être gérées que par des intelligences informatiques complexes.

Il prend place dans tous les domaines, à partir du moment où il est nécessaire de traiter un grand volume de données numériques.

 

L’origine du Big Data

 

Le Big Data prend sa source dans les années 70, avec le développement de l’informatique et de la nécessité d’organiser de grands volumes de données.

C’est Edgard F. Codd, informaticien chez IBM, qui apporta la solution à ce nouveau problème en inventant les bases de données relationnelles. Celles-ci organisent les données à l’aide de tableaux à deux dimensions.

Les logiciels qui gèrent les bases de données utilisent généralement un langage spécifique pour les traiter : le SQL.

Depuis, les outils, méthodes et approches se sont multipliées et pour les spécialistes du traitement de données, suivre des formations professionnels au Big Data est devenu essentiel.

 

Les 5V du Big Data

Pour comprendre les enjeux du Big Data, il est communément admis de parler des 5V du Big Data :

  • Volume
  • Vélocité
  • Variété
  • Valeur
  • Véracité

Le volume

Le volume désigne l’immense quantité d’informations présentes dans les bases de données.

Un système Big Data traite un volume de données bien supérieur à ce que traitent les bases de données traditionnelles. Cela pose un défi de poids : les volumes de données sont supérieurs aux capacités de stockage d’un ordinateur.

C’est pourquoi ils nécessitent des mises en réseau ou encore l’utilisation du Cloud Computing.

 

La vélocité

La vélocité est le terme qui désigne la vitesse (ou la rapidité) avec laquelle ces données sont générées, collectées, stockées et enfin, analysées.

Un système Big Data, c’est un système dans lequel la donnée circule vite entre les outils, les bases, les applicatifs, les sources. Celles-ci arrivent dans le système en provenance de diverses sources et sont le plus généralement traitées en temps réel pour générer des insights et mettre à jour le système.

 

La variété

La variété désigne la diversité des données, que cela soit en termes de nature, de format ou encore de structure. Dans le Big Data, les données sont dans leur majorité non-structurées ou semi-structurées.

 

La valeur

La valeur est tout simplement le fait que le Big Data et le traitement des données soit une valeur de profit.

 

La véracité

La véracité désigne la fiabilité et la conformité des données récoltées.