On les entend de plus en plus, mais pour les non-initiés ces termes restent souvent flous. Petit tour d’horizon de ces concepts informatiques que l’on voit fleurir partout.

Big Data

Le terme anglais « Big Data » peut être traduit par méga données, grosses données ou encore données massives. Il s’agit d’un concept apparu dès 1997 avec l’explosion de la quantité de données numériques à traiter par certains systèmes informatiques. La manipulation de ces gros ensembles de données numériques nécessite une approche spécifique, le terme « Big Data » recouvre donc donc la collecte, l’analyse, le stockage et la présentation de ces données.

90 % des données numériques jamais créées l’ont été ces deux dernières années. Certains acteurs majeurs comme Google ou Facebook produisent chaque jour des centaines de téraoctets à analyser, traiter, classer, stocker, sécuriser et restituer instantanément. C’est pour faire face à ces problématiques que le « big data » a été théorisé et que des solutions technologiques spécifiques ont été conçues.

Le « big data » reste un concept vaste, complexe et polymorphe. Il n’existe donc pas encore de définition universelle puisque celle-ci continuera d’évoluer avec les besoins et les réponses technologiques.

 

Open Data

L’ « open data » ou « donnée ouverte » est une donnée ou un ensemble de données accessible librement aux usagers. Mises à disposition de façon structurée et selon une licence ouverte, ces données peuvent être consultées ou utilisées sans restriction par des tiers. Certains outils très connus sont construits sur ce principe, comme Wikipedia ou Open Street Map. L’open data est donc un mode de partage de l’information qui concerne théoriquement n’importe quelle donnée d’origine publique ou privée non stratégique : données démographiques, économiques, culturelles, sanitaires, météorologiques, énergétiques… La mise à disposition structurée de ces informations vise d’une part à les rendre accessibles facilement et de façon transparente, mais aussi à permettre le développement d’outils d’analyse et de croisement pour identifier des problématiques et dégager des solutions.

 

Machine learning

Longtemps resté très conceptuel, le terme anglais « machine learning » que l’on peut traduire par « apprentissage automatique » est un champ de l’intelligence artificielle qui s’attache plus précisément à développer des solutions permettant à des systèmes d’information d’adapter leurs analyses et leurs comportements en réponse à l’analyse des données déjà traitées. Concrètement, le machine learning consiste à concevoir des systèmes capables « d’apprendre » et donc d’améliorer leur efficacité. Les champs d’application sont nombreux : de la sécurité des transactions bancaires à la médecine en passant par la robotique ou le big data.