Cloud Datalab : Google favorise l’exploration et la visualisation des données

Big dataCloudData-stockage

Disponible en version bêta, l’outil open source de développement Google Cloud Datalab permet d’extraire les tendances à partir de données brutes dans une vision big data.

Google vient de libérer la bêta de son outil open source de développement baptisé Cloud Datalab. Destiné avant tout aux experts scientifiques, il a vocation à faciliter l’exploration des données.

L’outil a été dévoilé lors de l’évènement Next de Google pour les développeurs qui s’est tenu hier à Paris (le 13 octobre 2015).

Basé sur une interface interactive, Google Cloud Datalab permet d’obtenir des informations à partir de données brutes.

L’outil permet en effet d’explorer et d’analyser les données (data mining), ainsi que de partager et de publier des rapports « d’une manière rapide, simple et efficace en termes de coût », précise Google dans un billet de blog.

Google Cloud Datalab associe la puissance de Google BigQuery (analyses big data) à Google Cloud Storage (stockage des données).

Le tout combiné avec des écosystèmes big data familiers tels que Hadoop et Spark.

Mais, de manière sous-jacente, le service exploite surtout IPython, un outil basé sur le langage informatique Python permettant d’analyser et de visualiser des données.

Il a été divisé en plusieurs packages au gré de sa transition vers le projet Jupyter (« open source, data science & scientific computing »)

Au coeur de l’outil de Google, on trouve d’ailleurs Notebook (composante du projet Jupyter) qui consiste en une application web pour le traitement interactif des données.

Notebook permet de créer des documents contenant du code, des graphiques, du texte, des images, des vidéos…

Jupyter a pour avantage d’être utilisé par la communauté scientifique et bénéficie de ce fait d’un écosystème important.

La première étape consiste à déployer Google Cloud Datalab comme une application App Engine (application web basée sur les serveurs de Google).

Cela signifie que l’outil tournera sur l’infrastructure de Google et qu’elle sera associée à un coût après la période de bêta.

Pour l’heure, la firme Internet de Mountain View n’a donné aucune indication sur les tarifs.

L’application installée, il suffit d’initier un nouveau projet pour commencer à exploiter ses données. Des templates de notebooks existent pour se familiariser avec l’outil.

Google Cloud Datalab permet par ailleurs de déployer des modèles basés sur l’auto-apprentissage (machine learning).

D’emblée, l’outil fait penser à Amazon QuickSight, la solution de business intelligence d’AWS (Amazon Web Service) qui permet également de combiner big data et data mining.

(Crédit photo : sakkmesterke, Shuttershock)

google-cloud-datalab
Google Cloud Datalab : l’exploration et la visualisation des données

Lire aussi :