PLK-3557 Spark-adabra : Comment construire un datalake ! | Devoxx

Spark-adabra : Comment construire un datalake !

University

bigd Big Data, Machine Learning, IA & Analytics

Neuilly 253

Wednesday from 09:30 til 12:30

C’est la révolution dans la BI, les zones tampon FTP laissent la place aux systèmes de fichier distribués, le SQL s'exécute sur Hadoop, les dashboard en HTML5 remplacent les clients lourds, mais ne peut-on pas rationaliser un peu l’approche ?

Comment s’y prendre pour transformer une chaine BI en datalake ?

Cette université fera le tour de l’ingénierie des données en mode BigData. Au travers d’une présentation détaillée des concepts, de retour d’expériences et d’un cas pratique, nous allons découvrir :

  • les technologies et l’architecture, avec Spark, Kafka, Elasticsearch, Impala et Mesos,
  • et les méthodes associées : cycle de développement avec Hadoop, tests unitaires, jointures, gestion de la qualité de donnée, recette en mode Big Data et gestion des métadonnées.
Jonathan Winandy Jonathan Winandy

Jonathan est ingénieur Data.

Il a travaillé dans différents contextes, MOA/MOE, développeur Java/Scala/Clojure pour des éditeurs/startups, architecte de plateformes distribuées. Au cours de son expérience professionnelle, Jonathan s’est spécialisé dans l’analyse de sources de données pour faciliter la construction d’entrepôt de données.

Il présente régulièrement des sujets d’actualité lors de conférences.

Bachir Aït M'Barek Bachir Aït M'Barek

Issu d'un parcours BI et CRM j'accompagne aujourd'hui mes clients dans leur ouverture aux solutions Big Data en qualité de Data Engineer chez Ebiznext

TBA : To be announced / Salle non affectée