Antoine Chambille | Devoxx

Antoine Chambille
Antoine Chambille Twitter

From ActiveViam

Antoine is a tech leader and the innovative developer of the ActivePivot analytical platform, now a global benchmark for in-memory computing and real-time analytics. He is a regular speaker at international tech conferences such as JavaOne, Devoxx or Discover.

In addition to developing and supporting ActivePivot, Antoine's R&D teams in New-York and Paris participate in international research projects in the field of Big Data analytics, and are involved in major technology partnerships that push away the limits of cloud computing and the Java platform.

Blog: https://activeviam.com/blog/author/antoine/

bigd Big Data, Machine Learning, IA & Analytics

Projet Sparkube: Transformer Apache Spark en cube OLAP

Tools-in-Action

Apache Spark est à l'origine une plateforme généraliste de traitement des données en batch. Mais aujourd'hui grâce au stockage des données en colonnes, la gestion de la mémoire off-heap, la génération de code et le push des prédicats, Spark a beaucoup en commun avec les grands systèmes OLAP optimisés pour l'analyse interactive.

Le projet Sparkube vient d'être lancé pour explorer cette idée, une extension Spark pour exposer les datasets comme des cubes multidimensionnels, sans rien avoir à configurer, et sans déplacer les données. Cette nouvelle stack (qui incorpore le moteur MDX d'ActiveViam) permet à des utilisateurs métier d'analyser les données d'un datalake directement dans une Pivot Table Excel, ou dans Tableau, en déléguant les hiérarchies, les filtres et les agrégations au moteur Spark.

Pendant la conférence nous expliquerons en détail comment Sparkube marche et nous ferons tourner un prototype en live pour illustrer les analyses et les expériences utilisateur qui deviennent possibles. Nous terminerons sur une analyse des performances du moteur Spark sur ces workloads OLAP.

TBA : To be announced / Salle non affectée