Votre pipeline de donnée avec Apache Beam

Quickie

bigd

Track : Big Data, Machine Learning, Analytics

Niveau de la présentation : beginner/novice

Horaire : Friday 12:00 12:15

Résumé de la présentation :

Apache Beam est un ensemble d'SDKs open sources et un modèle de traitement de données distribué, pour faire du Streaming ou du Batch. Il est à la fois compatible avec plusieurs moteurs de calcul tel que Google Dataflow, Apache Spark ou Apache Flink, et utilisable avec plusieurs langages de programmation. Dans ce talk, nous allons découvrir les notions principales d'Apache Beam.

Room name is available few days before the conference.

Souhaib Guitouni Souhaib Guitouni

I am a backend and data engineer at BlaBlaCar. I have, on many occasions, worked on data ingestion pipelines and distributed systems, and been interested in Apache Beam and Dataflow lately.