Souhaib Guitouni

Souhaib Guitouni

BlaBlaCar

I am a backend and data engineer at BlaBlaCar. I have, on many occasions, worked on data ingestion pipelines and distributed systems, and been interested in Apache Beam and Dataflow lately.

bigd

Track : Big Data, Machine Learning, Analytics

Type de présentation : Quickie

Votre pipeline de donnée avec Apache Beam

Apache Beam est un ensemble d'SDKs open sources et un modèle de traitement de données distribué, pour faire du Streaming ou du Batch. Il est à la fois compatible avec plusieurs moteurs de calcul tel que Google Dataflow, Apache Spark ou Apache Flink, et utilisable avec plusieurs langages de programmation. Dans ce talk, nous allons découvrir les notions principales d'Apache Beam.