
Matthieu Blanc
From Xebia
Consultant senior (Scala/Java) dans le domaine du Big Data. Spécialisé sur l'écosytème Hadoop (Spark, MapReduce, Hive, Impala) et les systèmes distribués en général. Formateur Hadoop et Spark certifié par Cloudera.
Blog: http://blog.xebia.fr/

Apache Kafka - Stream Data Platform
Kafka est un système de messagerie distribué, en mode publish-subscribe, persistant les données qu'il reçoit, conçu pour facilement monter en charge et supporter des débits de données très importants.
Originellement développé chez LinkedIn, et maintenu au sein de la fondation Apache depuis 2012, son adoption n'a cessé de croitre pour en faire un quasi de-facto standard dans les pipelines de traitement de données.
Venez découvrir cet outil durant ce Hand's on de 3h où vous installerez un mini cluster Kafka et explorerez ses différentes API. En bonus, vous aurez la possibilité d'analyser vos données en temps réel avec Spark Streaming.
Matériel nécessaire : un ordinateur sur lequel vous aurez préalablement installé votre IDE préféré (IntelliJ / Eclipse) ainsi que Maven ou SBT. Le développement sera en Scala ou Java.