Boontadata


Architectures de traitement de stream

Flink

Apache Flink est un moteur de traitement streaming open source. A l'origine de ce framework, l'idée selon laquelle il est possible de considérer un traitement batch comme un traitement sur un flux de données fini.

Spark Structured Streaming

Dans ce blogpost, nous allons développer notre étude autour d’un moteur de traitement streaming récent: Spark Structured Streaming. Scalable, tolérant aux pannes, à l’instar de Spark streaming, il se base sur le moteur Spark SQL et permet ainsi la construction plus simple d’applications.

Spark Streaming

Dans ce blog post, nous allons nous pencher sur l’étude d’un moteur de traitement: Spark Streaming. Extension de l’API Spark, il permet de mettre en place des processus de streaming répondant à des problématiques de vitesse, tolérances à la panne, scalabilités lorsqu’il s’agit de données provenant d’un flux Stream (ces données peuvent venir de divers sources tel que Flume, Kafka)

Interview Bigdata Hebdo

Benjamin Guinebertière nous parle de Boontadata lors d'une interview dans le podcast Bigdata Hebdo.

Hello Boontada-stream !

Les architectures de traitement de données sont très diverses et peuvent être complexes. Le projet Boontadata-stream vous apporte un éclairage sur celles-ci. Commençons par comprendre les architectures lambda, et ce qui nous a amené aux architectures de streaming actuelles