Apache Flink est un moteur de traitement streaming open source. A l'origine de ce framework, l'idée selon laquelle il est possible de considérer un traitement batch comme un traitement sur un flux de données fini.
Écrit par
Bastien Brunod
le 2017-05-04
Dans ce blogpost, nous allons développer notre étude autour d’un moteur de traitement streaming récent: Spark Structured Streaming. Scalable, tolérant aux pannes, à l’instar de Spark streaming, il se base sur le moteur Spark SQL et permet ainsi la construction plus simple d’applications.
Écrit par
Gilles ESSOKI
le 2017-04-25
Dans ce blog post, nous allons nous pencher sur l’étude d’un moteur de traitement: Spark Streaming. Extension de l’API Spark, il permet de mettre en place des processus de streaming répondant à des problématiques de vitesse, tolérances à la panne, scalabilités lorsqu’il s’agit de données provenant d’un flux Stream (ces données peuvent venir de divers sources tel que Flume, Kafka)
Écrit par
Gilles ESSOKI
le 2017-04-18
Benjamin Guinebertière nous parle de Boontadata lors d'une interview dans le podcast Bigdata Hebdo.
Écrit par
Vincent Heuschling
le 2017-04-06
Les architectures de traitement de données sont très diverses et peuvent être complexes. Le projet Boontadata-stream vous apporte un éclairage sur celles-ci. Commençons par comprendre les architectures lambda, et ce qui nous a amené aux architectures de streaming actuelles
Écrit par
Vincent Heuschling
le 2017-03-29