Spring Cloud Data Flow
Модуль Cloud Data Flow необходим приложениям в том случае, если они используют потоковую передачу и пакетную обработку данных. При этом данный фреймворк поддерживает целый спектр уже готовых кейсов обработки данных. Среди них:
- ETL (Extract, Transform, Load);
- потоковая обработка событий;
- прогнозная аналитика.
Основные характеристики модуля
Можно выделить:
- возможность развертывания приложений на платформах Cloud Foundry/Kubernetes;
- наличие готовых приложений для разных сценариев интеграции/обработки данных;
- наличие настраиваемых приложений, которые ориентированы на связующее программное обеспечение либо службы данных;
- возможность использования специального графического редактора, предназначенного для интерактивного построения конвейеров данных, а также для мониторинга метрик посредством Prometheus, Wavefront, Influx DB и прочих систем;
- поддержка REST API для создания/развертывания конвейеров данных, причем есть возможность работы из командной строки;
- для указания, какие именно приложения следует развертывать и как именно подключать входы и выходы предусмотрен простой потоковый конвейер DSL.
Сфера применения
Модуль Cloud Data Flow -- отличное решение при создании конвейеров потоковой обработки данных, к примеру, для пересылки каких-нибудь данных в базу и последующего удобного анализа этих данных.
Как освоить?
Для освоения модуля рекомендуется попробовать создать микросайт средствами Spring Cloud Data Flow. Также вы можете изучить уже существующие примеры использования.
Хотите научиться «выживать» в проектах, где есть «Спринг», добро пожаловать на специализированный курс в Otus!