5 фактов про Spark | OTUS

5 фактов про Spark

Spark -- известный open source-фреймворк из экосистемы Hadoop-проектов, позволяющий выполнять распределенную обработку как неструктурированных, так и слабоструктурированных данных. Рассмотрим несколько фактов, которые стали причиной популярности фреймворка.

spark_consulting_1_1_1-20219-bd365b.jpg

Факты про Spark:

  1. Во-первых, Apache Spark является фреймворком для обработки данных в области Big Data. А так как он работает в оперативной памяти и обращается к диску редко, то и обработка данных осуществляется очень быстро, что не может не радовать.
  2. Во-вторых, ранее стандартом для обработки данных был Hadoop MapReduce. Однако он известен двумя существенными недостатками: повышенная сложность разработки и низкая производительность. В Spark в этом плане все интереснее.
  3. В-третьих, закономерным результатом предыдущего утверждения стало то, что сегодня стандартом, по сути, стал Apache Spark. Этот фреймворк создавался для решения двух задач: устранение минусов MapReduce при сохранении его преимуществ.
  4. В-четвертых, Apache Spark и прочие Big Data-технологии сегодня активно используются в облаках. В результате это дает возможность еще и получать все преимущества современных облачных сервисов.
  5. В-пятых, Spark эффективно используется в Kubernetes, что позволяет активно использовать технологии контейнеризации, причем о конкретных преимуществах этого мы уже писали.

1-1801-435608.png

Таким образом, можно сделать однозначный вывод: Spark достоин того, чтобы его изучать. Сделать это можно на курсах Otus. Не пропустите!

1-20219-0875c4.png

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто