Блог BigData

04.11.20 в 14:55

Hadoop представляет собой свободно распространяемый фреймворк, а также набор утилит и библиотек. Он используется при разработке и выполнении распределённых программ, функционирующих на кластерах из множества узлов (сотен и даже тысяч). По сути, речь идёт о технологиях, предназначенных для хранения и обработки больших данных.

0

28

Андрей Павленко

31.10.20 в 09:27

Как генерируются, хранятся и обрабатываются Big Data?

BigData → Полезные материалы по BigData

Большие данные в наше время берутся из различных источников. Самый простой пример — рекламные и социальные сети. Но даже если ваша компания невелика и не предоставляет свои услуги миллионам пользователей, вы всё равно сможете работать с Big Data. Собрать данные можно, например, посредством веб-скрапинга. Кроме этого, существуют сервисы, предоставляющие API для доступа к своим данным.

0

3

Егор

21.10.20 в 15:26

Роль Apache Kafka в системах обработки данных

BigData → Полезные материалы по BigData

На сегодняшний момент почти в каждой компании, которая серьезно подходит к вопросам сбора и обработки данных, есть какой-либо брокер сообщений. Это может быть AWS Kinesis, Google PubSub или какой-то еще сервис. Но если мы говорим о компаниях, размещающих сервисы не в облаке, а на своей инфраструктуре, то в качестве брокера чаще всего выступает Apache Kafka.

2

0

189

Пользователь #39767

11.08.20 в 10:52

Эффективное сжатие колоночных данных с помощью оптимальных алгоритмов кодирования

BigData → Полезные материалы по BigData

Основы

Amazon Redshift — это база данных, предназначенная, в первую очередь, для аналитики и запросов OLAP. Одна из ее ключевых функций — хранение данных в колоночном формате (columnar storage).

1

0

14

Андрей Павленко

29.07.20 в 16:31

Где применяются большие данные?

BigData → Полезные материалы по BigData

Сегодня термином Big Data описывают наборы данных большого объёма, которые растут с течением времени. Ценность Big Data стали понимать уже давно, поэтому многие компании, в том числе и отечественные, не жалеют денег на соответствующие проекты и специалистов. Big Data-инженеры владеют специальными инструментами для работы с большими данными, поэтому они способны собирать и обрабатывать огромные массивы информации, что необходимо для решения разнообразных прикладных задач. В этой статье мы рассмотрим, в каких именно областях сегодня востребовано популярное направление Big Data.

0

7

Андрей Павленко

23.07.20 в 17:57

Elasticsearch — инструмент для сбора и анализа данных среднего объёма

BigData → Полезные материалы по BigData

Если бизнес предполагает выполнение анализа статистических данных, которые поступают из разных источников, то вам в любом случае потребуется эти данные не только собирать и хранить, но и индексировать, анализировать и даже преобразовывать в другие данные. Какое решение подойдёт лучше, если речь идёт о данных среднего объёма? Об этом — наша статья.

0

78

Петр

28.04.20 в 19:48

Метод R/S: вычисление показателя Херста

BigData → Полезные материалы по BigData

Math_DS_Deep_6.5-5020-13cf58.png

Мы уже упоминали про показатель Херста. Однако существует и иной метод его вычисления — «метод нормированного размаха». О нём и поговорим.

1

0

12

Андрей Павленко

06.03.20 в 17:31

Типы нейронных сетей. Принцип их работы и сфера применения

BigData → Полезные материалы по BigData

Искусственный интеллект и искусственные нейронные сети становятся всё популярнее. В этой статье мы рассмотрим основные разновидности нейронных сетей и поговорим о том, как они работают и где применяются. Что включает в себя понятие нейронных сетей, как происходит развитие нейронной сети с точки зрения их эксплуатации в реальной жизни.

0

179

Андрей Павленко

02.03.20 в 13:15

Простейшая нейронная сеть на Python

BigData → Полезные материалы по BigData

В этой статье мы рассмотрим, как создать собственную простейшую нейронную сеть с помощью языка программирования «Питон». Мы не только создадим нейронную сеть с нуля, но и не будем использовать никаких библиотек. И займёт это всё не более девяти строчек кода на «Питоне».

0

47

Пользователь #39767

07.02.20 в 16:13

Data Build Tool (DBT) для построения модели Хранилища Данных

BigData → Полезные материалы по BigData

Data_Engineer_Deep_5.5-5020-cdb819.png

1. Что такое Data Build Tool

DBT — это многофункциональный фреймворк для создания модели Хранилища Данных. В акрониме ELT (Extract, Load, Transform) DBT занимает этап T. Это инструмент для работы с данными, которые уже загружены в ваше хранилище, но над ними нужно произвести ряд преобразований, чтобы подготовить к использованию.

2

0

266

Vue.js разработчик

Блог BigData

Основы

1. Что такое Data Build Tool