Ключевые библиотеки по анализу данных: Pandas | OTUS

Ключевые библиотеки по анализу данных: Pandas

Помимо NumPy, одной из важнейших библиотек для анализа данных является Pandas. По сути, работа Pandas с данными выстроена на основе той же библиотеки NumPy, которая является инструментом более низкого уровня.

1-1801-b75093.png

Pandas предоставляет специальные структуры данных, а также операции, позволяющие манипулировать временными рядами и числовыми таблицами. Впрочем, само название говорит за себя и происходит от эконометрического термина "панельные данные", который применяется в целях описания многомерных структурированных наборов информации. Распространяется Pandas под лицензией BSD.

На практике те же системные аналитики данных, как правило, используют плоские таблицы, типа Excel и SQL. При этом библиотека Pandas позволяет работать с 2-мерными таблицами на Python.

Пример таблицы в Pandas:

content_python_libraries_and_packages_pandas_dataframe_1024x298_1-1801-5269a0.png

Таким образом, Pandas представляет собой высокоуровневую библиотеку, позволяющую выполнять следующие функции:

  • построение сводных таблиц;
  • выделение колонок;
  • применение фильтрации по параметрам;
  • группировка по параметрам;
  • запуск функций (сложение, нахождение медианы/максимального/среднего/минимального значений);
  • объединение таблиц и многое другое.

Есть возможность создавать и многомерные таблицы.

Если хотите знать про Pandas больше, возможно, вас заинтересует следующий перевод.

2-1801-9c9724.png

Ну и, разумеется, вас вряд ли оставит равнодушным курс "Системный аналитик. Advanced".

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто