Анализируем данные: структура Series в Pandas | OTUS

Анализируем данные: структура Series в Pandas

Обработка и анализ данных – важнейшая часть работы специалиста по системному анализу. В этом может помочь Pandas — программная высокоуровневая библиотека, написанная на Python. Главными структурами данных в ней являются Series и DataFrame. Не понимая их работу, выполнить качественный анализ будет невозможно. Сегодня поговорим про Series.

Series — объект, напоминающий одномерный массив (к примеру, список в Python). Отличительная черта — ассоциированные метки или так называемые индексы, расположенные, вдоль каждого элемента списка. Это особенность и превращает Series в ассоциативный массив либо словарь в Python.

1-1801-c9680f.png

В строковом представлении Series индекс находится слева, а элемент справа. Если же индекс не задан явно, pandas автоматически создаст RangeIndex от 0 до N-1, где N — общее число элементов. Кроме того, следует учесть, что в Series существует тип хранимых элементов (в примере это int64, ведь мы передавали целочисленные значения).

Также у объекта Series есть атрибуты, посредством которых вы сможете получить список элементов и индексы — values и index соответственно.

2-1801-64f981.png

Доступ к элементам Series осуществляется по индексу этих элементов.

3-1801-af1860.png

При этом мы можем задавать индексы явно:

4-1801-9f59e5.png

Также есть возможность осуществлять выборку по нескольким индексам и выполнять групповое присваивание:

5-1801-03e558.png

Что касается фильтрации, то это тоже не проблема для Series, плюс можно применять математические операции и т. д.:

6-1801-468a09.png

Но если сам объект Series напоминает словарь, где ключ — это индекс, а значение — сам элемент, то мы можем сделать следующее:

7-1801-64fcac.png

У объекта Series и его индекса присутствует атрибут name, который задает имя объекту и индексу.

8-1801-73e1ad.png

Индекс мы можем поменять без проблем, присвоив список атрибуту index объекта Series.

9-1801-55f1a4.png

Также имейте в виду, что список с индексами по длине в обязательном порядке должен совпадать с числом элементов в Series.

По материалам блога https://khashtamov.com/ru/.

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто