Анализируем данные: структура DataFrame в Pandas

В одной из статей мы затрагивали такую структуру данных, как Series. Сегодня рассмотрим DataFrame.

Объект DataFrame можно представить в форме обычной таблицы и по большему счету это будет правильным, так как DataFrame — табличная структура данных. И, как известно, в любой таблице есть столбцы и строки. В DataFrame столбцы — это объекты Series, строки которых являются непосредственными элементами этих столбцов.

Сконструировать DataFrame достаточно просто, для чего можно использовать пример словаря в Python:

Дабы убедиться, что столбец в DataFrame — это Series, давайте извлечем любой столбец:

Также следует обратить внимание на то, что у DataFrame-объекта есть два индекса: по столбцам и строкам. И если индекс по строкам не задан явно, то библиотека pandas задает целочисленный индекс RangeIndex от 0 до N-1, где N — это число строк в таблице.

Следовательно, в нашей таблице существуют четыре элемента от 0 до 3.

По материалам блога https://khashtamov.com/ru/.