Анализируем временные ряды в Pandas

С помощью Pandas довольно удобно анализировать временные ряды. Давайте посмотрим, как это работает.

Для примера возьмем цену на акции Apple за пять лет по дням. Вы можете скачать файл для практики здесь.

Таким образом, мы формируем DataFrame с DatetimeIndex по колонке Date, а также выполняем сортировку нового индекса в правильном порядке, что потребуется для работы с выборками. Если же колонка имеет датовременной формат, отличный от ISO8601, тогда для правильного перевода строки в необходимый тип, можно воспользоваться методом pandas.to_datetime.

Что же, узнаем среднюю цену акции (в нашей таблице это mean) на закрытии (Close):

А теперь ради интереса возьмем промежуток с февраля 2012 до февраля 2015 и высчитаем среднее значение:

Надо узнать среднюю цену закрытия еженедельно? Не беда:

Остается добавить, что resampling -- это мощный инструмент по работе с временными рядами (time series), который помогает переформировать выборку таким образом, каким хотите. При этом 1-м аргументом метод resample принимает строку rule. В принципе, все необходимые значения вы без проблем найдете в официальной документации Pandas.

По материалам блога https://khashtamov.com/ru/.