10.07.21 в 10:17

Чтение и запись данных в Pandas

Бизнес-аналитика → Полезные материалы по аналитике бизнес-процессов

Теги: pandas, анализ данных, чтение и запись

Pandas — известный инструмент по анализу данных. Мы уже рассказывали про Series и DataFrame. Теперь поговорим про чтение и запись данных.

Библиотека Pandas поддерживает практически все наиболее популярные и известные форматы хранения данных:

csv,
excel,
html,
sql,
буфер обмена и многое другое.

Однако на практике чаще всего приходится работать с файлами с расширением .csv. К примеру, если мы хотим сохранить какой-нибудь DataFrame, нам достаточно просто написать следующее:

В результате функции to_csv будут переданы еще и разные аргументы (допустим, символ разделителя между колонками), но об этих аргументах лучше почитать в официальной документации.

Если же надо выполнить считывание данных из csv-файла и, наоборот, превратить их в DataFrame, то для этого существует функция read_csv.

Следует понимать, что аргумент sep служит для указания разделителя столбцов. Но вообще есть множество вариантов по формированию DataFrame из разных источников, однако чаще всего применяют именно CSV, Excel и SQL. К примеру, посредством функции read_sql, библиотека Pandas может выполнить SQL-запрос, а уже на основе ответа от БД сформировать нужный DataFrame.

По материалам блога https://khashtamov.com/ru/.