Чтение и запись данных в Pandas
Pandas — известный инструмент по анализу данных. Мы уже рассказывали про Series и DataFrame. Теперь поговорим про чтение и запись данных.
Библиотека Pandas поддерживает практически все наиболее популярные и известные форматы хранения данных:
- csv,
- excel,
- html,
- sql,
- буфер обмена и многое другое.
Однако на практике чаще всего приходится работать с файлами с расширением .csv. К примеру, если мы хотим сохранить какой-нибудь DataFrame, нам достаточно просто написать следующее:
В результате функции to_csv будут переданы еще и разные аргументы (допустим, символ разделителя между колонками), но об этих аргументах лучше почитать в официальной документации.
Если же надо выполнить считывание данных из csv-файла и, наоборот, превратить их в DataFrame, то для этого существует функция read_csv.
Следует понимать, что аргумент sep служит для указания разделителя столбцов. Но вообще есть множество вариантов по формированию DataFrame из разных источников, однако чаще всего применяют именно CSV, Excel и SQL. К примеру, посредством функции read_sql, библиотека Pandas может выполнить SQL-запрос, а уже на основе ответа от БД сформировать нужный DataFrame.
По материалам блога https://khashtamov.com/ru/.