Чтение и запись данных в Pandas

Pandas — известный инструмент по анализу данных. Мы уже рассказывали про Series и DataFrame. Теперь поговорим про чтение и запись данных.

Библиотека Pandas поддерживает практически все наиболее популярные и известные форматы хранения данных:

  • csv,
  • excel,
  • html,
  • sql,
  • буфер обмена и многое другое.

Однако на практике чаще всего приходится работать с файлами с расширением .csv. К примеру, если мы хотим сохранить какой-нибудь DataFrame, нам достаточно просто написать следующее:

В результате функции to_csv будут переданы еще и разные аргументы (допустим, символ разделителя между колонками), но об этих аргументах лучше почитать в официальной документации.

Если же надо выполнить считывание данных из csv-файла и, наоборот, превратить их в DataFrame, то для этого существует функция read_csv.

Следует понимать, что аргумент sep служит для указания разделителя столбцов. Но вообще есть множество вариантов по формированию DataFrame из разных источников, однако чаще всего применяют именно CSV, Excel и SQL. К примеру, посредством функции read_sql, библиотека Pandas может выполнить SQL-запрос, а уже на основе ответа от БД сформировать нужный DataFrame.

По материалам блога https://khashtamov.com/ru/.