Ключевые библиотеки для анализа данных: NumPy

Изначально Python не задумывался в качестве языка для анализа данных. Однако сегодня он считается одним из наиболее подходящих языков для системного анализа, машинного обучения, статистики, прогнозной аналитики и прочих стандартных задач, связанных с обработкой данных.

Для эффективного выполнения анализа данных существует ряд инструментов. Некоторые из них обязан знать любой системный аналитик. Один из таких инструментов -- NumPy.

NumPy

NumPy предоставляет возможность весьма эффективно обрабатывать многомерные массивы. По сути, и многие другие библиотеки основаны на NumPy, поэтому без этой библиотеки нельзя было бы использовать тот же Pandas, SciPy, Matplotlib либо scikit-learn — именно поэтому в списке ключевых библиотек по анализу данных NumPy занимает почетное 1-е место.

Вот как, например, выглядит 3-мерный массив в NumPy:

Также в этой библиотеке присутствует ряд качественно имплементированных методов, к примеру, функция random, которая намного качественнее модуля случайных чисел, встроенного в стандартную библиотеку. Или, допустим, функция polyfit, которая прекрасно подходит для решения простых задач по прогнозной аналитике, к примеру, связанных с линейной либо полиномиальной регрессией.

Пример прогнозирования с применением функции polyfit:

Впрочем, инструмент годится и для многих других задач.

По материалам https://techrocks.ru.

Хотите знать про NumPy больше? Обратите внимание на курс "Системный аналитик. Advanced"!