Ключевые библиотеки для анализа данных: NumPy
Изначально Python не задумывался в качестве языка для анализа данных. Однако сегодня он считается одним из наиболее подходящих языков для системного анализа, машинного обучения, статистики, прогнозной аналитики и прочих стандартных задач, связанных с обработкой данных.
Для эффективного выполнения анализа данных существует ряд инструментов. Некоторые из них обязан знать любой системный аналитик. Один из таких инструментов -- NumPy.
NumPy
NumPy предоставляет возможность весьма эффективно обрабатывать многомерные массивы. По сути, и многие другие библиотеки основаны на NumPy, поэтому без этой библиотеки нельзя было бы использовать тот же Pandas, SciPy, Matplotlib либо scikit-learn — именно поэтому в списке ключевых библиотек по анализу данных NumPy занимает почетное 1-е место.
Вот как, например, выглядит 3-мерный массив в NumPy:
Также в этой библиотеке присутствует ряд качественно имплементированных методов, к примеру, функция random, которая намного качественнее модуля случайных чисел, встроенного в стандартную библиотеку. Или, допустим, функция polyfit, которая прекрасно подходит для решения простых задач по прогнозной аналитике, к примеру, связанных с линейной либо полиномиальной регрессией.
Пример прогнозирования с применением функции polyfit:
Впрочем, инструмент годится и для многих других задач.
По материалам https://techrocks.ru.
Хотите знать про NumPy больше? Обратите внимание на курс "Системный аналитик. Advanced"!