Сортировка крупных массивов отнимает много времени, сил и иных ресурсов. Для упрощения соответствующей задачи разработчиками были придуманы различные концепции сортировки. Каждая из них имеет свои особенности, недостатки и преимущества.

Далее предстоит научиться сортировать элементы в заданном массиве различными способами. Будут представлены лучшие виды сортировок с их ключевыми особенностями и примерами реализации в коде. Такие данные пригодятся как разработчикам, так и обычным пользователям.

Алгоритм – это…

Алгоритм сортировки – некий алгоритм, который помогает упорядочивать элементы в заданном списке. В своей работе такие алгоритмы чаще всего используют операторы сравнения. Они применяются к элементам массива, а затем определяют их последовательность в заданной информационной структуре.

Сортировкой называется процесс упорядочивания множества объектов/элементов по тому или иному признаку.

Классификация и параметры

Рассматриваемый процесс может быть классифицирован по разным принципам. Рекомендуется запомнить следующие параметры алгоритмов сортировки:

  1. Время работы. Один из самых важных «критериев». Оценивается худшее время алгоритма, среднее, а также лучшее. Лучшим называется минимальное время работы алгоритма на некотором наборе элементов. В качестве него чаще всего выступает тривиальное множество [1, …, n]. Худшее время – наибольшее. Большинство алгоритмов, используемых в разработке, бывают O (n log n) и O (n2).
  2. Память. Параметр сортировки, который показывает, сколько дополнительной памяти при программировании требуется алгоритму. Сюда можно включать: дополнительные массивы, переменные, затраты на стек вызовов. Они бывают O (1), O (log n), O (n).
  3. Устойчивость. Сортировка элементов будет устойчивой, если она не меняет порядок компонентов с одинаковыми ключами. Ключ – это поле элемента, по которому осуществляется сортировка.
  4. Количество обменов. Параметр, который может быть очень важным. Его значимость повышается с увеличением размера элементов. При большом количестве обменов время алгоритма сортировки будет заметно увеличиваться.
  5. Детерминированность. Сортировка будет называться детерминированной, если каждое присваивание, обмен и прочие манипуляции не зависят от предыдущих. Все сортирующие сети выступают в качестве детерминированных.

Зная все эти параметры, можно оценить сортировку данных для каждого отдельного случая. Далее предстоит выяснить, какими способами упорядочиваются элементы в списках и массивах в программировании и информатике.

Пузырьком

Методы сортировки могут быть совершенно разными. Некоторые из них легко реализовать самостоятельно (на бумаге или в уме), а какие-то удастся использовать исключительно в программировании и разработке.

Самым известным и простым способом упорядочивания элементов в массиве служит пузырьковая сортировка (Bubble Sort). Его идея заключается в последовательном сравнении значений соседних элементов. Если текущий компонент больше следующего, они меняются местами. Алгоритм повторяется до тех пор, пока весь массив не будет отсортирован должным образом.

Как сортировать элементы в массиве

После обработки всего множества данных получится цепочка, которая упорядочивает элементы слева направо (или от меньшего к большему). В соответствующем алгоритме компоненты будут сравниваться попарно.

Пузырьковая концепция – это простая сортировка, которая в реальной жизни почти не применяется. Она является учебной. Имеет низкую эффективность в информатике и программировании. Медленно работает на тестах, в которых небольшие элементы (или «черепахи») располагаются в конце массива.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Сортировка пузырьком – база для большинства других алгоритмов упорядочивания. Пример – «расческой» или «шейкерный» метод.

Перемешивание

Еще одна достаточно простая сортировка. Она известна как «шейкерная» или «коктейльная». Относится к разновидностям пузырькового упорядочивания чисел в информационных массивах. Отличается от предыдущего приема тем, что в рамках одной итерации сортировка проходит по множеству в обоих направлениях (слева направо и справа налево). В случае с пузырьковой концепцией – только в одном направлении: слева направо.

Общая идея алгоритма заключается в следующем:

  1. Происходит обход множества слева направо, как при пузырьковом методе. На этом этапе сравниваются соседние элементы – они меняются местами, если левое значение больше правого. Наибольшее число будет перемещено в самый конец множества.
  2. Теперь массив обходится в обратном направлении (справа налево), начиная с элемента, который расположен перед последним отсортированным. Компоненты списка будут сравниваться между собой и меняться местами, чтобы наименьшее значение находилось с левой стороны. В итоге наименьшее значение окажется перемещенным в самое начало массива.

Сложность у соответствующего приема точно такая же, как и у пузырькового алгоритма. Реальное время работы лучше. Работает коктейльная сортировка чисел в два раза быстрее.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Выше можно увидеть ключевые параметры алгоритма, а также наглядный пример реализации в программном коде.

Расческа

Упорядочивание «расческой» – это еще один алгоритм сортировки, который относится к пузырьковой концепции. Она улучшает метод за счет устранения мелких значений в конце списка («черепах»).

Идеей соответствующего приема является то, чтобы «устранить» все элементы с небольшими значениями в конце массива. Обычно именно они замедляют работу метода. При пузырьковой и «шейкерной» сортировках при переборе будут сравниваться соседние элементы, при «расчесывании» – сначала берется достаточно большое расстояние между сравниваемыми значения. Далее оно будет сужаться до минимального.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Описать работу алгоритма сортировки можно так:

  1. Сначала разрыв между сравниваемыми элементами берется максимальный – на единицу меньше, чем сам используемый массив.
  2. На каждой итерации расстояние уменьшается путем деления расстояния на так называемый «фактор уменьшения».
  3. Процедура продолжается до тех пор, пока разность индексов сравниваемых компонентов не станет равна единице.
  4. Достигнув единицы, алгоритм будет сравнивать соседние элементы – как в пузырьковом методе. Эта итерация окажется последней.

Оптимальное значение фактора уменьшения составляет 1,247.

Вставки

Сортировка вставками – это концепция, при которой каждый последующий элемент в массиве будет сравниваться с предыдущими компонентами (отсортированными), а затем переставляется на нужное место.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Это простая сортировка. Она позволяет перебирать постепенно заданный массив слева направо. Каждый последующий элемент располагается в «новом множестве» так, чтобы он оказался между ближайшими элементами с минимальным и максимальным значением.

Алгоритм Шелла

Сортировка чисел методом Шелла – усовершенствованная «вставка». Сначала здесь сравниваются и сортируются значения, которые располагаются друг от друга на некотором расстоянии – d. После этого d уменьшается. Процедура сравнения и упорядочивания повторяется до тех пор, пока d не достигает минимального значения – единицы. Это значит, что алгоритм сортировки достиг своего последнего шага. Элементы будут сортироваться на последнем этапе обычной «вставкой».

Первоначально расстояние между сравниваемыми элементами рассчитывалось так:

  • первая итерация – d1 = N/2, где N – количество элементов в массиве;
  • последующие итерации – di = di-1/2;
  • последняя итерация – dk =1.
Как сортировать элементы в массиве
Как сортировать элементы в массиве

Выше можно увидеть пример кода реализации на Kotlin, а также ключевые параметры концепции.

Выбором

Метод, который позволяет многократно искать минимальные элементы в неотсортированных частях множества. Как только соответствующие компоненты будут обнаружены, они переместятся в самый конец отсортированной части массива.

Общая идея алгоритма сортировки заключается в разделении заданного множества условно на две части:

  • подмассива, в котором уже проведено упорядочивание (он расположен в левой части массива);
  • подмассива, который требует упорядочивания (в правой части списка).

Далее алгоритм будет искать минимальное значение в неотсортированном массиве. Найденное значение меняется местами с первым элементом в неотсортированной части множества. Этот шаг повторяется до тех пор, пока вся заданная цепочка не будет упорядочена от меньшего к большему.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Эта концепция позволит отсортировать по возрастанию заданную цепочку. Выше – пример реализации в программировании, а также ключевые параметры метода.

Быстрый метод

Быстрая сортировка – это алгоритм, который может быть описан просто как «разделяй и властвуй». Он включает в себя три шага:

  1. Из заданного множества необходимо выбрать один элемент – опорный.
  2. Другие компоненты в списке распределяются так, чтобы компоненты, которые меньше опорного, оказались до него, а большие или равные – после.
  3. После этого происходит рекурсивное применение двух шагов к подмассивам справа и слева от опорного значения.

Быстрая сортировка больших массивов была изобретена еще в 1960-х годах.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Она использовалась для машинного перевода: тогда словари хранились на специальных магнитных лентах, а упорядочивание слов обрабатываемого текста позволяло получать переводы за один прогон ленты без предварительной перемотки назад.

Слияние

Среди алгоритмов сортировки массивов можно выделить прием «слияние». Он пригодится для таких информационных структур, в которых доступ к элементам осуществляется последовательно. Пример – для работы с потоками.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Соответствующий прием подразумевает разбиение цепочки чисел на две примерно одинаковые части. Каждая из них будет упорядочиваться отдельно. После этого отсортированные подмассисвы сливаются в один.

Сортировку чисел сливанием можно описать так:

  1. Массив разделяется на две части примерно одинакового размера. Разбиение повторяется до тех пор, пока размер каждого подмассива не станет равен единице.
  2. Каждая получившаяся часть сортируется отдельно. На каждом этапе сравниваются первые элементы множества. Меньшее значение записывается в результирующее подмножество.
  3. Когда один массив закончился, к нему добавляются оставшиеся компоненты второго массива. Все это записывается в результирующее множество.

Слияние осуществляется до тех пор, пока в конечном итоге не получится единый упорядоченный массив.

Пирамидальная сортировка

Пирамидальная сортировка – улучшенный метод «выбора». Для него используется бинарное сортирующее дерево. Для него выполняются такие условия как:

  • каждый лист имеет глубину d или d-1, где d – это максимальная глубина дерева;
  • значение в любой вершине не меньше значения ее потомков.

Выглядит концепция так:

Как сортировать элементы в массиве
Как сортировать элементы в массиве
Как сортировать элементы в массиве

Чтобы понять, как отсортировать массив по возрастанию при помощи пирамидальной концепции, рекомендуется придерживаться следующих принципов:

  1. Выстроить массив в виде сортирующего дерева: Array[i] >= Array[2i+1], Array[i] >= Array[2i+2], при  <= i < n/2.
  2. Обменять элементы Array[0] и Array[n-1] местами. Array[0] – это корень сортирующего дерева. Им выступает самое большое значение в заданной цепочке.
  3. Повторить соответствующие шаги до тех пор, пока в сортирующем дереве не останется один компонент.

Данный прием эффективный, но простым его назвать сложно.

Подсчет

Алгоритмы сортировки включают в себя концепцию подсчета. Она базируется на подсчете повторяющихся элементов в заданном множестве. Если описать идею простыми словами, можно опираться на следующую модель поведения:

  1. Задан массив A длиной n-элементов, который необходимо упорядочить.
  2. Создается вспомогательное множество C с индексами от 0 до k, где k – это максимальное значение в массиве A. Оно заполняется нулями.
  3. Осуществляется последовательный проход по массиву A с записью в C[i] количества чисел, равных i. Это приведет к тому, что индексы C – значения массива A, а значение в C – это то, сколько раз число повторяется в изначально заданной последовательности.
  4. Необходимо пройти по C и перенести значения элементов во множество A.

Сложность сортировки и другие параметры:

Как сортировать элементы в массиве
Как сортировать элементы в массиве

В заданной записи n – это размер отсортированного множества, а k – размер вспомогательного.

Блочный (корзинный) прием

Алгоритмы сортировки данных разнообразны. Можно воспользоваться блочным (или корзинным) методом для того, чтобы организовать упорядочение элементов заданного множества. Этот прием базируется на разделении входного массива на несколько частей (сегментов или блоков), а также использовании для их упорядочивания других концепций сортировки.

Как сортировать элементы в массиве
Как сортировать элементы в массиве

Здесь k – это количество блоков. Общую идею алгоритма можно описать так:

  1. Поделить заданную числовую цепочку так, чтобы элементы в каждом подмассиве (блоке) были всегда больше, чем в предыдущем.
  2. Организовать сортировку каждого сегмента при помощи любого другого метода. Допускается рекурсивный подход к разбиению на блоки.
  3. Объединить сегменты в одно множество.

Все это показывает, что сортировка массива может быть реализована различными методами. Предложенные концепции не являются исчерпывающими. Рассмотренные сортировки данных встречаются чаще остальных.

Лучше разбираться в упорядочивании информации, а также применении различных алгоритмов в программировании пользователям помогут дистанционные компьютерные курсы. С ними сортировка по возрастанию или убыванию на выбранном языке разработки не будет доставлять существенных трудностей.

Научиться работать с алгоритмами профессионально, можно на курсах в Otus.