Инициализация массивов в контексте реверс-инжиниринга
Понимание, как применяются и выглядят в машинном коде массивы, позволит вам продвинуться в изучении такого направления, как реверс-инжиниринг. В этой статье мы будем использовать для дизассемблирования 64-битную версию IDA Pro и язык программирования «Си», что следует учитывать, если вы захотите выполнить все действия самостоятельно. Итак, вперёд!
В первую очередь, рассмотрим код массивов:
void BasicArrays() { // объявляем массив с константным размером int litArray[10]; // объявляем массив с динамическим размером (массив переменного размера) int ArraySize = 10; int varArray[ArraySize]; // объявляем массив с предопределёнными значениями int objArray[10] = {0,1,2,3,4,5,6,7,8,9}; // записываем элемент массива по индексу litArray[0] = 1337; // выполняем чтение элемента из массива int leet = litArray[0]; // создаём матрицу с константным размером int litMatrix[13][37]; // создаём матрицу переменного размера int rows = 13; int cols = 37; int varMatrix[rows][cols]; // вводим значения в матрицу varMatrix[4][20] = 1337; // получаем значения элемента матрицы int MatrixLeet = varMatrix[4][20]; }
Итак, перед нами всего 12 строк кода, но на практике они превращаются в весьма внушительный блок машинного кода. Что же, будем рассматривать машинный код более тщательно:
// объявляем массив с константным размером int litArray[10];
Дизассемблированный вид объявления массива с литералом:
В процессе инициализации массива с константным размером компилятор инициализирует длину нашего массива через локальную переменную. При этом в процессе компиляции выделяется место лишь под одно значение массива
Именно оно и станет использоваться (вы можете увидеть это на нижеследующем скриншоте). Данный приём даёт возможность компилятору существенно повысить производительность приложений.
// объявляем массив с динамическим размером (массив переменного размера) int ArraySize = 10; int varArray[ArraySize];
Машинный код:
Для начала длина массива сохраняется в локальную переменную ArraySize, потом вычисляется минимальное и максимальное индексное значение и длина всего массива, потом под неё выделяется память.
// объявляем массив с предопределёнными значениями int objArray[10] = {0,1,2,3,4,5,6,7,8,9};
Машинный код:
Во время объявления массива с предопределёнными значениями компилятор выполняет сохранение каждого значения в свою переменную, представленную индексом массива (к примеру
// записываем элемент массива по индексу litArray[0] = 1337;
Машинный код:
Точно так же, как и в случае с предопределёнными значениями, компилятор создаст новую переменную для указанного индексного значения при инициализации элемента массива посредством индекса.
// читаем элемента из массива int leet = litArray[0];
Машинный код:
Во время извлечения элемента массива значение элемента будет взято по указанному индексу и записано в необходимую переменную.
// создаём матрицу динамического размера int rows = 13; int cols = 37; int varMatrix[rows][cols];
Машинный код:
В процессе создания матрицы поначалу её размер устанавливается согласно значениям row и col. Далее рассчитываются минимальный и максимальный индексы для столбцов и строк, используемых при расчёте базового местоположения и общего размера матрицы в памяти.
// вводим значения в матрицу varMatrix[4][20] = 1337;
Машинный код:
В процессе ввода в матрицу поначалу определяем местоположение нужного элемента массива с применением базового местоположения матрицы. Далее содержимое указанного элемента массива устанавливаем на желаемое входное значение (т. е. 1337).
// получаем значение элемента матрицы int MatrixLeet = varMatrix[4][20];
Машинный код:
В процессе извлечении значения из матрицы производятся те же вычисления, что и при внесении в неё значения. Но при этом ничего не записывается, т. к. содержимое извлекается и записывается в необходимую переменную (к примеру, MatrixLeet).
Теперь, когда у нас есть понимание, как массивы применяются и выглядят в машинном коде, можно переходить к указателям. Но об этом поговорим в следующий раз.