Инициализация массивов в контексте реверс-инжиниринга

Понимание, как применяются и выглядят в машинном коде массивы, позволит вам продвинуться в изучении такого направления, как реверс-инжиниринг. В этой статье мы будем использовать для дизассемблирования 64-битную версию IDA Pro и язык программирования «Си», что следует учитывать, если вы захотите выполнить все действия самостоятельно. Итак, вперёд!

В первую очередь, рассмотрим код массивов:

void BasicArrays() {
    // объявляем массив с константным размером
    int litArray[10];

    // объявляем массив с динамическим размером (массив переменного размера)
    int ArraySize = 10;
    int varArray[ArraySize];

    // объявляем массив с предопределёнными значениями
    int objArray[10] = {0,1,2,3,4,5,6,7,8,9};

    // записываем элемент массива по индексу
    litArray[0] = 1337;

    // выполняем чтение элемента из массива
    int leet = litArray[0];

    // создаём матрицу с константным размером
    int litMatrix[13][37];

    // создаём матрицу переменного размера
    int rows = 13;
    int cols = 37;

    int varMatrix[rows][cols];

    // вводим значения в матрицу
    varMatrix[4][20] = 1337;

    // получаем значения элемента матрицы
    int MatrixLeet = varMatrix[4][20];
}

Итак, перед нами всего 12 строк кода, но на практике они превращаются в весьма внушительный блок машинного кода. Что же, будем рассматривать машинный код более тщательно:

// объявляем массив с константным размером
    int litArray[10];

Дизассемблированный вид объявления массива с литералом:

В процессе инициализации массива с константным размером компилятор инициализирует длину нашего массива через локальную переменную. При этом в процессе компиляции выделяется место лишь под одно значение массива litArray[0].

Именно оно и станет использоваться (вы можете увидеть это на нижеследующем скриншоте). Данный приём даёт возможность компилятору существенно повысить производительность приложений.

// объявляем массив с динамическим размером (массив переменного размера)
    int ArraySize = 10;
    int varArray[ArraySize];

Машинный код:

Для начала длина массива сохраняется в локальную переменную ArraySize, потом вычисляется минимальное и максимальное индексное значение и длина всего массива, потом под неё выделяется память.

// объявляем массив с предопределёнными значениями
    int objArray[10] = {0,1,2,3,4,5,6,7,8,9};

Машинный код:

Во время объявления массива с предопределёнными значениями компилятор выполняет сохранение каждого значения в свою переменную, представленную индексом массива (к примеру objArray4 = objArray[4]).

    // записываем элемент массива по индексу
    litArray[0] = 1337;

Машинный код:

Точно так же, как и в случае с предопределёнными значениями, компилятор создаст новую переменную для указанного индексного значения при инициализации элемента массива посредством индекса.

    // читаем элемента из массива
    int leet = litArray[0];

Машинный код:

Во время извлечения элемента массива значение элемента будет взято по указанному индексу и записано в необходимую переменную.

    // создаём матрицу динамического размера
    int rows = 13;
    int cols = 37;

    int varMatrix[rows][cols];

Машинный код:

В процессе создания матрицы поначалу её размер устанавливается согласно значениям row и col. Далее рассчитываются минимальный и максимальный индексы для столбцов и строк, используемых при расчёте базового местоположения и общего размера матрицы в памяти.

    // вводим значения в матрицу
    varMatrix[4][20] = 1337;

Машинный код:

В процессе ввода в матрицу поначалу определяем местоположение нужного элемента массива с применением базового местоположения матрицы. Далее содержимое указанного элемента массива устанавливаем на желаемое входное значение (т. е. 1337).

    // получаем значение элемента матрицы
    int MatrixLeet = varMatrix[4][20];

Машинный код:

В процессе извлечении значения из матрицы производятся те же вычисления, что и при внесении в неё значения. Но при этом ничего не записывается, т. к. содержимое извлекается и записывается в необходимую переменную (к примеру, MatrixLeet).

Теперь, когда у нас есть понимание, как массивы применяются и выглядят в машинном коде, можно переходить к указателям. Но об этом поговорим в следующий раз.

Источник