Лучший способ совершенствовать навыки программирования на том или ином языке – это создание консольного программного обеспечения. Такие приложения обычно позволяют изучать особенности и нюансы функций, методов и классов.
C++ – известный язык разработки. Он является своеобразным стандартом, подходящим для самых разных целей. Именно поэтому далее предстоит более подробно изучить консольные приложения на C++.
Особое внимание в статье будет уделено вводу в консоль русского языка. Данная операция иногда может вызывать некоторые трудности. Наиболее распространенная ситуация – некорректное отображение кириллицы при вводе/выводе. Исправить положение обычно можно за счет грамотной разработки.
Особенности работы с вводом
Компьютеры и другие вычислительные машины умеют работать только с числами. Для представления букв или символов требуется воспользоваться так называемой кодировкой. Это алгоритм, согласно которому символ или буква получают определенное число-идентификатор. Подобное явление привело к образованию таблиц кодирования символов.
В разработке под Windows (не только на C++, но и на других языках программирования) чаще всего предстоит иметь дело с кодированными таблицами:
- UTF-8 (стандарт Unicode);
- cp1251;
- cp866.
Универсальной кодировочной таблицей служит Unicode, но это не меняет того, что в операционных системах допускается использование сразу нескольких кодировочных таблиц. Именно из-за них при работе той или иной программы на экране вместо нужных элементов появляются разнообразные нераспознаваемые символы.
В Windows кодировка символов соответствует стандарту cp866. Для русскоязычных операционных систем от Microsoft используется стандартная таблица cp1251 8-бит. При вводе текста в консоль через программу C++ происходит преобразование кириллицы в стандарт cp866. В этом случае некоторые элементы могут быть интерпретированы неправильно. Чтобы исправить ситуацию, нужно грамотно перекодировать его в стандарт cp866.
Функция setlocale
Локаль – это некий набор параметров:
- символы;
- страна;
- часовой пояс;
- язык пользователя;
- другие элементы.
Данный компонент в программном коде требуется для быстрой настройки пользовательского интерфейса в зависимости от географического положения.
C++ имеет функцию setlocale. Она используется для перекодировки символов в соответствие с требуемым языком. Данная функция определяется в заголовочном файле <clocale>.
Функция setlocale имеет несколько параметров:
- тип категории локали;
- значение локали.
Для настройки русской консоли в C программе требуется воспользоваться локалью «rus». Вместо аргумента «rus» допускается написание «Russian» в рассматриваемой функции. Оставлять двойные кавычки пустыми допустимо, если символьный набор будет совпадать с параметрами имеющейся операционной системы.
Особенности Setlocale
Setlocale 0 rus – функция, которая задает локаль, используемую текущей программой. Она встречается в C и C++. Заголовочными файлами соответственно будут служить:
- locale.h – для Си;
- clocale – для C++.
Текущую локаль можно получить, передав через параметр locale значение NULL. Прототип функции имеет следующую форму:
Параметры category:
- LC_ALL – вся локаль;
- lc_collate – оказывает влияние на strcoll и strfrm;
- lc_ctype – оказывает влияние на поведение всех команд заголовочного файла cctype за исключением isdigit и isxdigit;
- lc_monetary – денежный формат;
- lc_numeric – влияет на десятичную точку ввода/вывода и на команды форматирования строк;
- lc_time – изменяет поведение команды strftime.
Параметр locale включает в себя имя локали. Сюда можно передать минимум два значения: «C» – минимальную Си-локаль и » « – локаль по умолчанию, используемую средой разработки. Другие параметры тоже могут передаваться. Пример – для распознавания кириллицы.
Способы решения проблемы с вводом данных
Функция setlocale в C++ работает только для потока вывода. При использовании setlocale для ввода данных в консоль на экране появляются все те же непонятные символы. Вот пример работы приложения с вводом кириллицы. Здесь строка данных сохраняется в переменную, после чего выводится на консоль:
Выше можно заметить результат реализации фрагмента кода. Слово «Вывод» отобразилось корректно, а содержимое строки string – нет. Такое случилось из-за того, что setlocale работает только с потоком ввода.
Для исправления ситуации можно подключить заголовочный файл windows.h. В нем имеются прототипы функций SetConsoleCP и SetConsoleOutputCP. Они заменяют setlocale. Аргументом для рассматриваемых функций служит идентификатор кодовой страницы – win-cp 1251. SetConsoleCP используется для установки нужной таблицы на ввод (заменяет setlocale), SetConsoleOutputCP работает непосредственно с выводом.
У данного приема имеется один недостаток – указанные функции умеют работать только со шрифтом Lucida Console. По умолчанию в консоли установлен шрифт Consolas. Это приводит к тому, что в командной строке нужно предварительно настроить используемый тип шрифта. Для этого нужно:
- Открыть CMD в Windows.
- Перейти в «Свойства».
- Во вкладке «Шрифт» выбрать Lucida Console.
- Нажать на «Ок».
Если все сделано верно, кириллица будет работать корректно. Вот пример, в котором вместо setlocale используются предложенные ранее команды:
Ввод и вывод на кириллице в C++ настроены. Лучше разбираться в include locale.h и кодировках помогут специальные компьютерные курсы.