В этой статье пойдет речь о том, что такое база данных. Будут рассмотрены классификация, предназначение и самые популярные БД. Представленные сведения окажутся одинаково полезными как обычным ПК-пользователям, так и IT-специалистам.

Определение

База данных – своеобразная связь/структура данных, которая хранится в соответствие со специальной информационной схемой. Оперирование этими цифровыми материалами осуществляется при помощи правил и средств моделирования данных.

Некоторые специалисты и пользователи считают, что БД – это то же самое, что и «система управления базами данных». Однако утверждать так не совсем правильно. Соответствующие понятия отличаются друг от друга. Далее будут рассмотрены как БД, так и СУБД для более глубокого понимания особенностей каждого элемента.

В информатике существуют различные способы расшифровки этого понятия:

  • объективно представленная связь самостоятельных материалов, которые систематизированы так, чтобы их можно было найти и обработать при помощи ЭВМ;
  • совокупность данных, организованных в соответствие с концептуальными структурами, описывающими характеристики данных и взаимоотношения между ними;
  • организованная при помощи определенных правил и поддерживаемая в памяти компьютера совокупность информации, характеризующая состояние той или иной предметной области для удовлетворения информационных пользовательских потребностей;
  • совместно используемый набор данных, логически связанных друг с другом, используемый для удовлетворения информационных потребностей организации.

Google указывает на то, что БД в информатике чаще всего означает упорядоченный набор информации и связи между данными. Хранилище цифровых или иных материалов.

Отличительные признаки

К отличительным признакам информационных баз Google-источники относят следующие признаки:

  1. Хранение и обработка в вычислительной системе – на компьютере или другом устройстве.
  2. Наличие структурированной логической связи (систематизации) для обеспечения возможности эффективного поиска и обработки информационных массивов на устройстве. Структурированность подразумевает явное выделение составных частей (элементов), связей, а также типизацию компонентов и связей, при которой соотносится определённая семантика и допустимый спектр операций.
  3. Включение в состав БД схем или метаданных, которые описывают логические структуры хранилища в формальном виде.

Только первый признак среди перечисленных – строгий. Точной и единой системы требований к БД в информатике и IT нет.

Историческая справка

Технологии БД, согласно Google, развивались как в широком, так и в узком смысле. Каждая «ступень» обладает своими особенностями.

В широком смысле базы данных и их история обобщаются до любых средств, с помощью которых люди хранили и обрабатывали информации. В соответствующем контексте можно встретить упоминания средств учета царской казны, узелковую письменность инков, клинописи и так далее. В широком смысле понятие «база данных» трактуется неоднозначно и фактически сливается с понятиями «архив» и «письменность».

История БД в узком смысле подразумевает развитие в современном понимании. Она начинается с 1955 года – при появлении программируемого оборудования для непосредственной обработки цифровых записей. ПО тех времен поддерживало модель обработки записей, опираясь на файлы. Для того, чтобы хранить информацию, использовались перфокарты.

В середине 1960-х появились первые оперативные сетевые БД. Операции над ними обрабатывались в интерактивной форме. Для этого использовались терминалы. Простые индексно-последовательные организации записей стали стремительно развиваться. Они перешли на мощную модель, базирующуюся на наборах записей.

В 1970-х появилась реляционная модель данных. Она возникла за счет работ Эдгара Кодда. Его труды открыли связи прикладной технологии информационных баз с математикой и логикой.

Источники в Google указывает на то, что сам термин «база данных» возник еще в самом начале 1960-х годов. Он был введен для употребления в симпозиумах SDC в 1964-1965 годах. Трактовался в достаточно узком смысле, в контексте систем искусственного интеллекта. Рассматриваемое понятие в современном «исполнении» стало применяться только к 1970-му году.

Свойства

Базы данных обладают следующими свойствами:

  1. Наличие имени. Если оно отсутствует, никакой БД быть не может.
  2. Фиксированное состояние объектов и их отношений в заданный момент времени. Со временем соответствующие связи могут меняться. Пример – стоимость товара. Она характеризует состояние продукции. Вместе с корректировкой этого значения будет меняться состояние товара.
  3. Фиксированная информация об объектах из определенной предметной области. Пример – сфера «Библиотека». В БД для этой области могут встречаться сведения о книгах, их расположении в библиотеке, читателях и читательских билетах.
  4. Постоянство. Оно будет проявляться в нескольких формах. Данные все время накапливаются и используются, их структура и состав обычно постоянны и стабильны во времени. Если информация меняется, БД находится на этапе проектирования и разработки.
  5. Актуализация информации. В БД, согласно Google, содержатся только актуальные сведения и связи.

Отсутствие указанных свойств или хотя бы одного из них дает основание сделать вывод о том, что программист имеет дело не с БД, а с другими информационными структурами.

Отличие от электронных таблиц

В информатике существуют два схожих между собой понятия – «базы данных» (БД) и электронные таблицы. Google указывает на то, что эти два элемента обозначают разные структурные единицы, хоть они и схожи друг с другом.

БД и электронная таблица – это удобные способы хранения информации. Google указывает на следующие отличия соответствующих хранилищ:

  • способы хранения и обработки информации;
  • имеющиеся полномочия доступа;
  • объем хранения.

Электронные таблицы – это компоненты, которые разрабатывались изначально только для одного пользователя. Их свойства отражают соответствующую особенность. Электронные таблицы используются для одного или нескольких (небольшого количества) клиентов, которым не требуется производить сложные операции с имеющейся информацией.

БД имеют большие масштабы. Они позволяют работать со своими данными, согласно Google, огромному количеству пользователей в одно и то же время. Этот процесс будет быстрым и безопасным. Доступ к информации и ее запрос осуществляется при помощи развитой логики и специального языка запросов. Масштабы, как правило, несопоставимы с классическими электронными таблицами. 

Цели и задачи

Базы данных представляют собой структурированные и систематизированные хранилища информации. Они решают различные задачи, связанные с обработкой цифровых материалов. Наиболее распространенными целями и задачами БД называют следующие моменты:

  1. Сбор и обработка больших информационных объемов. Рассматриваемый тип хранилища иногда предоставляет доступ к огромным массивам информации. Google указывает на то, что база данных – это основной элемент в Data Science.
  2. Защита персональной информации. Большинство сведений, хранимых в базах, являются конфиденциальными. Доступ к ним ограничивается в соответствие с установленными моделью и организацией правилам. Обеспечение безопасности цифровых материалов – ключевая и важная задача любой БД.
  3. Получение информации в режиме реального времени. Сформировать рассматриваемый элемент и просто хранить в нем те или иные сведения уже недостаточно для специалистов. Google говорит о том, что приходится работать с полученными информационными массивами в режиме реального времени. Это позволяет оперативно реагировать на происходящие вокруг изменения. Пример – ситуация на рынке труда для формирования новых востребованных вакансий.
  4. Поддержка работы во многопользовательском режиме. Большая часть БД используется различными службами организации/предприятия, что является обязательным условием эффективности применения на практике.

Дополнительной целью, согласно Google, у баз данных выступает расширение списка функциональных возможностей для дальнейшей обработки.

Виды БД

Базы данных условно делятся на два крупных класса: реляционные и нереляционные. Последние подразделяются еще на несколько типов. Стандартная классификация БД, согласно Google, предусматривает три крупные категории. Далее каждая из них будет рассмотрена более подробно.

Реляционные

Google описывает реляционные базы как самые распространенные. Именно с ними в большинстве случаев приходится работать IT-специалистам. Они иногда называются табличными. Такое название произошло благодаря используемому способу хранения и организации информационных массивов – в виде таблиц.

Реляционные базы – это «большие упорядоченные таблицы». Они связаны друг с другом. В конечном итоге получается упорядоченная и связанная структура. Пример реляционной таблицы можно увидеть ниже:

Databases от А до Я

Здесь:

  1. Имеются две таблицы – с товарами и покупателями.
  2. Когда клиент что-то приобретает, данные будут записываться в третью таблицу.
  3. В третьей таблице содержатся сведения о купленной продукции и ссылках на них.

В такой структуре при изменении данных нужно внести корректировки только в одну таблицу. В остальных новые сведения появятся автоматически.

Графовые

Google ссылается на то, что графовые БД отличаются от реляционных типом связей. Здесь их может быть несколько. Каждая связь будет отвечать за что-то свое.

Графовые (или сетевые) базы, согласно Google, активно применяются в жизни. Пример – социальные сети:

Databases от А до Я

Google указывает, что информация в сетевых «хранилищах» размещается в отдельных документах. Она включает в себя сами данные, а также связи между ними. База данных не будет тратить время на поиск и обнаружение необходимой информации. Все это уже имеется в отдельных файлах. В них располагаются связи, позволяющие достаточно быстро получить тот или иной результат.

Иерархические

Google выделяет еще один важный тип баз данных – иерархические. Соответствующая структура напоминает файловую систему в Windows от Microsoft. Каждый элемент имеет вышестоящий компонент. В такой структуре имеется подчиненный элемент – он расположен ниже. В иерархических архитектурах легко перемещаться снизу вверх и сверху вниз.

Иерархические базы данных знают, что и чему подчиняется. Это значит, что в них легко обнаружить необходимые сведения. Организовать такую структуру получится только при четком разделении информации. Придется выяснить, какой компонент будет главным, а какой подчиненным.

Прочие виды

Базы данных могут быть классифицированы различными способами. Google указывает на возможность разделения рассматриваемых хранилищ по форме представления:

  1. Фактографические. В них информация представлена фактами об объектах определенной предметной области в виде пары «параметр–значение».
  2. Документальные. Материалы отображаются в виде полнотекстовых документов.
  3. Мультимедийные. Их Google описывает как хранилища, в которых материалы представлены графикой, аудио или видеофайлами.

Можно разделить базы данных по топологии хранения на локальные и распределенные. Первые располагаются на одном устройстве, вторые – на нескольких.

Google выделяет классификацию по функциональному назначению: справочно-информационные (в основном используются для чтения), а также операционные (применяются для добавления, изменения и удаления информации).

СУБД – это…

База данных (БД) – это хранилище информации в структурированной и упорядоченной форме. Для управления им используются специальные программы и среды. Они называются СУБД.

СУБД – это интерфейс между информационной базой и пользователем/другими приложениями. С их помощью удается выполнять различные действия с данными, включая административные операции: мониторинг производительности, настройка, резервное копирование, восстановление, раздача прав доступа.

PostgreSQL

СУБД очень много. Каждая из них имеет ключевые особенности. Одним из наиболее популярных вариантов систем является PostgreSQL. Она обладает высокой производительностью и функциональностью. Может использоваться для работы с большими информационными массивами.

PostgreSQL работает с объектно-реляционными хранилищами. Она поддерживает языки MySQL и SQL. Здесь допускается применение расширений PL/Python, PL/Java и PL/Perl.

MySQL

Еще одна распространенная СУБД. Применяется крупными мировыми компаниями. Относится к свободному программному обеспечению. Google говорит о том, что бесплатное распространение стало основной причиной популярности MySQL.

Эта СУБД может работать онлайн и поддерживать до 50 миллионов компонентов. Менее функциональная, чем PostgreSQL, но предусматривает интеграцию с другими СУБД.

SQLite

Google называет эту систему управления базами данных одной из самых компактных. Она не использует серверы и другие утилиты. Вся информация, с которой планируется работать, будет храниться на одном устройстве.

SQLite реализована в виде библиотеки, написанной на C. У нее небольшой размер и отсутствуют требования к администрированию или настройке для начала работы. Эта СУБД подойдет для мобильных приложений, сайтов с небольшими трафиками, настольных приложений, а также локальных кэшей.


Прокачать навыки работы с базами данных можно на курсах Otus.