Воскресенье, 06.07.2025, 15:49
Элективный курс "Разработка баз данных для информационно-аналитических систем"
Приветствую Вас Гость | RSS
Главная Урок 3 Регистрация Вход
Меню сайта

Наш опрос
Оцените элективный курс
Всего ответов: 2

Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0

Форма входа

Урок 3. Понятие баз данных. История. Классификация. Сверхбольшие базы данных.

Можно с большой степенью достоверности утверждать, что большинство приложений, которые предназначены для выполнения хотя бы какой-нибудь полезной работы, тем или иным образом используют структурированную информацию или, другими словами, упорядоченные данные. Такими данными могут быть, например, списки заказов на тот или иной товар, списки предъявленных и оплаченных счетов или список телефонных номеров ваших знакомых. Обычное расписание движения автобусов в вашем городе - это тоже пример упорядоченных данных.

При компьютерной обработке информации упорядоченные каким либо образом данные принято хранить в базах данных - особых файлах, использование которых вместе со специальными программными средствами позволяет пользователю как просматривать необходимую информацию, так и, по мере необходимости, манипулировать ею, например, добавлять, изменять, копировать, удалять, сортировать и т.д.

Таким образом, дать простое определение базы данных можно следующим образом. База данных - это набор сведений, хранящихся некоторым упорядоченным способом. Пожалуй, одним из самых банальных примеров баз данных может быть записная книжка с телефонами ваших знакомых. Наверное, у вас есть сейчас или когда-либо была эта полезная вещь. Этот список фамилий владельцев телефонов и их телефонных номеров, представленный в вашей записной книжке в алфавитном порядке, представляет собой, вообще говоря, проиндексированную базу данных. Использование индекса - в данном случае фамилии (или имени) позволяет вам достаточно быстро отыскать требуемый номер телефона.

Существует большое количество определения понятию «база данных».

Мы рассмотрим еще одно:

База данных это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором свойств.

На самом деле существует проблема определения база данных.

Базами данными вы пользуетесь постоянно. Каждый раз, когда вы что-то ищете в поисковых системах, вы используете базу данных. Когда вы вводите свои логин и пароль для входа на какой-нибудь сервис (электронная почта, вконтакте, одноклассники и т.д.), они сравниваются со значениями, которые хранятся в базе данных этого сервиса.

 Можно сравнить базу данных со шкафом, в котором хранятся документы. Иными словами, база данных - это хранилище данных. 

Сами по себе базы данных не представляли бы интереса, если бы не было систем управления базами данных (СУБД).

Система управления базами данных - это совокупность языковых и программных средств, которая осуществляет доступ к данным, позволяет их создавать, менять и удалять, обеспечивает безопасность данных и т.д. В общем СУБД - это система, позволяющая создавать базы данных и манипулировать сведениями из них. А осуществляет этот доступ к данным СУБД посредством специального языка - SQL.

SQL - язык структурированных запросов, основной задачей которого является предоставление простого способа считывания и записи информации в базу данных. 

Итак, простейшая схема работы с базой данных выглядит примерно так.

По характеру использования СУБД делят на однопользовательские (предназначенные для создания и использования БД на персональном компьютере) и многопользовательские (предназначенные для работы с единой БД нескольких компьютеров, объединенных в локальные сети). Вообще деление по характеру использования можно представить следующей схемой. 


На сегодняшний день число используемых СУБД исчисляется десятками. Наиболее известные однопользовательские СУБД - Microsoft Visual FoxPro и Access, многопользовательские - MS SQL Server, Oracle и MySQL.

СУБД организует хранение информации таким образом, чтобы ее было удобно:

  • просматривать, пополнять, изменять,
  • искать нужные сведения,
  • делать любые выборки,
  • осуществлять сортировку в любом порядке. 

Давайте теперь опять вернемся к базам данных, а именно рассмотрим классификацию баз данных.

Информация в базах данных структурирована на отдельные записи, которыми называют группу связанных между собой элементов данных. Характер связи между записями определяет два основных типа организации баз данных: иерархический и реляционный.

В иерархической базе данных записи упорядочиваются в определенную последовательность, как ступеньки лестницы, и поиск данных может осуществляться последовательным «спуском» со ступени на ступень. Иерархическая база данных по своей структуре соответствует структуре иерархической файловой системы.

Реляционная база данных, по сути, представляет собой двумерную таблицу.

Столбцы таблицы называются полями: каждое поле характеризуется своим именем и топом данных. Поле БД – это столбец таблицы, содержащий значения определенного свойства.

В реляционной БД используются четыре основных типов полей:

  • числовой, символьный (слова, тексты, коды и т.д.), дата (календарные даты в форме «день/месяц/год»),
  • логический (принимает два значения: «да» - «нет» или «истина» - «ложь»).

Строки таблицы являются записями об объекте. Запись БД – это строка таблицы, содержащая набор значения определенного свойства, размещенный в полях базы данных.

Давайте рассмотрим краткую историю баз данных.

База данных, в общем смысле слова – это модель объекта, его состояния и взаимоотношения (определений можно назвать много, остановимся на этом).

1. Примерно до середины шестидесятых годов двадцатого века в мире всеобще использовались файлы, со всеми их недостатками. В таких «база данных» информация часто разрушалась из за невозможности (или очень большой затрудненности) одновременной работы, недостаточного поиска. Данный этап можно сравнить с различного рода бумажными карточками, который еще очень любят у нас в больницах.

2. С середины шестидесятых годов до 1980 года. На данном этапе началось использование нереляционных баз данных. Разработчики (и пользователи) поняли, что использовать только файлы очень накладно для производства, и стали искать пути решения появившихся проблем. Для этого была разработана сначала иерархическая модель данных (строилась на основе иерархических зависимостей, причем у потомка может быть только один предок), а затем появилась сетевая модель данных (была логическим продолжением иерархической модели, здесь у потомка могло быть и более одного предка). У данных моделей были и достоинства, были и недостатки.

3.0. 1970 год – британский ученый Эдгар Кодд выпустил работу «A Relational Model of Data for Large Shared Data Banks». Данная работа считается первым трудом по реляционному хранению данных. После ее выпуска начинаются активные работы по разработке данной системы хранения информации.

3.1. Начало восьмидесятых годов – выпуск реляционных Систем Управления Баз Данных (СУБД).

Основы реляционных баз данных включают в себя три аспекта:

- Структурный – данные представляют из себя наборы отношений;

- Целостности – наборы отношений отвечают требованиям целостности;

- Обработки – поддерживаются операторы манипулирования отношениями.

И, кроме того, еще в реляционных базах данных поддерживается принципы нормализации.

Достоинствами реляционного подхода являются:

           -  Данный подход основан на небольшом числе законов (правил);

           -  Эти правила точно определены;

           -  В основе лежит мат.логика и теория множеств;

           -   Для манипулирования данными необязательно знать, как эти данные организованы во внешней памяти.

4. В данное время активно разрабатываются Объектно-Ориентированные базы данных, Объектно-Реляционные. Но я их пока не рассматриваю, так что останавливаться подробно не буду.

Реляционные СУБД сейчас используются повсеместно – это MSSQL Server от компании Microsoft, ORACEL от одноименной компании, DB/2 от IBM – это примеры коммерческих РСУБД. Всем веб-разработчикам, которые не используют таких РСУБД, известна MySQL – бесплатная РСУБД, которая разрабатывалась компанией Sun Microsystem. 

Теперь рассмотрим сверхбольшие базы данных.

Сверхбольшая база данных (англVery Large Database, VLDB) — это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Термин подразумевает максимально возможные объёмы БД, которые определяются последними достижениями в технологиях физического хранения данных и в технологиях программного оперирования данными.

Исследования в области обработки и хранения сверхбольших баз данных располагаются на вершине практики и теории баз данных. Большая часть исследований проводится под эгидой VLDB Endowment, обеспечивающей продвижение научных работ, а также обмен информацией в областях, которые прямо или косвенно касаются сверхбольших БД.

Very Large Database, VLDB (сверхбольшая база данных) представляет собой базу данных, которые на устройстве физического хранения данных занимает невероятные объемы. Под этим термином понимают наибольший возможный объем баз данные, в основе которых находятся самые последние достижения физического хранения данных, а также технологии программного управления данными.

Если говорить о количественно определении понятия «чрезвычайно большой объем», то он постоянно меняется во времени. На сегодняшний день это объем, который измеряется петабайтами. Если брать для сравнения 2005 год, то самыми крупными считались базы, которые имели объем физического хранения данных около 100 терабайт.

Специалисты говорят о необходимости использовать особые подходы во время проектирования сверхбольших БД. Для того чтобы их создать довольно часто применяются специальные проекты с целью найти такие системотехнические решения, которые дали бы возможность работать с такими объемами данных. Обычно требуются специальные версии ОС, специальные механизмы работы СУБД с данными и тому подобное.

Одной из самых больших научных баз данных является база данных проекта BaBar. Целью эксперимента BaBar является изучение поведения B-мезонов, получаемых на коллайдере PEP-II в Стэндфордском центре линейного ускорителя (Stanford Linear Accelerator Center). Детектор BaBar поставляет около 500 Гбайт информации ежедневно. Данная информация сохраняется в базе данных BaBar, объем которой сегодня составляет более 500 Тбайт. Система включает в себя 2000 процессоров и 100 серверов.


Для закрепления материала ответьте на следующие вопросы:

1. Что такое база данных? 
2. Какова структура база данных? 
3. Каковы основные этапы развития баз данных? 
4. Перечислите классификацию баз данных по критериям, приведите примеры. 
5. Приведите примеры баз данных. 
6. Для чего нужен язык SQL? 
7. Что такое сверхбольшие базы данных? Их назначение?

Поиск

Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz

  • Copyright MyCorp © 2025 Бесплатный конструктор сайтовuCoz