При проектировании банков данных решаются следующие комплексы задач:

- создается концептуальная информационная модель предметной области или информационных потребностей абонентов;

- разрабатывается логическая модель баз данных;

- выбираются (или создаются) программные средства, с помощью которых будет создаваться и эксплуатироваться банк данных;

- разрабатывается физическая модель баз данных, которая отображается на физические средства вычислительной техники, применяемой для эксплуатации банка данных;

- разрабатываются формы, способы и средства предоставления данных потребителям;

- разрабатываются формы и способы поступления данных на вход банка данных;

- разрабатывается технология эксплуатации банка данных и комплекс эксплуатационной документации для специалистов, обеспечивающих эксплуатацию банка данных.

В зависимости от области применения и режима эксплуатации банки данных имеют специфическую целевую направленность, которая отражается в собственном названии банка данных. Эксплуатируются или проектируются, например, такие банки данных: «Скважины глубокого разведочного бурения на нефть и газ», «Банк-данных технико-экономических показателей автоматизированной системы плановых расчетов», «Ресурсы полезных ископаемых зем­ного шара», «Физико-химические свойства горных пород», «Кадастр месторождений и залежей руд черных металлов» и др.

В создании и эксплуатации банков данных участвуют работники всех основных служб геологической отрасли: производственных геологосъемочных, поисковых и разведочных организаций, специализированных подразделений по созданию АСУ-Геология, научно-исследовательских организаций, отраслевой сети геологических фондов, отраслевой системы научно-технической информации. Основой для координации деятельности этих служб при создании распределенной отраслевой сети банков данных и обеспечения сов­местимости формируемых баз данных служит комплекс отраслевых соглашений (стандартов) по принципиальным вопросам проектирования и эксплуатации банков данных.

База данных - упорядоченное множество данных о строении и свойствах объектов некоторой предметной области, организованное в соответствии с принятой моделью предметной области и реализованное на материальных носителях в форме, позволяющей манипулировать данными с помощью технических средств вычислительной техники в процессе целенаправленной обработки данных. База данных является наиболее существенной и важной составной частью банка данных.

Модель базы данных. Понятие «модель базы данных» введено для отображения множества объектов, их свойств и взаимосвязей, для задания определенной структуры, в соответствии с которой организовано размещение данных в базе данных (БД). Понятие «модель БД», с одной стороны, служит для организации процесса разработки базы данных, с другой - оно означает конкретное строение и состав, структурный план, в соответствии с которым построена база данных. Часто наряду с термином «модель БД» при­меняется термин «схема БД». Различают общую, генеральную БД (схему БД) и прикладную (подсхему) модели; последняя отражает представление о структуре базы данных с точки зрения отдельного пользователя. В процессе проектирования базы данных последовательно разрабатывают:

1) понятийную модель предметной области;

2) понятийную модель базы данных;

3) логическую модель БД;

4) физическую модель организации БД.

Для разработки моделей БД применяют специальные языки описания данных. Логическая модель БД может быть построена с использованием разных принципов и правил отражений связи (отношений) между объектами описания и их свойствами (атрибутами). Наиболее известными являются следующие типы моделей: файловая, иерархическая, сетевая, реляционная и соответствующие этим типам моделей языки описания данных. Во всех языках описания данных вводятся понятия «объект», «атрибут», «тип связи между объектами и атрибутами», а также задаются средства и правила описания объектов, атрибутов и связей (отношений). После построения логической модели БД переходят к построению физической модели организации БД, т. е. к планированию размещения данных на физических носителях информации в памяти ЭВМ.

Модель базы данных логическая - модель данных для некоторой части предметной области, в которой общая модель отображается в структуре данных определением организационных единиц структуры данных и спецификацией их свойств и отношений между ними. Логическим средством структуризации данных посвящены предложения КОДАСИЛ (Ассоциация по языкам систем обработки данных).

Модель базы данных реляционная - модель базы данных, предложенная в 1970 г. американским ученым . Реляционная модель основана на представлении данных в виде отношении между ними, при этом представление отношений подвергается нормализации и пошаговому процессу приведения их к двумерной табличной форме, причем информация о них сохраняется полностью. Имеется несколько подходов построения такого рода моделей, основанных на реляционной алгебре и реляционном исчислении.

Модель базы данных физическая - модель базы данных, отображающая логическую модель в выбранной структуре хранения с учетом свойств конкретной вычислительной и программной обстановке.

Модель базы данных сетевая представлена структурной диаграммой в виде произвольного ориентированного графа. Каждая вершина графа соответствует записи, и он отличается от дерева тем, что некоторые порожденные записи могут иметь несколько исходных. Сетевая модель упрощает проблемы, связанные с хранением данных, обладает большей по сравнению с иерархической моделью симметрией, но меньшей наглядностью.

Система управления базами данных (СУБД) - комплекс программных средств, специально предназначенных для реализации на ЭВМ всех процедур создания и ведения баз данных и обеспечивающих извлечение данных по требованию пользователей или задач обработки данных. В зависимости от представляемых возможностей по организации баз данных в соответствии с различными моделями баз данных (иерархической, сетевой, реляционной и др.), а также в зависимости от вида обрабатываемой информации (документальной, фактографической, графической и др.) разработаны специальные СУБД: для обработки текстов на естественном языке, на формализованных информационно-поисковых языках, для обработки баз данных, организованных в соответствии с различными типами моделей БД. Выбор конкретных комплексов программных средств для создания и эксплуатации банка данных осуществляется на этапе технического проектирования и является одним из наиболее ответственных проектных решений.

Администратор базы данных - это специалист, имеющий представление о прикладных задачах, решаемых пользователями с помощью базы данных, работающий в тесном контакте с пользователями и администраторами других баз данных и отвечающий за определение, загрузку, защиту и эффективность баз данных в банке данных.

Администратор данных в базе данных - лицо или группа лиц, ответственные за функционирование базы данных и развитие ее схемы данных. Администратор данных отвечает за сохранность данных всего учреждения или той их части, с которой связана его система. Он осуществляет контроль за всей структурой данных.

Информационно-поисковая система представляет собой совокупность языковых, программных и технических средств, предназначенных для хранения, поиска и выдачи искомой информации из имеющегося множества информационных единиц (информационного массива).

При выполнении исследований и производственной деятельности всегда требуется осуществлять операции поиска информации. Например, поиск статей и отчетов, в которых рассматривается проблема рациональной методики разведки залежей нефти и газа на больших глубинах; поиск геологических разрезов скважин, в которых мощность толщи песчаников в верхнемеловых отложениях больше 10 м; поиск результатов измерения значений плотности пород в определенном районе территории города и т. п.

Поиск информации возможен тогда, когда имеется множество информационных единиц - статей, скважин, значений плотности пород и др. и информационный запрос, в котором конкретизирована потребность в информации, т. е. указано, какими свойствами (или значениями свойств) должны обладать искомые информационные единицы, а также правило установления соответствия свойств информационных единиц предъявленному запросу. В случае когда множество информационных единиц заранее никак не упорядочено, операция поиска информационных единиц осуществляется последовательным сравнением каждой из имеющихся информационных единиц с запросом. На практике множества информационных единиц часто столь велики, что последовательное сравнение каждой информационной единицы с запросом требует больших затрат труда и времени. Например, практически невозможно для отыскания статей по методике разведки глубокозалегающих залежей нефти и газа последовательно прочитать все имеющиеся в библиотеке книги и статьи. Для того чтобы облегчить и ускорить выполнение операций поиска информации, используется метод упорядочения, систематизации и унификации представления информационных единиц в множестве (в информационном массиве). Средством для этого служит искусственный формализованный язык описания информационных единиц и запросов.

В отличие от естественного языка, искусственные формализованные языки призваны обеспечить однозначность описания информационных единиц. Такие искусственные языки обозначаются в информатике термином «информационно-поисковые языки (ИПЯ)». Информационно-поисковая система обеспечивает автоматизированный поиск информации. Автоматизация поиска информации становится возможной благодаря тому, что описание информационных единиц в информационном массиве и информационных запросов выполнено на искусственном информационно-поисковом языке, а операция сравнения описаний информационных единиц с запросами является точно определенной, подчиняющейся формально-логическим правилам. Чтобы был возможен автоматизированный поиск информации, необходимо предварительно перевести описания информационных единиц и запросов с естественного языка на информационно-поисковый язык. Процедура перевода обозначается термином «индексирование». Правило сравнения описаний информационных единиц с описанием информационного запроса, выраженное средствами информационно-поискового языка, обозначается термином «критерий смыслового соответствия».

Таким образом, в абстрактном понимании информационно-поисковая система представляет собой совокупность информационно-поискового языка, правил индексирования и критерия смыслового соответствия. Практическая реализация информационно-поисковой системы означает:

1) создание информационного массива, т. е. множества описаний информационных единиц на информационно-поисковом языке, зафиксированных на каком-либо материальном носителе (перфокарте, фотопленке, магнитной ленте и др.);

2) применение некоторого технического информационно-поискового устройства (например, устройств для сортировки библиографических карт и перфокарт, устройств счетно-перфорационной техники, электронно-вычислительных машин ЭВМ);

3) разработку технологии поиска информации с применением технических средств в виде набора инструкций по эксплуатации информационно-поисковой системы;

4) создание коллектива специалистов для эксплуатации ИПС.

Следовательно, в практическом смысле информационно-поисковая система представляет собой совокупность информационного массива на материальных носителях информации, информационно-поискового устройства, эксплуатационных инструкций для всех операций обработки информации и коллектива специалистов, обеспечивающих эксплуатацию ИПС.

Рекомендуемая литература

1. , , Староверова многомерных наблюдений. М.: Статистика, 1974.

2. Введение в многомерный статистический анализ. М.: Физматгиз, 1963.

3. Аронов математической обработки геологических данных на ЭВМ. М.: Недра, 1977.

4. , , Скублов анализ в геологии. М.: Недра, 1982.

5. Дэвис Дж. С.. Статистический анализ данных в геологии. М.: Недра, 1990.

6. , , Реймент факторный анализ. Л.: Недра, 1980.

7. Математические методы статистики. М.: Мир, 1975.

8. Родионов методы разграничения геологических объектов по комплексу признаков. М.: Недра, 1968.

9. Справочник по математическим методам в геологии. М.: Недра, 1987.

10. , Юдович обработка геохимических данных. Л.: Наука, 1975.

11. Чини методы в геологии. М.: Мир, 1986.

12. , , Ковальски . Л.: Химия, 1989.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28