В основе способа реконструкции по каждому варианту Vi лежит разработанный автором метод, позволяющий получать оценки, характеристик обстановок формирования протолитов докембрийских комплексов, которые не зависят от возможных смещений {M(Xk)} и {M(Yl)} относительно фактора отличий fi. Такая независимость достигается в результате снижения размерности признакового пространства в результате перехода от исследования n-мерных случайных величин к (n-1)-мерным путем проектирования реализаций {Xk} и {Yl} на гиперплоскость ортогональную fi с последующим моделированием изучаемых характеристик в пространстве меньшей размерности.

Необходимость моделирования характеристик в новом признаковом пространстве определяется возможным отсутствием, для выбранного уровня значимости, аппроксимации в этом пространстве какой-либо характеристики линейными функциями. Для оценки соответствия обстановок формирования протолитов докембрийских комплексов эталонам фанерозоя в работе введена мера сходства, которая определяется как независимая, от выявленных отличий образований фанерозоя и докембрия, функция параметров химического состава.

Процедура многовариантной реконструкции завершается сопоставлением результатов, полученным для каждого из вариантов. Степень их соответствия определяет уровень достоверности результатов реконструкции.

Задача оценки степени «сходства-отличия» объектов охарактеризованных неоднородными выборками.

Как правило, эти химические составы пород геологических объектов представлены неоднородными выборками (полимодальное распределение составов, наличие аномальных значений и т. п.), поэтому использование методов прямого их сопоставления на основе известных статистических критериев представляется некорректным. Кроме того, сравниваемые объекты часто представлены несколько различающимися по набору разновидностей пород ассоциациями.

В такой ситуации сначала необходимо провести сравнение для каждой породной разновидности, входящей в состав обеих ассоциаций, и только затем будет возможным получить оценку степени соответствия этих ассоциаций "в целом". При этом вывод о степени соответствия образований должен осуществляться с учетом как степени соответствия спектров породных разновидно­стей в ассоциациях, так и статистических оценок соответствия составов однотипных пород.

Ввиду того, что проблема выбора меры близости (отличия) составов породных ассоциаций является одним из ключевых моментов при выборе похожих объектов, остановимся на этом вопросе более подробно. Для этого рассмотрим, к примеру, две условные ассоциации горных пород - A и B. Первая представлена выборкой составов пород, слагающих эту ассоциацию, X={xi}, где xi - n-мерный вектор состава соответствующей пробы, а n - число измеренных параметров состава. Аналогично, вторая представлена выборкой Y={yj}. Таким образом, каждая из породных разновид­ностей ассоциации A представлена соответствующей выборкой (k-ой разновидности соответствует выборка Xk). При этом выполнено соотношение X=ÈXk (для ассоциации B соответственно имеет место соотношение Y=ÈYl).

Для целей сравнения однотипных породных разновидно­стей (в рамках выбранной классификации) из ассоциаций A и B, представленных выборками Xk и Yl, введем меру их близости (отличия). А именно, будем говорить об их полном соответствии (Xk º Yl), если многомерные средние этих выборок отличаются статистически незначимо при выбранном уровне значимости a (обычно выбирается a=0.05 или a=0.01). При сравнении средних можно использовать непараметрический критерий Пури-Сена-Тамуры. В случае, когда нет полного соответствия между Xk и Yl, для оценки степени отличия составов можно воспользоваться значением статистики Пури-Сена-Тамуры L(Xk, Yl), а именно: чем больше значение этой статистики, тем выше степень отличия составов.

Если сравниваемые ассоциации A и B представлены одним и тем же набором породных разновидностей, то в качестве меры их близости (отличия) может быть выбрана следующая величина: r(A, B)=E{r(xki, co(Yk))}, где r(xki, co(Yk)) - обычное евклидово расстояние от состава пробы xki из k-ой породной разновидности ассоциации A до выпуклой оболочки co(Yk) выборки составов k-ой разновидности ассоциации B, E{.} - среднее этих расстояний для всех проб породной ассоциации A. Следует отметить, что обычно r(A, B)¹r(B, A).

При сравнении некоторой эталонной ассоциации A с некоторой совокупностью ассоциаций {B1,…,Bm} ассоциация Bj будет наиболее близка к A, по сравнению с другими, если при выбранном уровне значимости выполняются статистические гипотезы: r(A, Bj)<r(A, Bk) для всех k¹j. Причем для проверки гипотезы r(A, Bj)<r(A, Bk) предлагается использовать упомянутый выше критерий Пури-Сена-Тамуры.

При сравнении ассоциаций пород, подвергнувшихся метаморфизму, использование этой меры связано с рядом ограничений. Во-первых, в ходе метаморфических преобразований в породах могут существенно меняться содержания некоторых компонентов. Во-вторых, использование указанной меры предполагает, что все породы исследуемых ассоциаций надежно классифицированы относительно их первичной природы по породным разновидностям. Поэтому сначала необходимо осуществить пересчет химических составов пород, слагающих изучаемые ассоциации, исключив влияние компонент состава, наименее устойчивых в процессах метаморфизма.

Это можно сделать следующим образом: выбрав устойчивые компоненты состава, пересчитать их на 100%, исключив из рассмотрения остальные. После этого, сравнение ассоциаций A и B предлагается проводить по схеме, приведенной ниже. Одна из выборок составов, например Y (ассоциация B), подвергается кластеризации (разделению на некоторое заранее неизвестное число статистически однородных непересекающихся групп): Y={Yj}. Алгоритм такого рода кластеризации известен (см. раздел «Статистические методы разграничения геологических объектов»). Затем вычисляется мера сходства между A и B:

.

Здесь - обычное евклидово расстояние от состава пробы xi из ассоциации A, охарактеризованной выборкой X, до выпуклой оболочки кластера представленного выборкой Yk, а E{.} - оценка среднего этих расстояний для всех проб породной ассоциации A. В качестве этой оценки можно выбрать медиану.

Отметим, что соотношение r(A, B)=r(B, A) чаще всего не выполняется. Поэтому наиболее надежный результат при сравнении эталонной ассоциации A с некоторой совокупностью ассоциаций {B1,…,Bm} будет получен в следующем случае: ассоциация Bj наиболее близка к A, по сравнению с другими, если r(A, Bi)<r(A, Bj), r(Bi, A)<r(Bj, A) для любого i¹j и эти отношения статистически значимы при выбранном уровне значимости.

Если сравниваемые объекты представлены несколько различающимися по набору разновидностей пород ассоциациями, то для оценки степени отличий породных ассоциаций необходимо предварительно выполнить определенные действия. В частности, необходимо провести процедуру реконструкции пород по их первичной природе.

Породы сравниваемых ассоциаций классифицируются по группам (породным разновидностям). Затем формируются выборки составов пород из разновидностей присутствующих одновременно во всех сравниваемых ассоциациях. И уже для построенных таким образом выборок проводится оценка их соответствия вышеуказанным способом.

Приложение II. Информатика: общенаучные термины

Автоматизация - применение научно обоснованной методологии и технических средств для регулирования некоторого процесса передачи методик, энергии или информации, в результате которого полностью или частично устраняется участие человека.

В прикладном значении под автоматизацией в большинстве случаев понимается использование средств вычислительной техники и экономико-математического аппарата для совершенствования (оптимизации) управления конкретными процессами (предприятием, отраслью, технологической операцией, процессом решения какой-либо задачи и т. д.). Процессы и регулирующие ход процессов организационные и технические системы, в которых применяются средства автоматизации, обычно определяются как автоматизированные. Например, автоматизированная система управления геологоразведочной отраслью народного хозяйства - АСУ-Геология; автоматизированная система подсчета запасов нефти и газа; автоматизированный банк данных по скважинам глубокого разведочного бурения; автоматизированная информационно-поисковая система по геологии рудных полезных ископаемых.

Информация. Понятие «информация» является одной из общенаучных, философских категорий и из-за многообразия его толкований и приложений не имеет общепринятого определения. До середины XX в. этот термин имел смысл сообщения, сведения о чем-либо, передаваемом людьми. В настоящее время отдельные аспекты понятия «информация» рассматриваются в таких научных дисциплинах, как теория информации, теория связи, кибернетика, информационная теория управления, лингвистика, социология, общая теория систем, генетика и др.

В прикладных отраслях науки и практики, таких как создание вычислительных систем, автоматизированных систем управления, систем информационного обслуживания и т. д., понятие «информация» в большинстве случаев совпадает с понятием «данные».

В геологии широко используется термин «геологическая информация», понимаемый как совокупность данных о строении, свойствах и закономерностях образования и развития геологических объектов.

Система - совокупность элементов, находящихся в отношениях и связях друг с другом, которая образует определенную целостность, единство. С середины XX в. понятие «система» становится одним из ключевых филосовско-методологических и специально-научных понятий. В современном научном и техническом значении разработка проблематики, связанной с исследованием и конструи­рованием систем разного рода, проводится в рамках общей теории систем, различных специальных теорий систем, в кибернетике, системотехнике, системном анализе и т. д.

Данные - факты и идеи, представленные в формализованном виде, позволяющем передавать или обрабатывать эти факты и идеи при помощи некоторого процесса (и соответствующих технических средств). Данные всегда зафиксированы на каких-либо материальных носителях и характеризуют строение и свойства объектов, ход и результаты процессов.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28