Итак, если собственное число мало, то вклад соответствующего собственного вектора в расстояние между точками будет также малым. Если собственное число велико, но элементы соответствующего собственного вектора слабо различаются между собой, то вклад в расстояние также будет малым. Следовательно, большой вклад в расстояние вносят только координатные векторы, соответствующие большим собственным числам и имеющие широкий диапазон вариаций их элементов.

При использовании метода главных координат размер матрицы данных может превысить объем памяти даже крупных ЭВМ. Для борьбы с этим Гувер разработал способ нанесения дополнительных точек на диаграмму.

Приложение I. Примеры задач геологии, решаемых с помощью статистических методов

Задачи реконструкции и моделирования характеристик геологических объектов и процессов.

В основе геохимического подхода к решению задач реконструкции лежит банк данных, содержащий информацию о химических составах горных пород метаморфических комплексов докембрия D={Dj} и образований фанерозоя A={Ai}, совокупности которых используются в качестве эталонов обстановок формирования породных ассоциаций. Удобной математической моделью для представления химического состава комплекса горных пород, охарактеризованных n параметрами, является n-мерная случайная величина. Тогда химические составы совокупности разновозрастных структур A и D могут быть формально представлены совокупностями n-мерных случайных величин X={Xi} и Y={Yj}. Для комплексов фанерозоя A известны некоторые характеристики обстановок их формирования {pl}, причем значения каждой из них заданы в виде отношения частичного порядка на множестве A*A. Аналогичным образом могут быть заданы возрастные характеристики.

Пусть Z={Zi} - множество n-мерных случайных величин Z={Zi} и на множестве Z*Z задано отношение частичного порядка "<". Если c - n-мерный вектор единичной длины, то скалярное произведение (c, Zi) является одномерной случайной величиной. Эту случайную величину можно охарактеризовать ее математическим ожиданием M{(c, Zi)}. Для сравнения математических ожиданий использовался ранговый статистический критерий Пури-Сена-Тамуры о равенстве средних. При этом необходимо произвести оценку средних (в качестве этой оценки выбирается медиана Me{(c, Zi)}) и вычислить статистику Пури-Сена-Тамуры:

L((c, Zi),(c, Zj)).

Статистическое моделирование характеристики, множество значений которой заданно отношением "<", заключается в поиске такого n-мерного вектора с единичной длины, для которого, при выбранном уровне значимости d, выполняются условия:

Me{(c, Zi)} < Me{(c, Zj)},

L((c, Zi),(c, Zj)) > c2(d);

(здесь c2(d)- значение квантили c2 -распределения для уровня значимости d для всех пар <Zi, Zj> таких, что Zi<Zj).

Выбор указанного статистического критерия определяется его устойчивостью относительно нарушения условия нормально­сти (и даже унимодальности) распределений случайных величин, а также относительно наличия в выборках аномальных наблюдений. Эти нарушения (и наличие аномальных наблюдений) характерны для реальных выборок.

Содержательно задача моделирования сводится к аппрок­симации отношения частичного порядка линейной функции P:Z®R, связанной с параметрами химического состава образова­ний в виде P(Zi)=M{(c, Zi)}. Качество аппроксимации оценивается значением функционала:

где:

Вектор c, который будем называть фактором частичного порядка, характеризует общую направленность изменчивости хи­мических составов относительно частичного порядка.

Задача распознавания протоприроды метаморфитов.

Результатом процедуры распознавания первичной природы пород, слагающих эти комплексы, является их классификация по группам горных пород в рамках выбранной систематики. Решение этой задачи осуществлялось методом, который позволяет описать первичную природу метаморфитов в виде двух совокупностей выборок:

1.  выборками, состоящими только из однозначно классифицированных образцов;

2.  выборками, расширенными за счет образцов отнесенных к нескольким группам одновременно.

Выборки этих совокупностей, соответствующие одноименным группам, сравниваются между собой по критерию Пури-Сена-Тамуры о равенстве средних. В случае, когда гипотеза о равенстве средних относительно одной из групп, для выбранного уровня значимости, отвергается необходимо осуществить два варианта реконструкции обстановок формирования протолитов изучаемых комплексов докембрия (отдельно для каждой совокупности) с последующим сопоставлением результатов, полученным по этим вариантам. В противном случае, результаты реконструкции по обоим вариантам совпадают.

Задача моделирования характеристик обстановок формирования комплексов фанерозоя.

Для целей сопоставления разновозрастных комплексов по химизму слагающих их пород, относительно данной характеристики, необходимо обеспечить переход n-мерных случайных величин {Xi} к некоторой линейной функции, связанной с этими величинами и обладающей некоторыми оптимальными свойствами. Такой переход может быть осуществлен путем аппроксимации введенного отношения частичного порядка линейной функцией P, которому соответствует фактор частичного порядка c, с максимальным значением функционала качества J(P). Для этого следует решить оптимизационную задачу:

max J(P)

при ограничениях:

Me{(c, Xi)} < Me{(c, Xj)} и L((c, Xi),(c, Xj)) > c2(d)

для всех пар <Xi, Xj> таких, что Xi<Xj.

Тогда в качестве функционала выбирается такая линейная функция P, что выполняется условие:

P(Xi)=M{(c, Xi)}.

Для поиска решения указанной задачи оптимизации может быть использован симплекс-метод.

Задача моделирования характеристик отличий обстановок формирования фанерозойских комплексов.

Для решения этой задачи каждая обстановка Gl из эталонного множества {Gi} должна быть охарактеризована совокупностью объектов фанерозоя Ai={Aik}, сформировавшихся в соответствующих условиях. Химические составы породных ассоциаций {Aik} представлены в виде совокупности n-мерных случайных величин Xi={Xik}. Для целей построения системы характеристик отличий фанерозойских комплексов необходимо для каждой пары <Gi, Gj> построить систему дискриминантных функций, заданных на множестве случайных величин и обеспечивающую оптимальное разделение совокупностей Xi и Xj. Так как, для каждой пары <Gi, Gj> можно ввести отношение частичного порядка "<" (Xik<Xjr, если i<j), то для каждой пары совокупностей случайных величин <Xi, Xj> строится линейная функция Pij с максимальным значением качества аппроксимации J(Pij). Если для выбранного уровня значимости такой показатель найден, то задача решена. В противном случае, необходимо одну из совокупностей, например Xi, разбить на несколько, возможно пересекающихся, множеств {Zil}.

Основой для такого разбиения может служить информация алгоритма о случайных величинах наиболее "препятствующих" разделению на множества. Затем для каждой пары <Zil, Xj> осуществляется поиск линейной функции, аппроксимирующей отношение частичного порядка Pijl.

Если и в этом случае окажется, что для некоторой <Zil, Xj> невозможно построить линейную функцию с требуемым уровнем значимости, то следует произвести более дробное разбиение множества Xi и повторить попытку построения уже новой системы {Pijl}. Процедура заканчивается либо построением {Pijl} (и соответственно {cijl}), либо выводом об отсутствии отличий по химизму между совокупностями Ai и Aj.

В случае, когда построенная система состоит из несколь­ких линейных функций, ее следует оптимизировать. Этот шаг определяется требованием выбора наиболее устойчивого, из всех возможных, описания отличий. Для оптимизации системы {Pijl} в работе разработан метод суть которого заключается в следующем.

Охарактеризуем построенную систему критерием качества:

J0=min{J(Pijl)}.

Степень устойчивости описания предлагается характеризовать функционалом:

J=min{(cijk, cijr)},

принимающего значения в промежутке [-1,1]. Такой выбор определяется представлением о максимальной устойчивости в случае линейной разделимости выпуклых оболочек множеств {M(Xik)} и {M(Xjk)} и, следовательно, достаточности одной линейной функции для описания отличий рассматриваемых совокупностей.

Исходя из изложенного, выбор устойчивого описания может быть осуществлен в результате решения, для выбранного уровня значимости d, оптимизационной задачи max J при ограничениях:

J0 > c2(d),

Me{(cijl, Xik)}<Me{(cijl, Xjr)},

L((cijl, Xik),(cijl, Xjr))> c2(d)

для всех <Xik, Xjr, l> таких, что Xik<Xjr и Xik из Zil.

Для ее решения также можно использовать симплекс-метод. Содержательно эта задача сводится к установлению характера отличий параметров химического состава комплексов фанерозоя, сформировавшихся в разных геодинамических обстановках.

Задача моделирования характеристик отличий докембрийских и фанерозойских комплексов.

Пусть совокупность разновозрастных образований состоит из двух совокупностей - эталонных породных ассоциаций фанерозоя A={Ai} и метаморфических комплексов докембрия D={Dj}. Их химические составы представлены совокупностями n-мерных случайных величин X={Xi} и Y={Yj}. Для выявления характера отличий химических составов докембрийских и фанерозойских образований предлагается метод построения минимальной (по количеству) системы линейных функций {Pl}, которая оптимально описывает эти отличия. Для этого на множестве X*Y вводится отношение частичного порядка: Xi<Yj для всех i, j. Затем методом, описанным для решения задачи моделирования характеристик отличий обстановок формирования, производится построение системы линейных функций {Pl} (и соответственно факторов {fl}). Аналогичным образом производится и оптимизация построенной системы.

Задача учета особенностей химических составов комплексов докембрия при реконструкции обстановок формирования их протолитов.

Особенности химических составов пород для комплексов докембрия {M(Yl)} относительно фанерозоя {M(Xk)} определяются системой {fi} факторов частичного порядка X < Y, полученной при моделировании характеристик отличий по химическому составу фанерозойских и докембрийских образований. Для учета этих особенностей в работе предлагается процедура многовариантной (каждому фактору fi соответствует вариант Vi) реконструкции.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28