НАЦИОНАЛЬНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА
«ИНТЕЛЛЕКТУАЛЬНО-ТВОРЧЕСКИЙ ПОТЕНЦИАЛ РОССИИ»
Конкурс исследовательских работ «ЮНОСТЬ, НАУКА, КУЛЬТУРА»
Секция: Программирование
Информационная система ранжирования и кластеризации информации на базе методов ELECTRE и целочисленного линейного программирования
Гресько Евгений
СГАСУ, 2 курс, г. Самара
Научный руководитель:
, д. т.н., профессор
г. Обнинск, 2007/2008 учебный год
Оглавление
Введение. 3
Постановка задачи комплексного мониторинга деятельности студента в вузе[6] [7] 4
Организация мониторинга учебной деятельности. 4
Организация мониторинга творческой деятельности. 4
Организация мониторинга личностной активности. 4
Что такое метод ELECTRE и история его происхождения[1] 5
Перейдем к краткой характеристике метода ELECTRE. 6
Основные этапы методов ELECTRE.. 6
Индексы согласия и несогласия. 6
Бинарные отношения. Выделение ядер. 7
Общая характеристика подхода. 8
Постановка задачи кластеризации данных. 9
Что такое кластеризация [8] 9
Меры расстояния. 9
Исследовательская часть. 10
Сбор, ввод и обработка первичной информации. 10
Формирование индексов согласия и несогласия. 10
Индекс согласия (См. рисунок 6) 10
Индекс несогласия (См. рисунок 7) 11
Работа метода ELECTRE(Таблица 1, Рис. 3) 11
Что собой представляют полученные ядра?. 11
Сравнительный анализ результатов использования метода ELECTRE и кластеризации данных. 12
Выводы.. 13
Библиографический список. 14
Приложение. 15
Введение
Одним из движущих факторов человеческого мышления является выбор. Выбрать – значит определить лучшее для себя, т. е. дать субъективную оценку всем данным вариантам и предпочесть оптимальный. Цель существующей теории принятия решений – выделение объективно лучшего варианта с помощью использования различных математических соотношений. Такие соотношения (способы учета неопределенности - СУН) позволяют обоснованно переходить от субъективных данных, т. е. неопределенностей (обобщенных потерь), к наиболее корректным решениям (необобщенным потерям). Область применения методов принятия решений огромна: от выбора сотового телефона до расчета весовых коэффициентов в различных математических моделях.[2] [3]
На факультете информационных систем и технологий СГАСУ уже в течение нескольких лет работает система комплексного оперативного мониторинга учебной и творческой деятельности студентов. Мониторинг – это специально организованное систематическое наблюдение за состоянием каких-либо объектов. Мониторинг направлен на получение и использование объективных и независимых данных об объекте исследования, факторов на него влияющих и составления прогноза изменения ситуации в будущем. Данная система включает в себя мониторинг учебной, творческой и общественной деятельности студентов. В результате мониторинга каждого вида деятельности формируется комплексный рейтинг студента. [6]
Системный мониторинг обеспечивает информационную базу оперативного, объективного и достоверного отражения первичной информации об основных сторонах деятельности студентов в вузе. Однако необходима разработка математических интегративных моделей, которые позволили бы объединить огромные объемы этой информации в некоторые интегральные характеристики, позволяющие осмыслить ход учебно-развивающего процесса в целом как по отдельному студенту так и по студенческой группе, курсу, факультету и вузу в целом.
Цель моей работы: создание аналитической системы для выделения в студенческом контингенте различных ядер с помощью методов принятия решения на основе характеристик деятельности входящих в них студентов. Для этого необходимо разработать соответствующую математическую модель.
Гипотеза: Использование математических методов поддержки принятия решения и компьютерной техники позволяет выделить относительно лучшие группы студентов для ведения индивидуализированной работы с ними.
Постановка задачи комплексного мониторинга деятельности студента в вузе[6] [7]
Организация мониторинга учебной деятельности
В организации мониторинга учебной деятельности задействованы:
- старосты групп;
- технический сотрудник деканата;
- преподаватели дисциплин;
- кураторы групп и начальники потоков;
- заместители декана по учебной и воспитательной работе;
- студенческий совет факультета;
- декан.
Функции участников процесса определяются следующим образом:
- во-первых, старосты берут в конце каждого занятия и вносят в технологические карту сведения о посещаемости и отметки, выставленные преподавателями на занятии (См. рисунок 4);
- во-вторых, информирует каждого преподавателя о результатах оценки успеваемости каждого студента рассчитанные информационной системы;
- в-третьих, вводят коррективы в рассчитывающую информационную систему, которые сообщает преподаватель;
- в-четвертых, информирует студентов группы об обсуждении итогов мониторинга на студенческом совете и в деканате;
- в-пятых, вносят куратору и в деканат предложения группы по корректировке хода учебного процесса по отдельным предметам, репетиционным занятиям, поощрению успевающих студентов (См. рисунок 1).
Организация мониторинга творческой деятельности
Все студенты факультета в рамках курса «Технология и методология научных исследований» выполняют исследовательские работы. Оценка производится по 9-ти функциям научной квалификации. Оценкой работ занимается другая группа исследователей, это не входит в рамки моей задачи. Мною берутся только данные. Т. к. исследовательская работа выполняется раз в семестр, то частота изменения данных – один раз в семестр (См. рисунок 2).
Организация мониторинга личностной активности
Большое значение имеет мониторинг не только учебной и творческой деятельности студентов, но и других форм деятельности. На портале реализована система, которая позволяет каждому зарегистрированному пользователю ввести информацию о своих достижениях или достижениях своих товарищей. Достижения разбиты на сферы: в области спорта, общественной деятельности, культуры и науки. Представитель студенческого совета, зам. декана по воспитательной работе или декан имеют право оценить введенное достижение. Таким образом, формируется рейтинг личностной активности.
Что такое метод ELECTRE и история его происхождения[1]
В конце 60-х годов группа французских ученых во главе с проф. Б. Руа предложила подход к попарному сравнению многокритериальных альтернатив, не основанный на теории полезности. В отличие от MAUT оценка каждой альтернативы является не абсолютной, а относительной (по сравнению с другой альтернативой). Так возник метод ELECTEE (ELimination Et Choix Traduisant la Eealite — исключение и выбор, отражающие реальность). В настоящее время разработан ряд методов семейства ELECTRE.
Методы ELECTEE направлены на решение задач с уже заданными многокритериальными альтернативами. В отличие от метода АНР в методах ELECTRE не определяется количественно, показатель качества каждой из альтернатив, а устанавливается лишь условие превосходства одной альтернативы над другой.
Перейдем к краткой характеристике метода ELECTRE.
Постановка задачи обычно имеет следующий вид:
Дано: N критериев со шкалами оценок (обычно количественные), веса критериев (обычно целые числа), альтернативы с оценками по критериям.
Требуется: выделить группу лучших альтернатив.
Основные этапы методов ELECTRE
1. На основании заданных оценок двух альтернатив подсчитываются значения двух индексов: согласия и несогласия. Эти индексы определяют согласие и несогласие с гипотезой, что альтернатива А превосходит альтернативу В.
2. Задаются уровни согласия и несогласия, с которыми сравниваются подсчитанные индексы для каждой пары альтернатив. Если индекс согласия выше заданного уровня, а индекс несогласия - ниже, то одна из альтернатив превосходит другую. В противном случае альтернативы несравнимы.
3. Из множества альтернатив удаляются доминируемые. Оставшиеся образуют первое ядро. Альтернативы, входящие в ядро, могут быть либо эквивалентными либо несравнимыми.
4. Вводятся более «слабые» значения уровней согласия и несогласия (меньший по значению уровень согласия и больший уровень несогласия), при которых выделяются ядра с меньшим количеством альтернатив.
5. В последнее ядро входят наилучшие альтернативы. Последовательность ядер определяет упорядоченность альтернатив по качеству.
Индексы согласия и несогласия
В различных методах семейства ELECTRE индексы согласия и несогласия строятся по-разному. Основные идеи построения этих индексов далее будут показаны на примере метода ELECTRE 1.
Каждому из N критериев ставится в соответствие целое число р, характеризующее важность критерия. Б. Руа предложил рассматривать р как «число голосов» членов жюри, голосующих за важность данного критерия.
Выдвигается гипотеза о превосходстве альтернативы А над альтернативой В. Множество I, состоящее из N критериев, разбивается на три подмножества:
I — подмножество критериев, по которым А предпочтительнее В;
I" — подмножество критериев, по которым А равноценно В;
Г" - подмножество критериев, по которым В предпочтительнее А.
Далее формулируется индекс согласия с гипотезой о превосходстве А над В. (В других методах семейства ELECTRE используются индексы сильного и слабого превосходства.)
Индекс согласия подсчитывается на основе весов критериев. Так, в методе ELECTRE1 этот индекс определяется как отношение суммы весов критериев подмножеств 1+ и I - к общей сумме весов:

Индекс несогласия dAB с гипотезой о превосходстве А над В определяется на основе самого «противоречивого» критерия — критерия, по которому В в наибольшей степени превосходит А.
Чтобы учесть возможную разницу длин шкал критериев, разность оценок В и А относят к длине наибольшей шкалы:
dAB= max(Ai-Bi/Li)
где Аi, Вi— оценки альтернатив А и В по i - му критерию; Li — длина шкалы i-ro критерия.
Бинарные отношения. Выделение ядер
В методе ELECTRE 1 бинарное отношение превосходства задается уровнями согласия и несогласия. Если сАВ > ci и dAB <di, где ci, di — заданные уровни согласия и несогласия, то альтернатива А объявляется лучшей по сравнению с альтернативой В. Если же при этих уровнях сравнить альтернативы не удалось, то они объявляются несравнимыми.
С методологической точки зрения введение понятия несравнимости было важным этапом развития теории принятия решений. Если оценки альтернатив в значительной степени противоречивы (по одним критериям одна намного лучше другой, а по другим - наоборот), то такие противоречия никак не компенсируются и такие альтернативы сравнивать нельзя. Понятие несравнимости исключительно важно и с практической точки зрения. Оно позволяет выявить альтернативы с «контрастными» оценками как заслуживающие специального изучения.
Похожие идеи используются и в других методах семейства ELECTRE.
Важно подчеркнуть, что уровни коэффициентов согласия и несогласия, при которых альтернативы сравнимы, представляют собой инструмент анализа в руках ЛПР и консультанта. Задавая эти уровни, постепенно понижая требуемый уровень коэффициента согласия и повышая требуемый уровень коэффициента несогласия, они исследуют имеющееся множество альтернатив.
При заданных уровнях на множестве альтернатив выделяется ядро недоминируемых элементов, которые находятся либо в отношении несравнимости, либо в отношении эквивалентности. При изменении уровней из данного ядра выделяется меньшее ядро и т. д. Аналитик предлагает ЛПР целую серию возможных решений проблемы в виде различных ядер. В конечном итоге можно получить одну лучшую альтернативу. При этом значения индексов согласия и несогласия характеризуют степень «насилия» над данными, при которых делается окончательный вывод.
Общая характеристика подхода
Важным достоинством методов ELECTRE является поэтапность выявления предпочтений ЛПР в процессе назначения уровней согласия и несогласия и изучения ядер. Детальный анализ позволяет ЛПР сформировать свои предпочтения, определить компромиссы между критериями. Использование отношения несравнимости позволяет выделить пары альтернатив с противоречивыми оценками, остановиться на ядре, выделение которого достаточно обоснованно с точки зрения имеющейся информации. Трудности при применении методов ELECTRE связаны с назначением ЛПР весов. В ряде случаев при выделении ядер могут возникать циклы.
Постановка задачи кластеризации данных
Что такое кластеризация [8]
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры. Например, биологи ставят цель разбить животных на различные виды, чтобы содержательно описать различия между ними.
Фактически, кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов "распределения объектов по кластерам". Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования.
Меры расстояния
Евклидово расстояние- это, по-видимому, наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:
_________
расстояние (x, y) = √∑i (xi - yi)2
Заметим, что евклидово расстояние (и его квадрат) вычисляется по исходным, а не по стандартизованным данным. Это обычный способ его вычисления, который имеет определенные преимущества (например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, который может оказаться выбросом). Тем не менее, на расстояния могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния. К примеру, если одна из осей измерена в сантиметрах, а вы потом переведете ее в миллиметры (умножая значения на 10), то окончательное евклидово расстояние (или квадрат евклидова расстояния), вычисляемое по координатам, сильно изменится, и, как следствие, результаты кластерного анализа могут сильно отличаться от предыдущих.
Исследовательская часть
Сбор, ввод и обработка первичной информации
Т. к. я являюсь старостой группы 2-го курса, то соответственно учебный рейтинг по моему курсу составляется непосредственно мною. Сюда входит заполнение так называемых технологических карт и составление итогового (комплексного) рейтинга, зависящего от сформированных оценок на каждом из изучаемых предметов за каждую неделю. Все тех. карты составляются с помощью определенной математической модели, составленной деканатом и членами студ. совета и запрограммированной в MS Excel. В данной модели формирующиеся оценки вычисляется за счет сравнения суммарного балла ученика и максимального. Комплексный рейтинг студента по учебному рейтингу вычисляется как среднее арифмети - ческое от полученных оценок по каждому предмету за неделю.
Рейтинговые оценки по другим направлениям деятельности студентов берутся из основной базы данных Факультета Информационных Систем и Технологий.
На основе всех полученных рейтинговых оценок формируется локальная база данных, с которой в дальнейшем и проводится само исследование (См. рисунок 5, Табл. 2).
Формирование индексов согласия и несогласия
Перед началом расчетов индексов согласия и не согласия вводятся приоритет и направление оптимизации. Направление является ключевым атрибутом данного метода, т. к. от него зависит само вычисление этих индексов.
Индекс согласия (См. рисунок 6)
1. Берутся две ближайшие альтернативы и начинают сравниваться по каждому критерию.
2. Т. к. каждый критерий имеет направление (“+” или “-“), то программа смотрит на него и сравнивает значения.
3. После сравнения двух альтернатив, программа суммирует общее количество “выигрышей” у каждой альтернативы, делит на сумму всех весов критериев и заносит в матрицу результатов, а затем сравнивает следующие альтернативы, т. е. получается, что сравнение идёт по принципу “каждый с каждым”.
4. По окончании процесса расчёта, программа выводит на экран матрицу результатов.
Индекс несогласия (См. рисунок 7)
1. Берутся две ближайшие альтернативы и начинают сравниваться по каждому критерию.
2. Т. к. каждый критерий имеет направление (“+” или “-“), то программа смотрит на него и сравнивает значения. Если не выполняется условие превосходства одной альтернативы над другой, то находится их абсолютная разность, делится на максимальное значение из всех оценок альтернатив по данному критерию. Такая процедура выполняется для сравнения этих альтернатив по всем критериям. После сравнения альтернатив программа выводит в матрицу результатов наибольшее значение, которое было рассчитано при сравнении.
3. Выводится матрица результатов.
Работа метода ELECTRE(Таблица 1, Рис. 3)
ЛПР (лицу, принимающему решение) предлагается самостоятельный ввод, а соответственно и контроль выделения тех или иных ядер. Соответственно на ЛПР лежит обязанность ввода уровней согласия и несогласия. Т. к. программа рассчитана на выделение и вывод ядер доминируемых альтернатив, то если индекс согласия больше уровня согласия, а индекс несогласия меньше, альтернатива А доминирует над альтернативой В, и выводится альтернатива В.
ЛПР представляется выбор: продолжать выделение других ядер на основе новых уровней или начать новый расчет ядер.
С каждым новым выделением ядра будет формироваться графическое представление полученных ядер (процентное соотношение альтернатив при заданных уровнях согласия и несогласия). (См. рисунок 10)
Что собой представляют полученные ядра?
Если альтернативы в ядре не доминируются при уровне согласия равном 1 и уровне несогласия равном 0, то таких студентов можно назвать «Умниками». Чем ниже уровни согласия и несогласия у альтернатив дальнейших ядер, тем выше успеваемость и разностороннее развитие студентов, входящих в них.
Первые ядра (См. рисунок 8) могут включать в себя как двоечников, так и не очень активных студентов. Они составляют большую часть всего числа студентов, т. к. очень велика вероятность существования более лучшего студента, чем рассматриваемый. Данная система рассчитана на выявление именно разносторонне развитых студентов. (См. рисунок 9, Табл. 3)
Применительно к процессу обучения, я предлагаю каким-то образом поощрять выделившихся студентов. Самых популярным из поощрений является Доска Почета, где будут показаны такие студенты.
Сравнительный анализ результатов использования метода ELECTRE и кластеризации данных.
В моей предыдущей работе «Мониторинг учебного процесса и кластерный анализ студенческого контингента в условиях информационно-коммуникационной среды вуза» я рассматривал кластеризацию с использованием целочисленного линейного программирования. В результате исследования на базе тех же исходных данных выделилось 5 кластеров (См. рисунок 11). В данном исследовании тоже выделилось 5 ядер. Получилось частичное соответствие полученных групп. Это зависит от разности подхода методов: методы ELECTRE распределяют на основе полного или частичного превосходства по всем критериям, тогда как кластеризация выделяет относительно близкие по показателям альтернативы.
Выводы
Оба метода могут применяться для анализа учебного процесса. Все зависит от выбранной задачи (решения). Если требуется найти лучшие альтернативы, то лучше использовать метод ELECTRE, т. к. этот метод основывается на степени превосходства одной альтернативы над другой. Он не разбивает все альтернативы на какие-то группы, для которых требуется индивидуальный подход. Кластеризация данных или задача линейного программирования наоборот ищет группы с относительно близкими критериями.
К началу проведения выставки планируется увеличение задач работы с базами данных (создание, сохранение и изменение исследуемой задачи). А также планируется проведение исследования с помощью данного метода не только по второму курсу, но и для всего факультета. Будут проводиться работы по внедрению метода ЕLECTRE в образовательный процесс факультета ИСТ СГАСУ.
Библиографический список
1. Теория и методы принятия решений, а также Хроника событий в Волшебных странах. Учебник. М.: Логос, 2002. – 392 с.
2. Управляемое развитие научных способностей молодежи. М. Академия наук о Земле. 2001. – 109 с.
3. . Теория и методы принятия решений. М., "Логос", 2000 г.
4. С#: учебный курс – СПб.: Питер; К.: Издательская группа ВНV, 2003. – 512 с.
5. Методы оптимизации и оптимального управления: Учебное пособие/ Самарский государственный архитектурно-строительный университет. - Самара, 2004.
6. , Мониторинг качества учебной деятельности студентов с использованием информационной системы. – М.: Исследовательский центр проблем качества подготовки специалистов, 2006. – с. 50-54
7. , Разработка системы комплексного мониторинга формирования IT-специалиста в вузе. Материалы международной научно-технической конференции. – Самара: СГАСУ, 2006. – с. 279-286.
8. http://www. /rules/intro. html
Приложение
![]() |
Рисунок 1 – Формирование рейтинга учебной деятельности
![]() |
Рисунок 2 – Формирование рейтинга творческой активности
Рисунок 3 – Блох-схема программы
Таблица 1 - Характеристика программной среды
|
Среда программирования |
Microsoft Visual Studio 2005 |
|
Язык программирования |
C# |
|
Исходные данные |
База данных Access |
|

Рисунок 5 – Ввод первичной информации

Таблица 2 – Исходные данные
|
Анд |
84.86707 |
13.440985 |
0 |
|
Ару |
94.88754 |
22.99024 |
30 |
|
Вас |
74.84663 |
0 |
0 |
|
Гал |
99.3865 |
13.440985 |
47 |
|
Гор |
96.11452 |
13.440985 |
53.19149 |
|
Гре |
99.591 |
54.611989 |
41.13475 |
|
Дав |
76.27812 |
0 |
0 |
|
Дро |
93.04703 |
0 |
40 |
|
Ере |
81.18609 |
13.440985 |
0 |
|
Зин |
63.19018 |
0 |
0 |
|
Иль |
98.56852 |
22.99024 |
60 |
|
Кал |
60.1227 |
0 |
0 |
|
КисД |
89.77505 |
0 |
100 |
|
КисМ |
72.80164 |
94.086896 |
0 |
|
Мал |
97.13701 |
30 |
0 |
|
Мар |
93.45603 |
0 |
0 |
|
Мих |
89.57056 |
0 |
0 |
|
Пан |
90.38855 |
26.88197 |
0 |
|
Рах |
97.13701 |
13.440985 |
0 |
|
Сар |
81.79958 |
0 |
22 |
|
Сок |
78.52761 |
100 |
0 |
|
Тим |
94.06953 |
0 |
40 |
|
Тол |
96.52353 |
25 |
0 |
|
Чир |
87.73006 |
0 |
15 |
|
Шиш |
100 |
25 |
0 |
|
Ятм |
91.41104 |
0 |
37 |
|
Яшк |
97.95501 |
0 |
34.04255 |
Рисунок 6 – Полученная матрица индексов согласия

Рисунок 7 – Полученная матрица индексов несогласия

Рисунок 8 – Формирование первого ядра

Рисунок 9 – Формирование всех ядер

Таблица 3 – Полученные ядра
|
Ядра |
1-е ядро |
2-е ядро |
3-е ядро |
4-е ядро |
5-е ядро |
|
Индекс согласия |
1 |
0.8 |
0.4 |
0.2 |
0 |
|
Индекс не огласия |
0 |
0.2 |
0.4 |
0.8 |
1 |
|
Анд |
КисД |
Шиш |
Сок |
Гре | |
|
Ару |
Гал | ||||
|
Вас |
Иль | ||||
|
Гор | |||||
|
Дав | |||||
|
Дро | |||||
|
Ере | |||||
|
Зин | |||||
|
Кал | |||||
|
КисМ | |||||
|
Мал | |||||
|
Мар | |||||
|
Мих | |||||
|
Пан | |||||
|
Рах | |||||
|
Сар | |||||
|
Тим | |||||
|
Тол | |||||
|
Чир | |||||
|
Ятм | |||||
|
Яшк |
Рисунок 10 – График распределения по индексам согласия и несогласия

Рисунок 11 – Полученные кластеры.
|
Идеальные |
Середняки |
Умники |
Неуспевающие |
Равнодушные |
|
Ару |
Анд |
Гал |
Анд |
КисМ |
|
Гре |
Ере |
Гор |
Вас |
Сок |
|
КисД |
Мал |
Дро |
Дав | |
|
Сар |
Пан |
Иль |
Ере | |
|
Рах |
Тим |
Зин | ||
|
Тол |
Ятм |
Кал | ||
|
Шиш |
Яшк |
Мар | ||
|
Мих | ||||
|
Чир |





