Программа повышения квалификации
«Статистические методы в прикладных задачах»
Общий объем - 36 часов.
Периодичность – 2 раза в неделю по 2,5 часа.
Ориентировочные сроки проведения – 15 июня – 31 июля 2015 г.
Место проведения – актовый зал и к.204 Технического центра.
1. Первичная обработка данных.
(Лекции - 3 часа, лабораторные работы - 2 часа)
Этапы работы с пропущенными данными. Обнаружение пропущенных значений. Исследование структуры пропущенных данных. Выявление источников пропущенных данных и эффекта от них. Анализ полных строк (построчное удаление). Метод множественного восстановления пропущенных данных. Попарное удаление.
2. Виды статистических распределений.
(Лекции - 2 часа, лабораторные работы - 2 часа)
Функция распределения и функция плотности распределения вероятностей. Основные параметры одномерного и двумерного распределений. Основные распределения случайных величин. Вероятностный калькулятор в системе STATISTICA. Генератор случайной величины с заданным распределением.
Области применения в металлургической практике.
3. Статистические гипотезы и их проверка.
(Лекции - 2 часа, лабораторные работы - 2 часа)
Принципы проверки статистической гипотезы. Проверки статистических гипотез: о виде распределения, об отсутствии связей между признаками, о равенстве средних, равенстве дисперсий и др. Области применения в металлургической практике.
4. Корреляционно-регрессионный анализ.
(Лекции - 4 часа, лабораторные работы - 3 часа)
Корреляции. Типы корреляций. Проверка статистической значимости корреляций. Регрессии. МНК-регрессии. Подгонка регрессионных моделей. Линейная регрессия. Полиномиальная регрессия. Множественная линейная регрессия. Множественная линейная регрессия с взаимодействиями. Диагностика регрессионных моделей. Способы корректировки регрессионных моделей. Обобщенные линейные модели. Логистическая регрессия. Области применения в металлургической практике.
5. Классификационный анализ.
(Общий объем: лекции - 6 часов, лабораторные работы - 6 часов)
5.1. Факторный анализ.
(Лекции - 2 часа, лабораторные работы - 2 часа)
Метод главных компонент; метод главных факторов; линейная модель факторного анализа; определение числа факторов; статистическая оценка факторных нагрузок; реализация факторного анализа в системе STATISTICA. Области применения в металлургической практике.
5.2. Дискриминантный анализ.
(Лекции - 2 часа, лабораторные работы - 2 часа)
Выявление и описание различий между существующими множествами; классификация новых объектов; построение дискриминантной функции; проверка статистической значимости дискриминантных функций; классификация объектов с помощью функции расстояния; реализация дискриминантного анализа в пакете STATISTICA. Области применения в металлургической практике.
5.3. Кластерный анализ.
(Лекции - 2 часа, лабораторные работы - 2 часа)
Нормализация данных; характеристики близости объектов (виды расстояний); иерархические методы кластерного анализа; определение расстояний между кластерами; итеративные методы кластерного анализа; метод k-средних; реализация кластерного анализа в пакете STATISTICA. Области применения в металлургической практике.
6. Временные ряды
(Лекции - 2 часа, лабораторные работы - 2 часа)
Определения. Основные свойства: стационарность, эргодичность.
Спектральный анализ. Интерпретация результатов спектрального анализа.
Области применения в металлургической практике.
Примечания.
1. Изучение каждой из тем включает курс лекций, примеры выполнения практических заданий в системах STATISTICA и R, задания на самостоятельное выполнение.
2. Рассматриваемые примеры применения различных методов взяты из производственной практики НЛМК.
Преподаватели:
Темы 1, 4 – , к. т.н., доцент кафедры прикладной математики.
Тема 2, 3, 6 – , к. ф.-м. н., доцент, доцент кафедры прикладной математики.
Тема 5 – , к. т.н., доцент, заведующий кафедрой прикладной математики.



