Программа повышения квалификации

«Статистические методы в прикладных задачах»

Общий объем - 36 часов.

Периодичность – 2 раза в неделю по 2,5 часа.

Ориентировочные сроки проведения – 15 июня31 июля 2015 г.

Место проведения – актовый зал и к.204 Технического центра.

1. Первичная обработка данных.

(Лекции - 3 часа, лабораторные работы - 2 часа)

Этапы работы с пропущенными данными. Обнаружение пропущенных значений. Исследование структуры пропущенных данных. Выявление источников пропущенных данных и эффекта от них. Анализ полных строк (построчное удаление). Метод множественного восстановления пропущенных данных. Попарное удаление.

2. Виды статистических распределений.

(Лекции - 2 часа, лабораторные работы - 2 часа)

Функция распределения и функция плотности распределения вероятностей. Основные параметры одномерного и двумерного распределений. Основные распределения случайных величин. Вероятностный калькулятор в системе STATISTICA. Генератор случайной величины с заданным распределением.

Области применения в металлургической практике.

3. Статистические гипотезы и их проверка.

(Лекции - 2 часа, лабораторные работы - 2 часа)

Принципы проверки статистической гипотезы. Проверки статистических гипотез: о виде распределения, об отсутствии связей между признаками, о равенстве средних, равенстве дисперсий и др. Области применения в металлургической практике.

4. Корреляционно-регрессионный анализ.

(Лекции - 4 часа, лабораторные работы - 3 часа)

Корреляции. Типы корреляций. Проверка статистической значимости корреляций. Регрессии. МНК-регрессии. Подгонка регрессионных моделей. Линейная регрессия. Полиномиальная регрессия. Множественная линейная регрессия. Множественная линейная регрессия с взаимодействиями. Диагностика регрессионных моделей. Способы корректировки регрессионных моделей. Обобщенные линейные модели. Логистическая регрессия. Области применения в металлургической практике.

5. Классификационный анализ.

(Общий объем: лекции - 6 часов, лабораторные работы - 6 часов)

5.1. Факторный анализ.

(Лекции - 2 часа, лабораторные работы - 2 часа)

Метод главных компонент; метод главных факторов; линейная модель факторного анализа; определение числа факторов; статистическая оценка факторных нагрузок; реализация факторного анализа в системе STATISTICA. Области применения в металлургической практике.

5.2. Дискриминантный анализ.

(Лекции - 2 часа, лабораторные работы - 2 часа)

Выявление и описание различий между существующими множествами; классификация новых объектов; построение дискриминантной функции; проверка статистической значимости дискриминантных функций; классификация объектов с помощью функции расстояния; реализация дискриминантного анализа в пакете STATISTICA. Области применения в металлургической практике.

5.3. Кластерный анализ.

(Лекции - 2 часа, лабораторные работы - 2 часа)

Нормализация данных; характеристики близости объектов (виды расстояний); иерархические методы кластерного анализа; определение расстояний между кластерами; итеративные методы кластерного анализа; метод k-средних; реализация кластерного анализа в пакете STATISTICA. Области применения в металлургической практике.

6. Временные ряды

(Лекции - 2 часа, лабораторные работы - 2 часа)

Определения. Основные свойства: стационарность, эргодичность.

Спектральный анализ. Интерпретация результатов спектрального анализа.

Области применения в металлургической практике.

Примечания.

1.  Изучение каждой из тем включает курс лекций, примеры выполнения практических заданий в системах STATISTICA и R, задания на самостоятельное выполнение.

2.  Рассматриваемые примеры применения различных методов взяты из производственной практики НЛМК.

Преподаватели:

Темы 1, 4 – , к. т.н., доцент кафедры прикладной математики.

Тема 2, 3, 6 – , к. ф.-м. н., доцент, доцент кафедры прикладной математики.

Тема 5 – , к. т.н., доцент, заведующий кафедрой прикладной математики.