![]()
Существуют упрощенные правила построения системы нормальных уравнений. Применим их к линейной функции:
а) Перемножим каждый член уравнения (4) на коэффициент при первом параметре (а), то есть на единицу.
б) Перед каждой переменной поставим знак суммирования.
в) Свободный член уравнения умножим на n.
г) Получим первое нормальное уравнение 
д) Перемножим каждый член исходного уравнения на коэффициент при втором параметре (b), то есть на х.
е) Перед каждой переменной ставим знак суммирования.
ж) Получаем второе нормальное уравнение ![]()
По этим правилам составляется система нормальных уравнений для любой линейной функции. Правила впервые были сформулированы английским экономистом Р. Перлом.
Параметры уравнений рассчитываются по следующим формулам:
, (15)
, (16)
Построим, используя исходные данные в таблице 1 , систему нормальных уравнений (14) и решим ее относительно неизвестных а и b:
![]()
965 = 11*a + 4950*b a = -88,895
542200 = 4950*a + 2502500*b b = 0,3925
Уравнение регрессии имеет вид:
ŷ = -88,895 + 0,3925х, (17)
Сравним фактические и расчетные расходы на потребление товара А (таблица 2) и построим график полученной функции ŷ (рисунок 4).
Рисунок 4- Сравнение фактических и расчетных расходов на потребление товара А для линейного уравнения регрессии
Таблица 2 - Сравнение фактических и расчетных значений расходов на потребление товара А при прямолинейной зависимости
№ группы | Расходы на потребление товара А | Отклонение фактических расходов от расчетных (у – ŷ) | ||
фактические (у) | расчетные (ŷ) | абсолютные | относительные (в процентах) | |
1 | 13 | -10 | 23 | 176,92 |
2 | 20 | 9 | 11 | 55 |
3 | 24 | 29 | -5 | -20,83 |
4 | 38 | 48 | -10 | -26,32 |
5 | 45 | 68 | -23 | -51,11 |
6 | 60 | 88 | -28 | -46,67 |
7 | 100 | 107 | -7 | -7 |
8 | 150 | 127 | 23 | 15,333 |
9 | 159 | 147 | 12 | 7,5472 |
10 | 160 | 166 | -6 | -3,75 |
11 | 196 | 186 | 10 | 5,102 |
всего | - | - | 0 | - |
4 РАСЧЕТ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ И ДЕТЕРМИНАЦИИ, ПРОВЕРКА ПРАВИЛЬНОСТИ ВЫБРАННЫХ ФАКТОРОВ И ФОРМЫ СВЯЗИ
Мы выяснили возможность установления корреляционной связи между значениями х и соответствующими значениями у. Теперь необходимо выяснить, как изменение факторного признака влияет на изменение результативного признака.
Если бы между x и y существовала строгая линейная функциональная зависимость, то расчетные значения ŷ были бы в точности равны фактическим у и разность между ними ŷ–y = 0. На самом деле расчетные значения отклоняются от фактических в силу того, что связь между признаками корреляционная.
В качестве меры тесноты взаимосвязи используется коэффициент корреляции:
r =
=
(18)
где σx =
σy =
Вычисление коэффициента корреляции по формуле (5) является трудоемкой операцией. Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:
(19)
Линейный коэффициент корреляции может принимать любые значения в пределах от минус 1 до плюс 1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.
В нашем примере r= 0,967.
Кроме того, можно рассчитать коэффициент детерминации d, который равен квадрату коэффициента корреляции.
В нашем примере d = 0,935.
Это значит, что изменение расходов на товар А можно на 93,5% объяснить изменением дохода.
Остальные 6,5% могут явиться следствием:
а) недостаточно хорошо подобранной формы связи;
б) влияния на зависимую переменную каких-либо других неучтенных факторов.
Рассматриваемая нами зависимость описывалась слегка выпуклой кривой. Целесообразно проверить, не улучшится ли результат, если принять криволинейную форму связи.
Воспользуемся степенной функцией вида: ŷ = axb Логарифмируем: lg ŷ = lga + blgx. Для нахождения параметров а и b всю процедуру МНК проделываем не с величинами у и х, а с их логарифмами. После решения системы нормальных уравнений (4) получаем: lg a = -4,525; b = 2,407.
Уравнение регрессии: lg ŷ = -4,525 + 2,407 lg x. Потенцируем и получаем: ŷ = 2,985 * 10-5 * х2,407
Сравним фактические и расчетные расходы на потребление товара А (таблица 3) и построим график полученной функции ŷ (рисунок 5).
Теснота криволинейной связи измеряется корреляционным отношением, обозначаемым через h и имеющим тот же смысл, что и r.
Теоретическое корреляционное отношение может быть рассчитано по формуле:
h=, (20)
где s2фактор–дисперсия для теоретических значений ŷ (объясненная вариация);
s2общ – дисперсия для фактических значений у (необъясненная вариация).
Теоретическое корреляционное отношение можно представить в виде индекса корреляции R. Преобразование основано на равенстве:
s2общ =s2фактор+s2остаточ, , (21)
где s2остаточ – остаточная дисперсия.
s2фактор=s2общ-s2остаточ. , (22)
R =
=
(23)
В нашем примере h = 0,997, h² = 0,994. Как видим криволинейная форма связи точнее отражает зависимость потребления товара А от дохода. Оставшиеся 0, 6% можно объяснить влиянием других факторов.
Рисунок 5 - Сравнение фактических и расчетных расходов на потребление товара А для степенного уравнения регрессии
Таблица 3 - Сравнение фактических и расчетных значений расходов на потребление товара А при степенной зависимости
№ группы | Расходы на товар А | Отклонение фактических значений от расчетных (у-ŷ) | ||
фактические (у) | расчетные (ŷ) | абсолютные | относительные (в процентах) | |
1 | 13 | 10 | +3 | 23,077 |
2 | 20 | 17 | +3 | 15 |
3 | 24 | 27 | -3 | -12,5 |
4 | 38 | 39 | -1 | -2,632 |
5 | 45 | 55 | -10 | -22,22 |
6 | 60 | 73 | -13 | -21,67 |
7 | 100 | 94 | +6 | 6 |
8 | 150 | 118 | +32 | 21,333 |
9 | 159 | 145 | +14 | 8,805 |
10 | 160 | 176 | -16 | -10 |
11 | 196 | 211 | -15 | -7,653 |
Всего | - | - | 0 | - |
5 СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
При проведении статистических исследований возникает необходимость в формулировке и экспериментальной проверке некоторых предположительных утверждений (гипотез) относительно природы или величины неизвестных параметров анализируемого процесса. Если исходные данные носят случайный характер, то и ответить можно лишь с определенной степенью уверенности, если вероятность ошибки мала, то суждения можно считать практически достоверными.
Статистическая гипотеза - это предположение о случайной величине, проверяемые по выборке (результатам наблюдений). Будем обозначать высказанные предположения (гипотезу) буквой Н. Наша цель - проверить, не противоречит ли высказанная нами гипотеза Н имеющимся выборочным данным. Процедура сопоставления высказанной гипотезы с имеющимися выборочными данными (x1,x2,…,xn ) и количественная оценка степени достоверности полученного вывода называется статистической проверкой гипотез. Осуществляется такая проверка с помощью статистического критерия.
Результат сопоставления может быть отрицательным или неотрицательным. Отрицательный результат означает, что данные противоречат высказанной гипотезе, следовательно, от нее надо отказаться. Неотрицательный - данные наблюдения не противоречат высказанной гипотезе, и ее можно принять в качестве одного из допустимых решений. Однако это не означает, что высказанная нами гипотеза является наилучшей, единственно подходящей. Она лишь не противоречит имеющимся выборочным данным, таким же свойством могут обладать и другие гипотезы.
Существует множество разнообразных статистических критериев, однако, они строятся по общей логической схеме, которую можно описать следующим образом:
а) Выдвигается гипотеза Но, которую будем называть "основной" или "нулевой".
б) Задаются величиной уровня значимости a. Принятие статистического решения всегда сопровождается некоторой вероятностью ошибочного заключения как в одну, так и в другую сторону. В небольшой доле случаев a гипотеза Но может быть отвергнута, в то время как на самом деле она является справедливой. Это так называемая ошибка I рода, ее вероятность равна a. Или, наоборот, в какой-то небольшой доле случаев b мы можем принять нашу гипотезу, в то время как на самом деле она ошибочна, а справедливым оказывается некоторое конкурирующее с ней предположение - альтернативная гипотеза Н1. Это ошибка II рода. При фиксированном объеме выборочных данных величина вероятности одной из этих ошибок выбирается произвольно. Обычно задаются величиной a вероятности ошибочного отторжения проверяемой гипотезы Но. Эту вероятность называют уровнем значимости или размером критерия. Как правило, пользуются некоторыми стандартными значениями уровня значимости (a= 0,1; 0,5; 0,025; 0,01; 0,005; 0,001). Наиболее распространенной a=0,05. Она означает, что в среднем в пяти случаях из ста мы будем ошибочно отвергать гипотезу Но при многократном использовании данного статистического критерия.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 |



