Отдельные единицы статистической совокупности объединяются в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению.
Группировкой называется расчленение множества единиц изучаемой совокупности на группы по определенным существенным для них признакам. Группировка является одним из самых сложных в методологическом плане этапов статистического исследования.
Почему проводят группировку? В показателях, исчисленных по достаточно большим группам, произойдет погашение случайного и выявление общего, существенного для развития исследуемого явления.
Группировка, в которой группы образованы по одному признаку, называется простой. Для характеристики явления бывает недостаточно разбить совокупность на группы по какому-либо одному признаку. В этом случае строят сложные группировки.
Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою очередь, подразделяются по третьему и т. д. Таким образом, сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам. В качестве примера можно рассмотреть группировку семей России по месту проживания и числу детей в 1989 г. (табл. 2)
Т а б л и ц а 2
Группировка семей России по месту проживания и числу детей в 1989 г.
(по материалам переписи населения)
№ п/п | Группа семей по месту проживания | В том числе подгруппа семей по числу детей | Число семей, тыс. |
1 | Городское население | 1 ребенок 2 детей 3 » 4 » 5 и более детей | 9605 6936 971 153 76 |
Итого по группе | 17741 | ||
2 | Сельское население | 1 ребенок 2 детей 3 » 4 » 5 и более детей | 2328 2306 757 213 141 |
Итого по подгруппе | 5745 | ||
Итого по подгруппам | 1 ребенок 2 детей 3 » 4 » 5 и более детей | 11933 9242 1728 366 217 | |
Всего | 23486 |
При построении сложной группировки возникает вопрос о последовательности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия.
С увеличением числа группировочных признаков в сложных группи-ровках быстро растет количество групп. Группировка с большим числом групп становится ненаглядной. Поэтому на практике строят сложные группировки не более чем по трем признакам.
Признак, по которому проводится разбивка единиц совокупности на отдельные группы называется группировочным признаком. Его часто называют основанием группировки. От правильного выбора группировочного признака зависят выводы, которые получают в результате статистического исследования.
В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т. д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т. д.).
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.
При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины.
Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.
Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта и цель исследования.
Для определения оптимального числа групп используют формулу Стерджесса:
, (1)
где п – число групп;
N – число единиц совокупности.
Согласно формуле (1), выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
Другой способ определения числа групп основан на применении показателя среднего квадратического отклонения (s).
После определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
, (2)
где h – шаг интервала;
R = Xmax – Xmin, т. е. размах вариации;
Xmax, Xmin – максимальное и минимальное значение признака в совокупности.
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.
Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 у. е., а минимальное его значение – 290 у. е. Совокупность включает 80 единиц. Согласно формуле (2) она должна быть разбита на 7 групп. Сначала следует найти размах вариации:
R = 2040 – 290 = 1750 у. е.
Затем определим величину интервала:
h = 1750 : 7 = 250 у. е.
После этого построим интервалы групп (табл. 3).
Т а б л и ц а 3
Варианты построения групп
№ группы | I вариант | II вариант |
I II III IV V VI VII | От 290 до 540 540 – 790 790 – 1040 1040 – 1290 1290 – 1540 1540 – 1790 1790 – 2040 | До 540 540 – 790 790 – 1040 1040 – 1290 1290 – 1540 1540 – 1790 1790 и более |
Чтобы не писать каждый раз от... до, границы групп обозначают следующим образом: 290 – 540, 540 – 790 и т. д.
Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором варианте первая и последняя группы – это группы с открытыми интервалами.
Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.
Закрытыми называются интервалы, у которых обозначены обе границы.
Ширина открытого интервала принимается равной ширине смежного с ним интервала.
При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i + 1-го интервала. Примером такой группировки является приведенная ранее группировка предприятий по стоимости основных фондов.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |



