Отдельные единицы статистической совокупности объединяют­ся в группы при помощи метода группировки. Это позволяет «сжать» информацию, полученную в ходе наблюдения, и на этой основе выявить закономерности, присущие изучаемому явлению.

Группировкой называется расчленение множества единиц изу­чаемой совокупности на группы по определенным существенным для них признакам. Группировка является одним из самых слож­ных в методологическом плане этапов статистического исследо­вания.

Почему проводят группировку? В показателях, исчисленных по достаточно большим группам, произойдет погашение случайного и выявление общего, существенного для развития исследуемого явления.

Группировка, в которой группы образованы по одному призна­ку, называется простой. Для характеристики явления бывает не­достаточно разбить совокупность на группы по какому-либо одно­му признаку. В этом случае строят сложные группировки.

Сложной называется группировка, в которой разделение сово­купности на группы производится по двум и более признакам, взя­тым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем они делятся на подгруппы по другому признаку, которые, в свою оче­редь, подразделяются по третьему и т. д. Таким образом, сложные группировки дают возможность изучать распределение единиц со­вокупности одновременно по нескольким признакам. В качестве примера можно рассмотреть группировку семей России по месту проживания и числу детей в 1989 г. (табл. 2)

Т а б л и ц а 2

Группировка семей России по месту проживания и числу детей в 1989 г.

(по материалам переписи населения)

№ п/п

Группа семей по месту проживания

В том числе подгруппа семей по числу детей

Число се­мей, тыс.

1

Городское население

1 ребенок

2 детей

3 »

4 »

5 и более детей

9605

6936

971

153

76

Итого по группе

17741

2

Сельское население

1 ребенок

2 детей

3 »

4 »

5 и более детей

2328

2306

757

213

141

Итого по подгруппе

5745

Итого по подгруппам

1 ребенок

2 детей

3 »

4 »

5 и более детей

11933

9242

1728

366

217

Всего

23486

При построении сложной группировки возникает вопрос о пос­ледовательности разбиения единиц объекта по признакам. Как пра­вило, рекомендуется сначала производить группировку по атрибу­тивным признакам, значения которых имеют ярко выраженные ка­чественные различия.

С увеличением числа группировочных признаков в сложных группи-ровках быстро растет количество групп. Группировка с боль­шим числом групп становится ненаглядной. Поэтому на практике строят сложные группировки не более чем по трем признакам.

Признак, по которо­му проводится разбивка единиц совокупности на отдельные груп­пы называется группировочным признаком. Его часто называют основанием группировки. От правильного выбора группировочного признака зависят выводы, которые полу­чают в результате статистического исследования.

В основание группировки могут быть положены как количествен­ные, так и качественные признаки. Первые имеют числовое вы­ражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т. д.), а вторые отражают состояние еди­ницы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т. д.).

После определения основания группировки следует решить воп­рос о количестве групп, на которые надо разбить исследуемую со­вокупность.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупнос­ти, степени вариации признака.

Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов стра­ны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное насе­ление и население старше трудоспособного возраста. Если же ана­лизируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.

При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, со­стояний у этого признака. Например, в случае проведения группи­ровки населения по полу можно образовать только две группы: мужчины и женщины.

Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуе­мого объекта и степень колеблемости группировочного признака.

При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. По­этому показатели, рассчитанные для таких групп, не будут пред­ставительными и не позволят получить адекватную характеристи­ку исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономер­ностей при исследовании социально-экономических явлений и про­цессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но еще учитывать и особенности объекта и цель иссле­дования.

Для определения оптимального числа групп используют формулу Стерджесса:

, (1)

где п – число групп;

N – число единиц совокупности.

Согласно формуле (1), выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого чис­ла единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Другой способ определения числа групп основан на примене­нии показателя среднего квадратического отклонения (s).

После определения числа групп следует определить интерва­лы группировки.

Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней гра­ницей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение призна­ка в нем. Величина интервала (ее еще часто называют интер­вальной разностью) представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрас­тающие, прогрессивно убывающие, произвольные и специализи­рованные.

Если вариация признака проявляется в сравнительно узких гра­ницах и распределение носит более или менее равномерный ха­рактер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей фор­муле:

, (2)

где h – шаг интервала;

R = Xmax – Xmin, т. е. размах вариации;

Xmax, Xmin – максимальное и минимальное значение признака в совокупности.

Прежде чем определять размах вариации, из совокупности ре­комендуется исключить аномальные наблюдения.

Если максимальные или минимальные значения сильно отли­чаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения вели­чины интервала следует использовать не максимальное и мини­мальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.

Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фон­дов, при этом максимальное значение признака равно 2040 у. е., а минимальное его значение – 290 у. е. Совокупность включает 80 единиц. Согласно формуле (2) она должна быть раз­бита на 7 групп. Сначала следует найти размах вариации:

R = 2040 – 290 = 1750 у. е.

Затем определим величину интервала:

h = 1750 : 7 = 250 у. е.

После этого построим интервалы групп (табл. 3).

Т а б л и ц а 3

Варианты построения групп

№ группы

I вариант

II вариант

I

II

III

IV

V

VI

VII

От 290 до 540

540 – 790

790 – 1040

1040 – 1290

1290 – 1540

1540 – 1790

1790 – 2040

До 540

540 – 790

790 – 1040

1040 – 1290

1290 – 1540

1540 – 1790

1790 и более

Чтобы не писать каждый раз от... до, границы групп обознача­ют следующим образом: 290 – 540, 540 – 790 и т. д.

Особенностью первого варианта построения групп является то, что у всех групп имеются закрытые интервалы. Во втором вари­анте первая и последняя группы – это группы с открытыми интер­валами.

Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего.

Закрытыми называются интервалы, у которых обозначены обе границы.

Ширина открытого интервала принимается равной ширине смежного с ним интервала.

При группировке по количественному признаку границы интер­валов могут быть обозначены по-разному. Если основанием груп­пировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смеж­ных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i + 1-го интервала. Примером такой группировки является приведенная ранее группировка предприятий по стоимости основных фондов.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15