Как сделать ряд распределения

Добавил пользователь Алексей Ф.
Обновлено: 04.10.2024

После определения группировочного признака и границ групп строится ряд распределения.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

Ряды распределения, построенные по качественным (атрибутивным) признакам, называются атрибутивными. Например, распределения населения по полу, занятости, национальной принадлежности и т.д.

Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение населения по возрасту, среднедушевому денежному доходу и т.д.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот.

Числовые значения количественного признака в вариационном ряду распределения называются вариантами (*,).

Частотными показателями любого ряда распределения являются абсолютная численность /-й группы — частота ( и относительная частота — частость dh где = л, a = 1, или 100%.

Кумулятивная (накопленная) частота S, характеризует объем совокупности со значениями вариантов, не превышающих х,. Кумулятивные частотные показатели образуются последовательным суммированием абсолютных или относительных частот, например:


Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (тарифный разряд, число детей в семье), на дискретных признаках, представленных в виде интервалов; интервальные — на непрерывных признаках (имеющих любые значения, в том числе и дробные).

Для построения вариационного ряда все значения признака (варианты) должны быть упорядочены, т.е. расположены в порядке возрастания или убывания. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых приводятся варианты, а в другой — частоты.

Для построения дискретного ряда с небольшим числом вариантов перечисляются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения каждого варианта.

Пример 1. Имеем следующие данные по объему инвестиций в основной капитал предприятий области в 2006 г., млн руб.:

По приведенным данным построим интервальный вариационный ряд распределения с равными интервалами.


Для данного примера, согласно формуле Стерджесса, при N= 26 число групп п = 5. Зная число групп, определим величину интервала по формуле

В результате получим следующий ряд распределения предприятий области по объему инвестиций в основной капитал (графы 1, 2):

Объем инвестиций в основной капитал, млн руб.


= Ю). Модальный объем инвестиций в основной капитал составит:

Медиана (Me) — значение признака (варианта), приходящееся на середину упорядоченной совокупности, т.е. это вариант, который делит ряд распределения на две равные по объему части.

В дискретном ряду распределения медиана, а в интервальном ряду — медианный интервал будут соответствовать первому значению признака (интервалу), накопленная частота которого превысит половинную сумму частот. Конкретное значение медианы для интервального ряда определяется по формуле:


где Хш — нижняя граница медианного интервала;

И — ширина медианного интервала;

SMe , — накопленная частота интервала, предшествующего медианному;

/м* — частота медианного интервала.

По данным примера 1 медианным является интервал 33,6—48,7 (4?fi = 26 : 2 = 13; первая накопленная частота, превышающая половинную сумму частот, равна 18). Медианный объем инвестиций в основной капитал составит:


Рассмотренные обобщающие показатели центра распределения раскрывают характер последовательного изменения частот, поэтому в анализе закономерностей распределения используются также ранговые (порядковые) показатели: квартили и децили.

Квартили (О) — это значения вариантов, которые делят упорядоченный ряд по объему на четыре равновеликие части. Следовательно, в ряду распределения выделяют три квартиля. Медиана является одновременно вторым квартилем. Расчет квартилей основывается на кумулятивных частотах (частостях), первый и третий квартили определяются по формулам:


первый квартиль


третий квартиль


По данным примера 1:

Децили — значения вариантов, которые делят упорядоченный ряд по объему на 10 равных частей. В ряду распределения выделяют девять децилей (медиана — пятый дециль). Расчет децилей также основан на кумулятивных частотах (частостях) и определяется по формулам:



По данным примера 1:

Для измерения и оценки вариации используют абсолютные и относительные характеристики.


По данным примера 1:

Коэффициент вариации свидетельствует о неоднородности распределения:


Следовательно, средняя арифметическая является недостаточно типичной оценкой данного ряда.

Выявление общего характера распределения предполагает оценку не только степени его однородности, но и его симметричности, остро- и плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, тождественны.

В практических расчетах часто в качестве оценки асимметрии используется нормированный коэффициент третьего порядка:


где р-з — центральный момент третьего порядка.

Если As О — правосторонняя. As = 0 свидетельствует о симметричном распределении.


Следовательно, исходный ряд распределения имеет правостороннюю асимметрию.

При оценке крутизны в качестве эталонного выбирается нормальное распределение, которое сравнивается с фактическим, и вычисляется показатель эксцесса распределения (Ek):


где — центральный момент 4-го порядка, определяемый по формуле


При симметричном распределении Ек = 0. Если Ек > 0, распределение является островершинным, а если Ек [1] общей площади на 1 человека)

Читайте также: