Как сделать интервальную таблицу частот

Обновлено: 04.07.2024

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд, то необходимо воспользоваться онлайн-калькулятором Показатели вариации. Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения.

Виды статистических группировок

  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд .
  2. Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд .
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Пример №1 . По данным таблицы 2 постройте ряды распределения по 40 коммерческим банкам РФ. По полученным рядам распределения определите: прибыль в среднем на один коммерческий банк, кредитные вложения в среднем на один коммерческий банк, модальное и медианное значение прибыли; квартили, децили, размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, коэффициент вариации.

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом. Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

Длину частичных интервалов вычисляют как h=(xmax-xmin)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты ni. Малочисленные частоты, значения которых меньше 5 (ni Пример №3 . В результате 5%-ной собственно-случайной выборки получено следующее распределение изделий по содержанию влаги. Рассчитайте: 1) средний процент влажности; 2) показатели, характеризующие вариацию влажности.
Решение получено с помощью калькулятора: Пример №1

Пример. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

  1. На основе структурной группировки построить вариационный частотный и кумулятивный ряды распределения, используя равные закрытые интервалы, приняв число групп равным 6. Результаты представить в виде таблицы и изобразить графически.
  2. Проанализировать вариационный ряд распределения, вычислив:
    • среднее арифметическое значение признака;
    • моду, медиану, 1-ый квартиль, 1-ый и 9-тый дециль;
    • среднее квадратичное отклонение;
    • коэффициент вариации.
  3. Сделать выводы.

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

  1. Построить ранжированный вариационный ряд;
  2. Найти максимальный и минимальный члены ряда;
  3. Найти размах вариации и количество оптимальных промежутков для построения интервального ряда. Найти длину промежутка интервального ряда;
  4. Построить интервальный ряд. Найти частоты попадания элементов выборки в составленные промежутки. Найти средние точки каждого промежутка;
  5. Построить гистограмму и полигон частот. Сравнить с нормальным распределением (аналитически и графически);
  6. Построить график эмпирической функции распределения;
  7. Рассчитать выборочные числовые характеристики: выборочное среднее и центральный выборочный момент;
  8. Рассчитать приближенные значения среднего квадратического отклонения, асимметрии и эксцесса (пользуясь пакетом анализа MS Excel). Сравнить приближенные расчетные значения с точными (рассчитанные по формулам MS Excel);
  9. Сравнить выборочные графические характеристики с соответствующими теоретическими.

Задача. Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Пример . По данным таблицы 2:
1) Постройте ряды распределения по 40 коммерческим банкам РФ:
А) по величине прибыли;
Б) по величине кредитных вложений.
2) По полученным рядам распределения определите:
А) прибыль в среднем на один коммерческий банк;
Б) кредитные вложения в среднем на один коммерческий банк;
В) модальное и медианное значение прибыли; квартили, децили;
Г) модальное и медианное значение кредитных вложений.
3) По полученным в п. 1 рядам распределения рассчитайте:
а) размах вариации;
б) среднее линейное отклонение;
в) среднее квадратическое отклонение;
г) коэффициент вариации.
Необходимые расчеты оформите в табличной форме. Результаты проанализируйте. Сделайте выводы.
Постройте графики полученных рядов распределения. Графически определите моду и медиану.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных.

Описание параметров
Количество строк: количество исходных данных. Если размерность ряда небольшая, укажите его количество. Если выборка достаточно объемная, то нажмите кнопку Вставить из Excel .
Количество групп: 0 – число групп будет определяться по формуле Стэрджесса.
Если задано конкретное число групп, укажите его (например, 5 ).
Вид ряда: Дискретный ряд.
Уровень значимости: например, 0.954 . Этот параметр задается для определения доверительного интервала среднего значения.
Выборка: Например, проведена 10% -ная механическая выборка. Указываем число 10 . Для наших данных указываем 100 .

Тема: Первичная обработка статистических данных в пакете SPSS Statistics 17.0. Одномерный анализ.

Цель: Формирование умений первичной обработки статистических данных. Выработка навыков работы в статистическом пакете SPSS Statistics 17.0.

Введение

Для того чтобы выполнить статистическое исследование, необходима научно-обоснованная информационная база. Она формируется в результате статистического наблюдения, которое является начальной стадией экономико-статистического исследования.

Статистическим наблюдением называется планомерный научно-обоснованный сбор данных или сведений о социально-экономических явлениях и процессах. В процессе обработки, анализа статистические данные становятся информацией. Не все данные, факты, собранные в процессе наблюдения, могут быть использованы для дальнейшего исследования. Они должны отвечать определенным требованиям. Важнейшими требованиями являются достоверность данных, сопоставимость данных или единообразие.

В данной работе проводится описательный (дескриптивный) анализ отдельных переменных. К нему относятся создание частотной таблицы, вычисление статистических характеристик и графическое представление.

Построение частотных таблиц

Полученные статистические данные необходимо ввести в первый столбец редактора данных. Чтобы указать наименование столбца и тип вводимых данных необходимо в редакторе данных (окно SPSS Statistics Data Editor) (рис.2) дважды щелкнуть на ячейке с надписью пер или щелкнуть на вкладке Переменные на нижнем краю таблицы. В обоих случаях вы перейдете в режим просмотра переменных.


Рис.2. Окно SPSS Statistics Data Editor

Чтобы задать имя переменной, введите в текстовом поле Имя выбранное имя переменной. Затем нажмите клавишу , чтобы подтвердить ввод и перейти к установке типа переменной.

Для построения вариационного ряда в меню Данные следует выбрать пункт Сортировать наблюдения. Эта функция упорядочивает значения случайной величины в порядке возрастания или убывания (рис.3).


Первым этапом статистического анализа данных, как правило, является частотный анализ. Для построения частотной таблицы (в виде ряда распределения частот) применительно к вашим данным выберите в меню команды Анализ/Описательные статистики/Частоты.

В появившемся диалоговом окне Частоты (рис.4) выберите опцию Вывести частотные таблицы, кнопкой со стрелочкой перенесите изучаемую переменную в список выходных параметров и подтвердите операцию кнопкой OK.


В окне просмотра результатов Вывод отобразится таблица частот. Перед самой частотной таблицей выводится небольшая таблица с обзором допустимых и отсутствующих значений.

Чтобы вывести частотную таблицу, отсортированную по убыванию частоты, поступите следующим образом:

· выберите в меню команды Анализ/Описательные статистики/Частоты,

· перенесите рассматриваемую переменную в список выходных переменных,

· при активной опции Вывести частотные таблицы щелкните на кнопке Формат.

· Откроется диалоговое окно Частоты: Формат (рис.5).


Рис.5. Диалоговое окно Frequencies:Format

В группе Упорядочить по выберите порядок, в котором будут отображены значения в частотной таблице. Возможны следующие варианты:

· По возрастанию значений. Это настройка по умолчанию.

· По убыванию значений.

· По возрастанию частот.

· По убыванию частот.

Кроме того, флажок Подавлять таблицы, если категорий больше, чем: позволяет избежать вывода длинных частотных таблиц.

· Выберите по Убыванию значений.

· Подтвердите выбор кнопкой Продолжить.

· Щелкните OK, чтобы начать вычисление. В результате частоты в таблице будут расположены в порядке убывания.

Правила построения дискретных и интервальных рядов распределения

Что такое группировка статистических данных, и как она связана с рядами распределения, было рассмотрено в первой части этой лекции, там же можно узнать, о том что такое дискретный и вариационный ряд распределения.

Ряды распределения одна из разновидностей статистических рядов (кроме них в статистике используются ряды динамики), используются для анализа данных о явлениях общественной жизни. Построение вариационных рядов вполне посильная задача для каждого. Однако есть правила, которые необходимо помнить.

Как построить дискретный вариационный ряд распределения

Пример 1. Имеются данные о количестве детей в 20 обследованных семьях. Построить дискретный вариационный ряд распределения семей по числу детей .

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Решение:

  1. Начнем с макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по числу детей – значит наша варианта это число детей.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения семей – значит наша частота это число семей с соответствующим количеством детей.

В итоге макет нашей таблицы будет выглядеть так:

И расставим эти данные в первой колонке нашей таблицы в логическом порядке, в данном случае возрастающем от 0 до 4. Получаем

И в заключение подсчитаем, сколько же раз встречается каждое значение варианты.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

В результате получаем законченную табличку или требуемый ряд распределения семей по количеству детей.

Задание. Имеются данные о тарифных разрядах 30 рабочих предприятия. Построить дискретный вариационный ряд распределения рабочих по тарифному разряду. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Как построить интервальный вариационный ряд распределения

Построим интервальный ряд распределения, и посмотрим чем же его построение отличается от дискретного ряда.

Пример 2. Имеются данные о величине полученной прибыли 16 предприятий, млн. руб. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Построить интервальный вариационный ряд распределения предприятий по объему прибыли, выделив 3 группы с равными интервалами.

Общий принцип построения ряда, конечно же, сохраниться, те же две колонки, те же варианта и частота, но в здесь варианта будет располагаться в интервале и подсчет частот будет вестись иначе.

  1. Начнем аналогично предыдущей задачи с построения макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по объему прибыли – значит, наша варианта это объем полученной прибыли.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения предприятий – значит наша частота это число предприятий с соответствующей прибылью, в данном случае попадающие в интервал.

В итоге макет нашей таблицы будет выглядеть так:

ряды распределения формула

  1. Построим интервалы. Следует сказать, что есть несколько способов построения интервала: визуальный способ без дополнительных расчетов на основе логического анализа данных, расчет по формуле, если по условию требуется построить равные интервалы. Для упрощения расчетов величины интервала чаще всего эта формула имеет следующий вид:

где i – величина или длинна интервала,

Хmax и Xmin – максимальное и минимальное значение признака,

n – требуемое число групп по условию задачи.

Рассчитаем величину интервала для нашего примера. Для этого среди исходных данных найдем самое большое и самое маленькое

ряды распределения формула 2

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – максимальное значение 118 млн. руб., и минимальное 9 млн. руб. Проведем расчет по формуле.

В расчете получили число 36,(3) три в периоде, в таких ситуациях величину интервала нужно округлить до большего, чтобы после подсчетов не потерялось максимальное данное, именно поэтому в расчете величина интервала 36,4 млн. руб.

  1. Теперь построим интервалы – наши варианты в данной задаче. Первый интервал начинают строить от минимального значения к нему добавляется величина интервала и получается верхняя граница первого интервала. Затем верхняя граница первого интервала становится нижней границей второго интервала, к ней добавляется величина интервала и получается второй интервал. И так далее столько раз сколько требуется построить интервалов по условию.

Обратим внимание если бы мы не округлили величину интервала до 36,4, а оставили бы ее 36,3, то последнее значение у нас бы получилось 117,9. Именно для того чтобы не было потери данных необходимо округлять величину интервала до большего значения.

  1. Проведем подсчет количества предприятий попавших в каждый конкретный интервал. При обработке данных необходимо помнить, что верхнее значение интервала в данном интервале не учитывается (не включается в этот интервал), а учитывается в следующем интервале (нижняя граница интервала включается в данный интервал, а верхняя не включается), за исключением последнего интервала.

При проведении обработки данных лучше всего отобранные данные обозначить условными значками или цветом, для упрощения обработки.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Первый интервал обозначим желтым цветом – и определим сколько данных попадает в интервал от 9 до 45,4, при этом данное 45,4 будет учитываться во втором интервале (при условии что оно есть в данных) – в итоге получаем 7 предприятий в первом интервале. И так дальше по всем интервалам.

По первому интервалу — 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 млн. руб.

По второму интервалу — 48 + 57 + 48 + 56 + 63 = 272 млн. руб.

По третьему интервалу — 118 + 87 + 98 + 88 = 391 млн. руб.

Задание. Имеются данные о величине вклада в банке 30 вкладчиков, тыс. руб. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Построить интервальный вариационный ряд распределения вкладчиков, по размеру вклада выделив 4 группы с равными интервалами. По каждой группе подсчитать общий размер вкладов.

Нажмите, чтобы узнать подробности

Привитие ценностей осуществляется посредством работ, запланированных на данном уроке. Умение учиться, анализировать ситуацию, адаптироваться к новым условиям, ставить проблемы и принимать решения, работать в команде, отвечать за качество своей работы, умение организовывать свое время.

Учащиеся через решение различных задач знакомятся с общими методами исследования такими, как наблюдение, опрос и т.д.

Связь с информатикой реализуется при рассмотрении и сравнении некоторых видов диаграмм (столбчатая диаграмма, гистограмма).

Учащиеся умеют представлять данные в виде интервальной таблицы, умеют находить среднее значение данных, представленных в виде интервальной таблицы, могут объяснить различие между дискретной и непрерывной случайными величинами.

Ход урока

Запланированная деятельность на уроке

Ресурсы

Проведите мотивацию для учащихся:

Поднимите руки те, кто знает математику;

Поднимите руки те, кто любит математику;

Поднимите руки те, кто хочет знать математику;

Вызовите к доске 10 учеников, раздайте им цифры от 3-8. Дайте задания для учеников:

1. Проранжируйте вариационный ряд

3. Найдите размах

5. Найдите среднее арифметическое

6. Разделите на интервалы.

Предложите самостоятельную работу в виде работы по цепочке, на проверку усвоения цели обучения. На данном этапе у учащихся развивается такая ценность академическая честность.

После выполнения заданий, учащиеся проводят взаимопроверку правильности выполнения заданий по образцу, выданному учителем.

Дидактическая цель: проверка и коррекция знаний учащихся по изученной теме, развитие познавательной компетентности учащихся.

Работа по цепочке

Задание: Арман получил за четверть следующие оценки:

5,3,4,5,4,3,3,4,4,5,5,4,3,4,5,5,3

1. Проранжируйте вариационный ряд

3. Найдите размах

5. Найдите среднее арифметическое

6. Разделите на интервалы

Проведите устное формативное оценивание.

Раздел долгосрочного плана:

Школа: АСШ№1

ФИО учителя: Жумабай Е.С.

Количество присутствующих:

отсутствующих:

Полигон частот, гистограмма частот

Цели обучения, которые достигаются на данном уроке (ссылка на учебную программу)

8.3.3.1 представлять результаты выборки в виде интервальной таблицы частот;

8.3.3.2 представлять данные интервальной таблицы частот в виде гистограммы;

- по данным интервальной таблицы строят гистограмму, и наоборот, по гистограмме заполняют интервальную таблицу частот;

Критерии оценивания

-вычисляет плотность частоты интервального ряда;

-строит гистограмму по таблице;

- заполняет таблицу по гистограмме.

Языковые цели

комментировать процесс сбора и обработки данных;

комментировать представление выборки в виде интервальной таблицы частот и гистограммы;

-обсуждать и анализировать статистическую информацию, представленную в виде гистограммы.

Предметная лексика и терминология

интервальная таблица частот;

Серия полезных фраз для диалога/письма

представить полученные данные в виде интервальной таблицы частот;

- представить данные интервальной таблицы частот в виде гистограммы частот;.

- Частота является … гистограммы

Привитие ценностей

Привитие ценностей осуществляется посредством работ, запланированных на данном уроке. Умение учиться, анализировать ситуацию, адаптироваться к новым условиям, ставить проблемы и принимать решения, работать в команде, отвечать за качество своей работы, умение организовывать свое время.

Межпредметные связи

Учащиеся через решение различных задач знакомятся с общими методами исследования такими, как наблюдение, опрос и т.д.

Связь с информатикой реализуется при рассмотрении и сравнении некоторых видов диаграмм (столбчатая диаграмма, гистограмма).

Предварительные знания

Учащиеся умеют представлять данные в виде интервальной таблицы, умеют находить среднее значение данных, представленных в виде интервальной таблицы, могут объяснить различие между дискретной и непрерывной случайными величинами.

Запланированные этапы урока

Запланированная деятельность на уроке

Организационный момент. Целеполагание.

Проведите мотивацию для учащихся:

Поднимите руки те, кто знает математику;

Поднимите руки те, кто любит математику;

Поднимите руки те, кто хочет знать математику;

Вызовите к доске 10 учеников, раздайте им цифры от 3-8. Дайте задания для учеников:

1. Проранжируйте вариационный ряд

3. Найдите размах

5. Найдите среднее арифметическое

6. Разделите на интервалы.

Предложите самостоятельную работу в виде работы по цепочке, на проверку усвоения цели обучения. На данном этапе у учащихся развивается такая ценность академическая честность.

После выполнения заданий, учащиеся проводят взаимопроверку правильности выполнения заданий по образцу, выданному учителем.

Дидактическая цель: проверка и коррекция знаний учащихся по изученной теме, развитие познавательной компетентности учащихся.

Работа по цепочке

Задание: Арман получил за четверть следующие оценки:

1. Проранжируйте вариационный ряд

3. Найдите размах

5. Найдите среднее арифметическое

6. Разделите на интервалы

Проведите устное формативное оценивание.

Изучение новой темы.

Задание: Было проведено измерение массы 25 детей от 13-14 лет. Полученные данные занесены в таблицу следующим образом:

- установили, что среди результатов этих измерений минимальная масса – 39 кг, максимальная -57 кг.

-вычислили размах: 57-39=18, разделили его на 3 и получили 6 интервалов:


- количество детей, масса которых попала в тот или иной интервал, записали в таблице:


Используя интервальную таблицу частот можно результаты наблюдения представить в виде гистограммы.

Гистограмма представляет собой ступенчатую фигуру, состоящую из прямоугольников.

Ширину прямоугольников берут одинаковую- соотвествующую интервалам, их высоту –соотвествующую частоте ( в примере – числу детей)

Алгоритм построения гистограммы

1. Отложить значения интервалов на оси ОХ

2. Отложить частоты на оси ОУ

3. Построить прямоугольники, ширина которых соответствует длине интервалов, отложенных на оси ОХ, длина – пропорциональна частоте соответствующего интервала.


Пример 2.В таблице представлена информация о дистанциях, проезжая которые 40 автомобилей затрачивают полный бак бензина.


Задание: В лесопосадке растут 59 берез. Их высоты округлены до ближайшего целого значения в метрах и представлены в следующей таблице:

По этим данным учащийся построил гистограмму. Найдите ошибки в построении гистограммы.


После того, как учащиеся выполнят задание, проводится обсуждение со всем классом, указываются ошибки в построении гистограммы.

1-ошибка: между столбцами не должно быть зазоров;

2-ошибка: не верно определены границы интервалов, верно вот так: [4,5; 9,5), [9,5;12,5), [12,5;15,5), [15,5;18,5), [18,5;28,5), так как высота берез – непрерывная величина. Если интервал 5-9 м взят с округлением, то на самом деле он равен [4,5;9,5).

3-ошибка: Так как эти интервалы различны по длине, то по оси ортинат должны рассматриваться не частоты, а плотности частот.

Цель: Структурированный способ развития идей и мыслей

Как это работает:

Предложите учащимся задания для решения.

-Ученики думают и пишут ответы каждый индивидуально.

-Ученики образуют пары и объединяют свои лучшие вопросы.

-Ученики делятся своими новыми улучшенными ответами с классом.

Цель: проверить уровень усвоения темы. Задания разного уровня сложности. Каждый может выбрать задания своего уровня. За выполнение определенного задания вы получаете определенное количество баллов

Предложите учащимся провести самооценивание и взаимооценивание.

Дифференциация выражена в виде заданий, требующих разного уровня математической подготовленности, а так же с учетом скорости мышления и возрастных особенностей учащихся.


Задание 1. Для магазинов с торговой площадью


Найдите накопленную частоту для каждого значения площади.


2) Сколько магазинов с торговой площадью, не превышающих ?

3) С какой торговой площадью наибольшее количество магазинов?


4) Какую часть от всех магазинов составляют магазины с торговой площадью ?


Задание 2. 1) Для школьных спортивных площадок площадью


Найдите накопленную частоту для каждого значения площади.


2) Сколько школьных площадок площадью, не превышающих ?

3) С какой площадью наибольшее число спортивных площадок?


4) Какую часть от всех школьных спортивных площадок составляют площадки с площадью ?

1.Составьте вариационный ряд для данных о потреблении электроэнергии (в киловаттах) в семье за 12 месяцев: 102; 108; 99;108; 109; 99; 102; 105; 108; 102; 108; 102.

Разбейте полученный вариационный ряд на интервалы, составьте интервальную таблицу частот и постройте гистограмму.

Учащиеся из одного уровня обмениваются решениями и проводят самооценивание и взаимооценивание.

Читайте также: