Как сделать интервальное распределение в excel

Обновлено: 08.07.2024

Программа Эксель используется для выполнения различных статистических задач, одной из которых является вычисление доверительного интервала, который применяется как наиболее подходящая замена точечной оценки при малом объеме выборки.

Хотим сразу заметить, что сама процедура вычисления доверительного интервала довольно непростая, однако, в Excel существует ряд инструментов, призванных облегчить выполнение данной задачи. Давайте рассмотрим их.

Вычисление доверительного интервала

Доверительный интервал нужен для того, чтобы дать интервальную оценку каким-либо статическим данным. Основная цель этой операции – убрать неопределенности точечной оценки.

В Microsoft Excel существует два метода выполнения данной задачи:

  • Оператор ДОВЕРИТ.НОРМ – применяется в случаях, когда дисперсия известна;
  • Оператор ДОВЕРИТ.СТЬЮДЕНТ– когда дисперсия неизвестна.

Ниже мы пошагово разберем оба метода на практике.

Метод 1: оператора ДОВЕРИТ.НОРМ

Данная функция впервые была внедрена в арсенал программы в редакции Эксель 2010 года (до этой версии ее заменял оператор “ДОВЕРИТ”). Оператор входит в категорию “статистические”.

Формула функции ДОВЕРИТ.НОРМ выглядит так:

Как мы видим, у функции есть три аргумента:

  • “Альфа” – это показатель уровня значимости, который берется за основу при расчете. Доверительный уровень считается так:
    • 1-"Альфа" . Это выражение применимо в случае, если значение “Альфа” представлено в виде коэффициента. Например, 1-0,7=0,3, где 0,7=70%/100%.
    • (100-"Альфа")/100 . Применятся это выражение, если мы считаем доверительным уровень со значением “Альфа” в процентах. Например, (100-70)/100=0,3.

    Примечание: У данной функции наличие всех трех аргументов является обязательным условием.

    Оператор “ДОВЕРИТ”, который применялся в более ранних редакциях программы, содержит такие же аргументы и выполняет те же самые функции.

    Формула функции ДОВЕРИТ выглядит следующим образом:

    Отличий в самой формуле нет никаких, лишь название оператора иное. В редакциях приложения Эксель 2010 года и последующих этот оператор находится в категории “Совместимость”. В более же старых версиях программы он находится в разделе статических функций.

    Граница доверительного интервала определяется следующей формулой:

    где Х – это среднее значение по заданному диапазону.

    Теперь давайте разберемся, как применять эти формулы на практике. Итак, у нас есть таблица с различными данными 10-ти проведенных замеров. При этом, стандартное отклонение совокупности данных равняется 8.

    Таблица с данными

    Перед нами стоит задача – получить значение доверительного интервала с 95%-ым уровнем доверия.

    Аргументы функции ДОВЕРИТ.НОРМ

    • в поле “Альфа” указываем уровень значимости. В нашей задаче предполагается 95%-ый уровень доверия. Подставив данное значение в формулу расчета, которую мы рассматривали выше, получаем выражение: (100-95)/100 . Пишем его в поле аргумента (или можно сразу написать результат вычисления, равный 0,05).
    • в поле “Станд_откл” согласно нашим условия, пишем цифру 8.
    • в поле “Размер” указываем количество исследуемых элементов. В нашем случае было проведено 10 замеров, значит пишем цифру 10.

    Примечание: В пунктах выше мы постарались максимально подробно расписать все шаги и каждую применяемую функцию. Однако все прописанные формулы можно записать вместе, в составе одной большой:

    • Для определения правой границы ДИ общая формула будет выглядеть так:
      =СРЗНАЧ(B2:B11)+ДОВЕРИТ.НОРМ(0,05;8;СЧЁТ(B2:B11)) .
    • Точно также и для левой границы, только вместо плюса нужно поставить минус:
      =СРЗНАЧ(B2:B11)-ДОВЕРИТ.НОРМ(0,05;8;СЧЁТ(B2:B11)) .

    Метод 2: оператор ДОВЕРИТ.СТЬЮДЕНТ

    Теперь давайте познакомимся со вторым оператором для определения доверительного интервала – ДОВЕРИТ.СТЬЮДЕНТ. Данная функция была внедрена в программу относительно недавно, начиная с версии Эксель 2010, и направлена на определение ДИ выбранной совокупности данных с применением распределения Стьюдента, при неизвестной дисперсии.

    Формула функции ДОВЕРИТ.СТЬЮДЕНТ выглядит следующим образом:

    Давайте разберем применение данного оператора на примере все той же таблицы. Только теперь стандартное отклонение по условиям задачи нам неизвестно.

    1. Сначала выбираем ячейку, куда планируем вывести результат. Затем кликаем по значку “Вставить функцию” (слева от строки формул).
    2. Откроется уже хорошо знакомое окно Мастера функций. Выбираем категорию “Статистические”, затем из предложенного списка функций щелкаем по оператору “ДОВЕРИТ.СТЬЮДЕНТ”, после чего – OK.
    3. В следующем окне нам нужно настроить аргументы функции:.
      • В поле “Альфа” как и в первом методе указываем значение 0,05 (или “100-95)/100”).
      • Переходим к аргументу “Станд_откл”. Т.к. по условиям задачи его значение нам неизвестно, нужно произвести соответствующие расчеты, в чем нам поможет оператор “СТАНДОТКЛОН.В”. Щелкаем по кнопке добавления функции и затем – по пункту “Другие функции…”.
      • В очередном окне Мастера функций выбираем оператор “СТАНДОТКЛОН.В” в категории “Статистические” и кликаем OK.
      • Мы попадаем в окно настройки аргументов функции, формула которой выглядит так: =СТАНДОТКЛОН.В(число1;число2;. ) . В качестве первого аргумента указываем диапазон, включающий все ячейки столбца “Значение” (не считая шапки).
      • Теперь нужно вернуться обратно в окно с аргументами функции “ДОВЕРИТ.СТЬЮДЕНТ”. Для этого щелкаем по одноименной надписи в поле ввода формул.
      • Теперь переходим к последнему аргументу “Размер”. Как и в первом методе, здесь можно либо просто указать диапазон ячеек, либо вставить оператор “СЧЕТ”. Выбираем последний вариант.
      • Как только все аргументы заполнены, жмем кнопку OK.
    4. В выбранной ячейке отобразится значение доверительного интервала согласно заданным нами параметрам.
    5. Далее нам нужно рассчитать значения границ ДИ. А для этого потребуется получить среднее значение по выбранному диапазону. Для этого снова применим функцию “СРЗНАЧ”. Алгоритм действий аналогичен тому, что был описан в первом методе.
    6. Получив значение “СРЗНАЧ”, можно приступать к расчетам границ ДИ. Сами формулы ничем не отличаются от тех, что использовались с оператором “ДОВЕРИТ.НОРМ”:
      • Правая граница ДИ=СРЗНАЧ+ДОВЕРИТ.СТЬЮДЕНТ
      • Левая граница ДИ=СРЗНАЧ-ДОВЕРИТ.СТЬЮДЕНТ

    Заключение

    Арсенал инструментов Excel невероятно большой, и наряду с распространенными функциями, программа предлагает большое разнообразие специальных функций, которые помогут существенно облегчить работу с данными. Возможно, описанные выше шаги некоторым пользователям, на первый взгляд, могут показаться сложными. Но после детального изучения вопроса и последовательности действий, все станет намного проще.

    На практике часто бывают ситуации, когда полное исследование каждого объекта из интересующей совокупности по различным причинам невозможно. В этих случаях из всей совокупности объектов случайным образом отбирают ограниченное число объектов и подвергают их исследованию. Вся совокупность объектов, из которых производится выборка называется генеральной совокупностью. Совокупность случайно отобранных из генеральной совокупности объектов называется выборочной совокупностью. Число объектов в совокупности называется ее объемом. На практике сведения о законе распределения случайной величины получают независимыми многократными повторениями опыта. На основе полученной информации из полученной выборки можно вычислить приблизительные значения для функции распределения и другие характеристики случайной величины. Выборочной или эмпирической функцией распределения случайной величины называют функцию равную частоте появления событий F (x)= nx/n.
    Для построения выборочной функции распределения весь диапазон изменения случайной величины Х разбивают на ряд интервалов одинаковой ширины (от 5 до 15) и затем вычисляют количество значений случайной величины Х, попав-ших в каждый интервал.

    Построение выборочной функции распределения

    В табличном процессоре для построения выборочной функции распределения используется специальная функция ЧАСТОТА и инструмент пакета анализа Гистограмма . Функция ЧАСТОТА вычисляет частоты появления случайных величин в интервалах значений и выводит их как массив чисел. Функция имеет параметры:
    ЧАСТОТА ( массив_данных; массив_интервалов ),
    где:
    - массив_данных – массив или ссылка на диапазон данных, для которых вычисляются частоты;
    - массив_интервалов – массив или ссылка на множество интервалов, в которые группируются значения аргумента массив_данных . Количество элементов в возвращаемом массиве на единицу больше, чем в задано в параметре массив_интервалов. Дополнительный элемент содержит количество значений больших, чем максимальное значение в интервалах.
    Инструмент Гистограмма служит для вычисления выборочных и интегральных частот попадания данных в указанные интервалы значений. Выходным результатом является таблица и гистограмма. Чтобы включить инструмент Гистограмма следует на ленте Данные в группе Анализ выбрать Анализ данных (Data Analysis) .
    В раскрывшемся диалоговом окне Анализ данных из списка следует выбрать Гистограмма (Histogram) (рис. 1) – откроется диалоговое окно Гистограмма . Вид диалогового окна Гистограмма приведен на рис. 2.

    Решение с применением функции ЧАСТОТА
    1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см рис. 3).

    2. В ячейке B2 запишем текст “ Шкала баллов ”, а в ячейки диапазона B3:B6 – баллы, соответствующие шкале для вывода пятибалльной оценки – 50, 70, 85, 100. Это означает, что баллы диапазона 1 – 50 эквивалентны оценке “неудовлетворительно”, баллы, находящиеся в диапазоне 51 – 70 – оценке “удовлетворительно” и т.д.
    3. В ячейки C2, D2 и E2 введем тексты “ Абсолютные частоты ”, “ Относительные частоты ” и “ Накопленные частоты ” соответственно. Абсолютные частоты – это частота попадания случайной величины из выборки в соответствующий интервал. Относительная частота представляет собой частное от деления значения относительной частоты на количество элементов выборки. Накопленные частоты – это сумма относительных частот.
    4. Выделим диапазон C3:C7 и на ленте Формулы выберем Вставить функцию . В открывшемся окне диалога Мастер функций выберите категорию Статистические , а в списке функций – функцию ЧАСТОТА (рис. 4).

    Раскроется диалоговое окно функции ЧАСТОТА .
    5. Установим параметры функции:
    - массив_данных – установим ссылку на диапазон, содержащий выборку случайных величин (A3:A16);
    - массив_интервалов – установим ссылку на диапазон, содержащий шкалу для вывода оценки (B3:B6).
    6. Так как функция ЧАСТОТА возвращает результат в виде массива, нажмем комбинацию клавиш Ctrl + Shift + Enter. В ячейки диапазона C3:C7 будет выведен результат – абсолютные частоты попадания случайных величин в интервалы, заданные в ячейках диапазона B3:B6 (рис. 3).
    Таким образом, в результате проведенного исследования получены статистические оценки частот по случайной выборке: неудовлетворительно – 2, удовлетворительно – 4, хорошо – 5, отлично – 3.

    Решение с применением инструмента Гистограмма
    1. В ячейку A2 рабочего листа введем текст “Наблюдения”, а в диапазон A3:A16 – числа из заданной выборки (см. рис. 5).

    Как построить гистограмму в Excel по данным таблицы

    Порой, информация, размещенная в таблице тяжело поддается анализу. Данные становятся более наглядными, если их представить в виде графика или гистограммы. В статье ниже мы разберем как построить гистограмму в Excel по данным таблицы.


    Как построить гистограмму в Excel

    • выделите область с данными таблицы, которые вы хотите отразить на гистограмме. Важно выделить все заголовки в столбцах и строках;


    • перейдите во вкладку “Вставка” на Панели инструментов, затем щелкните по пункту меню “Гистограмма”;



    • на листе с данными таблицы появится гистограмма:


    Стиль и внешний вид гистограммы

    После того, как вы создали гистограмму, вам может потребоваться внести корректировки в то, как выглядит ваш график. Для изменения дизайна и стиля используйте вкладку “Конструктор”. Эта вкладка отображается на Панели инструментов, когда вы выделяете левой клавишей мыши гистограмму. С помощью дополнительных настроек в разделе “Конструктор” вы сможете:

    • добавить заголовок и другие дополнительные данные для отображения. Для того, чтобы добавить данные на график, кликните на пункт “Добавить элемент диаграммы”, затем, выберите нужный пункт из выпадающего списка:


    • для редактирования элемента гистограммы, например заголовка – дважды кликните на него и внесите корректировки;


    • если вы не хотите добавлять элементы по отдельности, то можно воспользоваться пунктом меню “Экспресс-макет” и выбрать подготовленные системой наиболее популярные наборы элементов гистограммы;


    • в Excel также доступные несколько подготовленных стилей гистограммы, выбрать которые вы можете в разделе “Стили диаграмм” на вкладке “Конструктор”;


    Вы также можете использовать кнопки быстрого доступа к редактированию элементов гистограммы, стиля и фильтров:


    Как сменить строки и столбцы в гистограмме

    Вам также может понадобиться изменить способ группировки ваших данных. Например, в приведенной ниже таблице данные о продажах книг сгруппированы по годам со столбцами для каждого жанра. Однако мы могли бы поменять строки и столбцы местами, чтобы гистограмма группировала данные по жанру, со столбцами для каждого года. В обоих случаях гистограмма содержит одни и те же данные – она просто организована по-разному.


    Для того чтобы сменить порядок строк и столбцов в гистограмме проделайте следующие шаги:

    • Выберите гистограмму, которую вы хотите отредактировать;
    • На вкладке “Конструктор” выберите пункт “Строка/Столбец”;


    • Строки и столбцы в графике будут сменены. В нашем примере данные сгруппированы по жанрам, а столбцы по годам.


    Как переместить гистограмму в Excel

    Когда вы создаете гистограмму, она по умолчанию будет отображаться на одном листе с данными, на основе которых она была построена. Есть возможность полученную гистограмму переместить на другой лист. Для этого проделайте следующие шаги:

    • Выделите гистограмму, которую вы хотите переместить;
    • Нажмите на пункт “Дизайн” на Панели инструментов, затем выберите пункт “Переместить диаграмму”;


    • В диалоговом окне выберите куда вы, хотите переместить гистограмму и нажмите ОК.


    • После этого, гистограмма будет перенесена в новое место назначения. В нашем примере, это новый лист.

    Гистограмма распределения в EXCEL

    Гистограмма распределения – это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

    Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL , в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

    Гистограмма поможет визуально оценить распределение набора данных, если:

    • в наборе данных как минимум 50 значений;
    • ширина интервалов одинакова.

    Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины . Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57 .

    Примечание : Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

    Построение гистограммы с помощью надстройки Пакет анализа


    Вызвав диалоговое окно надстройки Пакет анализа , выберите пункт Гистограмма и нажмите ОК.

    В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала . После нажатия кнопки ОК будут:

    • автоматически рассчитаны интервалы значений (карманы);
    • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
    • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

    Перед тем как анализировать полученный результат – отсортируйте исходный массив данных .

    Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

    Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще ) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно – максимальное значение в массиве (837).

    Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

    Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

    Примечание : Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу =ЦЕЛОЕ(КОРЕНЬ(СЧЕТ( Исходные_данные )))+1

    Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .


    Если установить галочку напротив поля Парето (отсортированная гистограмма) , то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.


    Если установить галочку напротив поля Интегральный процент , то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.


    Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).


    Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.


    В результате получим практически такую же по форме гистограмму , что и раньше, но с более красивыми границами интервалов.

    Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы . Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа .

    Построение гистограммы распределения без использования надстройки Пакет анализа

    Порядок действий при построении гистограммы в этом случае следующий:

    • определить количество интервалов у гистограммы;
    • определить ширину интервала (с учетом округления);
    • определить границу первого интервала;
    • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
    • построить гистограмму.

    СОВЕТ : Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики , может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

    В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

    Примечание : Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество – 13.

    Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() – Подсчет ЧИСЛОвых значений в MS EXCEL .

    В MS EXCEL имеется диаграмма типа Гистограмма с группировкой , которая обычно используется для построения Гистограмм распределения .


    В итоге можно добиться вот такого результата.

    Примечание : О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL .


    Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

    На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

    СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL .

    Примечание : Альтернативой графику накопленной частоты может служить Кривая процентилей , которая рассмотрена в статье про Процентили .

    Примечание : Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами ).

    Функция ЧАСТОТА используется для определения количества вхождения определенных величин в заданный интервал и возвращает данные в виде массива значений. Используя функцию ЧАСТОТА, мы узнаем, как посчитать частоту в Excel.

    Пример использования функции ЧАСТОТА в Excel

    Пример 1. Студенты одной из групп в университете сдали экзамен по физике. При оценке качества сдачи экзамена используется 100-бальная система. Для определения окончательной оценки по 5-бальной системе используют следующие критерии:

    1. От 0 до 50 баллов – экзамен не сдан.
    2. От 51 до 65 баллов – оценка 3.
    3. От 66 до 85 баллов – оценка 4.
    4. Свыше 86 баллов – оценка 5.

    Для статистики необходимо определить, сколько студентов получили 5, 4, 3 баллов и количество тех, кому не удалось сдать экзамен.

    Внесем данные в таблицу:

    Внесем данные.

    Для решения выделим области из 4 ячеек и введем следующую функцию:

    Распределение студентов.

    • B3:B20 – массив данных об оценках студентов;
    • D3:D5 – массив критериев нахождения частоты вхождений в массиве данных об оценках.

    Выделяем диапазон F3:F6 жмем сначала клавишу F2, а потом комбинацию клавиш Ctrl+Shift+Enter, чтобы функция ЧАСТОТА была выполнена в массиве. Подтверждением того что все сделано правильно будут служить фигурные скобки <> в строке формул по краям. Это значит, что формула выполняется в массиве. В результате получим:

    .

    То есть, 6 студентов не сдали экзамен, оценки 3, 4 и 5 получили 3, 4 и 5 студентов соответственно.

    Пример определения вероятности используя функцию ЧАСТОТА в Excel

    Заполним исходную таблицу случайными значениями от 1-го до 2-ух:

    СЛУЧМЕЖДУ.

    Для определения случайных значений в исходной таблице была использована специальная функция:

    Для определения количества сгенерированных 1 и 2 используем функцию:

    • A2:A21 – массив сгенерированных функцией =СЛУЧМЕЖДУ(1;2) значений;
    • 1 – критерий поиска (функция ЧАСТОТА ищет значения от 0 до 1 включительно и значения >1).

    В результате получим:

    В результате Значение.

    Вычислим вероятности, разделив количество событий каждого типа на общее их число:

    Фактическая вероятность.

    Для подсчета количества событий используем функцию =СЧЁТ($A$2:$A$21). Или можно просто разделить на значение 20. Если заранее не известно количество событий и размер диапазона со случайными значениями, тогда можно использовать в аргументах функции СЧЁТ ссылку на целый столбец: =СЧЁТ(A:A). Таким образом будет автоматически подсчитывается количество чисел в столбце A.

    Теперь воспользуемся более сложной формулой для вычисления максимальной частоты повторов:

    Повторов подряд.

    1)*СТРОКА($A$2:$A$21)))-1' >

    Как посчитать неповторяющиеся значения в Excel?

    Пример 3. Определить количество уникальных вхождений в массив числовых данных, то есть не повторяющихся значений.

    Исходная таблица.

    Определим искомую величину с помощью формулы:

    В данном случае функция ЧАСТОТА выполняет проверку наличия каждого из элементов массива данных в этом же массиве данных (оба аргумента совпадают). С помощью функции ЕСЛИ задано условие, которое имеет следующий смысл:

    1. Если искомый элемент содержится в диапазоне значений, вместо фактического количества вхождений будет возвращено 1;
    2. Если искомого элемента нет – будет возвращен 0 (нуль).

    Полученное значение (количество единиц) суммируется.

    В результате получим:

    Уникальные вхождения.

    То есть, в указанном массиве содержится 8 уникальных значений.

    Функция ЧАСТОТА в Excel и особенности ее синтаксиса

    Данная функция имеет следующую синтаксическую запись:

    Описание аргументов функции (оба являются обязательными для заполнения):

    • массив_данных – данные в форме массива либо ссылка на диапазон значений, для которых необходимо определить частоты.
    • массив_интервалов - данные в формате массива либо ссылка не множество значений, в которые группируются значения первого аргумента данной функции.
    1. Если в качестве аргумента массив_интервалов был передан пустой массив или ссылка на диапазон пустых значений, результатом выполнения функции ЧАСТОТА будет являться число элементов, входящих диапазон данных, которые были переданы в качестве первого аргумента.
    2. При использовании функции ЧАСТОТА в качестве обычной функции Excel будет возвращено единственное значение, соответствующее первому вхождению в массив_интервалов (то есть, первому критерию поиска частоты вхождения).
    3. Массив возвращаемых данной функцией элементов содержит на один элемент больше, чем количество элементов, содержащихся в массив_интервалов. Это происходит потому, что функция ЧАСТОТА вычисляет также количество вхождений величин, значения которых превышают верхнюю границу интервалов. Например, в наборе данных 2,7, 10, 13, 18, 4, 33, 26 необходимо найти количество вхождений величин из диапазонов от 1 до 10, от 11 до 20, от 21 до 30 и более 30. Массив интервалов должен содержать только их граничные значения, то есть 10, 20 и 30. Функция может быть записана в следующем виде: =ЧАСТОТА(;), а результатом ее выполнения будет столбец из четырех ячеек, которые содержат следующие значения: 4,2, 1, 1. Последнее значение соответствует количеству вхождений чисел > 30 в массив_данных. Такое число действительно является единственным – это 33.
    4. Если в состав массив_данных входят ячейки, содержащие пустые значения или текст, они будут пропущены функцией ЧАСТОТА в процессе вычислений.

      Функция может использоваться для выполнения статистического анализа, например, с целью определения наиболее востребованных для покупателей наименований продукции.

    Читайте также: