Чем больше размах вариации признака

Вариация, размах, межквартильный размах, среднее линейное отклонение

В этой статье мы приступим к изучению показателей вариации: размах вариации, межквартильный размах, среднее линейное отклонение.

В математической статистике вариация занимает одно из центральных мест. Что же такое вариация? Это изменчивость. Вариация показателя – изменчивость показателя.

Показатели вариации дают очень важную характеристику процессам и явлениям. Они отражают устойчивость процессов и однородность явлений. Чем меньше показатель вариации, тем более процесс устойчивый, а значит, и более предсказуемый.

Показатели вариации отражают не отдельно взятые значения, а дают характеристику некоторому явлению или процессу в целом. Имея в наличии показатели среднего значения и вариации, можно получить первичное представление о характере данных. Средняя – это обобщающий уровень, а вариация характеризует, насколько среднее значение (или другой показатель) хорошо обобщает значения некоторой совокупности данных. Если показатель вариации незначительный, то значения совокупности находятся близко к среднему, следовательно, среднее значение хорошо обобщает совокупность. Если вариация большая, то среднее значение плохо обобщает данные (значения разбросаны далеко друг от друга), и получается «средняя температура по больнице».

Размах вариации

Размах вариации – разница между максимальным и минимальным значением:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Ниже приведена графическая интерпретация размаха вариации.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Видно максимальное и минимальное значение, а также расстояние между ними, которое и соответствует размаху вариации.

С одной стороны, показатель размаха может быть вполне информативным и полезным. К примеру, максимальная и минимальная стоимость квартиры в городе N, максимальная и минимальная зарплата по профессии в регионе и проч. С другой стороны, размах может быть очень широким и не иметь практического смысла, т.к. зависит лишь от двух наблюдений. Таким образом, размах вариации очень неустойчивая величина.

Межквартильный размах

В статистике для анализа выборки часто прибегают к другому показателю вариации – межквартильному размаху. Квартиль – это то значение, которые делит ранжированные (отсортированные) данные на части, кратные одной четверти, или 25%. Так, 1-й квартиль – это значение, ниже которого находится 25% совокупности. 2-й квартиль делит совокупность данных пополам (то бишь медиана), ну и 3-й квартиль отделяет 25% наибольших значений. Так вот межквартильный размах – это разница между 3-м и 1-м квартилями. У данного показателя есть одно неоспоримое преимущество: он является робастным, т.е. не зависит от аномальных отклонений.

Наглядное отображение размаха вариации и межкварительного расстояния производят с помощью диаграммы «ящик с усами».

Среднее линейное отклонение

Есть показатели вариации, которые учитывают сразу все значения, а не только отдельные наблюдения (типа максимума или минимума). Одним из таких является среднее линейное отклонение. Этот показатель характеризует меру разброса значений вокруг их среднего. В чем суть? Для того, чтобы показать меру разброса данных, нужно вначале определиться, относительно чего этот самый разброс будет считаться. Обычно это среднее арифметическое. Далее нужно посчитать, насколько каждое значение отклоняется от средней. Нас интересует среднее из таких отклонений. Однако напрямую складывать положительные и отрицательные отклонения нельзя, т.к. они взаимоуничтожатся и их сумма будет равна нулю. Поэтому все отклонения берутся по модулю. Средне линейное отклонение рассчитывается по формуле:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

a – среднее линейное отклонение,

X – анализируемый показатель,

– среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

Рассчитанное по этой формуле значение показывает среднее абсолютное отклонение от средней арифметической. Наглядная картинка в помощь.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Отклонения каждого наблюдения от среднего указаны маленькими стрелочками. Именно они берутся по модулю и суммируются. Потом все делится на количество значений.

Для полноты картины нужно привести еще и пример. Допустим, имеется фирма по производству черенков для лопат. Каждый черенок должен быть 1,5 метра длиной, но, что еще важней, все должны быть одинаковыми или, по крайней мере, плюс-минус 5 см. Однако нерадивые работники то 1,2 м отпилят, то 1,8 м. Дачники недовольны. Решил директор провести статистический анализ длины черенков. Отобрал 10 штук и замерил их длину, нашел среднюю и рассчитал среднее линейное отклонение. Средняя получилась как раз, что надо – 1,5 м. А вот среднее линейное отклонение вышло 0,16 м. Вот и получается, что каждый черенок длиннее или короче, чем нужно, в среднем на 16 см. Есть, о чем поговорить с работниками.

На этом сегодняшнюю заметку закончим. В следующей статье будут рассмотрены такие показатели вариации, как дисперсия, среднеквадратичное отклонение и коэффициент вариации.

Источник

Тема 9 Показатели вариации

Показатели вариации в анализе взаимосвязей

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.

Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Осо­бое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.

Основными показателями, характеризующими вариацию, являются:

1) Размах вариации

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

где –Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признакаабсолютные значения отклонений отдельных вариантов xi от средней арифметической ; fi – частота.

3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

4. Среднее квадратическое отклонение – корень квадратный из дисперсии:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:

Таблица 9.1 ‑ Данные о продаже основных марок холодильников:

Рассчитаем размах вариации.

R= 1200-460=740$

Пример вычисления размаха вариации

Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.

Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.

Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.

Между индиви­дуальными отклонениями от средней и колеблемостью признака существует прямая зави­симость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.

Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной

По приведенным выше данным определим средневзвешенную цену холодильника:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Далее рассчитаем дисперсию:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

. Следует отметить, что дисперсия еще не дает представления об однородности со­вокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рас­считан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, на­сколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .

Рассчитаем среднее квадратическое отклонение

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости ка­кого-либо одного признака или для определения однородности совокупности рассчиты­вают относительные показатели.

Эти показатели вычисляются как отношение размаха вариации, среднего линейно­го отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.

Определим значение показателя вариации по вышеприведенным данным таблицы

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Совокупность считается однородной, если V не превышает 33%.

Если V 25% – вариация сильная.

Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).

!! Следует отметить, что коэффициент вариации может быть более 100%, что, в част­ности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.

Изучая вариацию интересующего нас признака в пределах исследуемой совокупно­сти и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.

При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подвер­женным влиянию).

Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации резуль­тативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индиви­дуальных значений признака, используют правило сложения дисперсий.

Общая дисперсия представляет собой сумму средней из виутригрупповой и меж­групповой и дисперсий:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Общая дисперсия характеризует вариацию признака по всей совокупности как ре­зультат влияния всех факторов, определяющих индивидуальные различия единиц сово­купности.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Средняя из внутригрупповых дисперсий отражает ту часть вариации результа­тивного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рас­считывается отдельно по каждой j-ой группе.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении об­щей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчле­нения общей совокупности.

Теснота связи между факторным и результативным признаками оценивается на ос­нове эмпирического корреляционного отношения:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Пример. На следующем условном примере исследуем зависимость объема выполненных ра­бот от формы собственности проектно-изыскательских организаций.

Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности

Объем выполненных работ

Форма собственностиКоличество предприятийИтого
Государственная410,30,20,40100
Негосударственная620, 40, 60, 20, 50, 50240
Итого10340

1) Определим средний объем работ для предприятий двух форм собственности.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

2) Определим средний объем работ для каждой формы собственности.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.

Таблица 9.3. – Вспомогательная таблица

Государственная425125Негосударственная640233Итого10

Пример. Средняя из внутригрупповых дисперсий

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Пример. Межгрупповая дисперсия

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:

Проверка закона сложения дисперсий: 54,0+189,8=243,8

Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фак­тора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.

Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:

Чем больше размах вариации признака. Смотреть фото Чем больше размах вариации признака. Смотреть картинку Чем больше размах вариации признака. Картинка про Чем больше размах вариации признака. Фото Чем больше размах вариации признака

Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика

Контрольные задания

Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.

2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.

Источник

Тема 6 Показатели вариации

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать и разброс или вариацию значений отдельных единиц.

Основными показателями, характеризующими вариацию, являются: размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации – простейший показатель, разность между максимальным и минимальным значениями признака.

\[ \begin R=x_-x_ \end \] Недостатком является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия – средний квадрат отклонений значений признака от их средней величины и определяется по формулам простой

Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.

Показатели вариации могут быть использованы не только в анализе изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т.е.е в анализе взаимосвязей между показателями.

При проведении такого анализа совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным и результативным.

Для выявления взаимосвязи исходная совокупность делится на две или более групп по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:

Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием факторного признака. Это воздействие проявляется в отклонении групповых средних от общей средней:

Если факторный признак, по которому производится группировка, не оказывает никакого влияния на результативный признак, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая средняя будет равна нулю.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:

Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:

\[ \begin \eta_э = \sqrt < \frac <\delta^2> <\sigma_o^2>> \end \] Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.

Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Альтернативный признак принимает всего два значения – 0 и 1 с весами соответственно p и q. Поэтому среднее значение альтернативного признака равно р. А дисперсия альтернативного признака равна pq. Дисперсия альтернативного признака равна произведению доли признака, обладающего характеристикой на долю признака, не обладающего характеристикой. Предельное значение дисперсии для альтернативного признака равно 0,25 при р=0,5.

Дисперсия альтернативного признака широко применяется в выборочном обследовании.

Изменения частот в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности называются закономерностями распределения.

Основная задача анализа вариационных рядов заключается в выявлении подлинной закономерности распределения путем исключения влияния второстепенных, случайных для данного распределения факторов.

Если увеличить объем совокупности и уменьшить интервал в группах, то графическое изображение приближается к некоторой плавной кривой, которая называется кривой распределения.

Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.

Теоретическая кривая распределения – кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающего влияние случайных для него факторов.

Выяснение общего характера распределения предполагает оценку его однородности, а также расчет показателей асимметрии и эксцесса.

При сравнительном изучении асимметрии нескольких распределений с разными единицами измерения вычисляется относительный показатель асимметрии:

Его величина может быть положительной (для правосторонней асимметрии) и отрицательной (для левосторонней асимметрии).

Применение данного показателя дает возможность определить не только величину асимметрии, но и проверить ее наличие в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Если асимметрия меньше 0,25, она считается незначительной.

Если коэффициент асимметрии находится в интервале от 0,25 до 0,5, то наличие асимметрии в генеральной совокупности проверяется с помощью определения оценки существенности на основе средней квадратической ошибки:

Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление. Показатель эксцесса определяется на основе центрального момента четвертого порядка по формуле:

Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным. Среднеквадратическая ошибка эксцесса показывает, насколько существенен скачок в явлении и рассчитывается по формуле:

\[ \begin \sigma_ = \sqrt < \frac<24n(n-2)(n-3)> <(n-1)^2(n+3)(n+5)>> \end \] К структурным характеристикам ряда распределения относятся мода, медиана, квартили, децили и перцентили.

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Различают квартиль первого порядка (нижний квартиль) и квартиль третьего порядка (верхний квартиль). Каждый из них отсекает соответственно ¼ и ¾ совокупности. Для расчета квартилей используются следующие формулы:

Децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль отсекает 1/10 часть совокупности, а девятый дециль отсекает 9/10 частей. Рассчитываются децили по аналогичным формулам:

Перцентили – варианты, которые делят ранжированную совокупность на 100 частей.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *