Как сделать группировку статистика

Как сделать группировку статистика

ЛЕКЦИЯ № 3. Сводка и группировка статистических данных

1. Основное содержание и задачи статистической сводки

Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.

Второй этап статистической работы – статистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.

Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом.

Проведение сводки включает три этапа:

1) предварительный контроль – это проверка данных;

2) группировка данных по заданным признакам – это определение производных показателей;

3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.

Смысловая согласованность статистических сведений – это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.

Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.

Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.

Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.

Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.

Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.

Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:

1) выбирается группировочный признак для образования однородных групп;

2) определяется порядок формирования и число групп;

3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;

4) создаются макеты статистических таблиц для предоставления результатов сводки.

Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.

Сводка также бывает децентрализованной и централизованной.

Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.

Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.

По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.

2. Сущность и классификация группировок

Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.

Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».

Статистическая группировка – это один из основных этапов проведения статистического исследования.

Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.

Три основных типа задач, решаемых с помощью метода статистической группировки:

1) выделение социально–экономических типов явлений;

2) изучение структуры явления и структурных сдвигов, происходящих в явлении;

3) выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления. Различают следующие виды статистических группировок:

Качественно однородные группы совокупностей, т. е. объекты, которые по своим группировочным признакам близки друг к другу, называют типологической группировкой.

Примером типологической группировки являются: группировка земель, по формам собственности. Основное внимание в типологической группировке должно уделяться идентификации типов и выбору группировочного признака. Для построения типологической группировки необходимо воспользоваться количественными и качественными (атрибутивными) признаками.

Группировка по атрибутивному признаку предполагает, что число выделенных групп соответствует фактическому числу градаций этого признака. По количественному признаку необходимо правильно установить интервал группировки, определить необходимое число групп. Проблема определения интервалов типологической группировки решается на основании выделения таких количественных границ изменения группировочного признака, при которых явление изменяет или приобретает новое качество.

В типологической группировке от числа существующих социально–экономических типов зависит число групп. От состава, структуры однородных групп и изучения вариации признаков внутри однотипной совокупности и однотипных групп на основе построения структурной группировки зависят социально–экономические типы явлений. Разделение однородной совокупности на определенные группы, которые в дальнейшем будут характеризовать структуру по определенному группировочному признаку, называют структурной группировкой. Здесь также рассматриваются количественные и атрибутивные признаки. Примером является группировка рабочих склада по квалификации.

По атрибутивному признаку группы отличаются друг от друга по характеру признака. Количественный признак также предполагает определение числа групп и ширины интервала.

Основная задача статистических группировок – исследование связей и зависимостей между признаками единиц статистической совокупности, которая решается с помощью построения аналитических группировок. Аналитическая группировка – это группировка, выявляющая взаимосвязи и взаимозависимости между изучаемыми социально–экономическими явлениями и признаками, их характеризующими.

Все признаки в статистической науке можно подразделять на факторные и результативные. Признаки, которые оказывают большое влияние на изменение результативных признаков, называют факторными. Признаки, изменяющиеся под влиянием факторных признаков, называют результативными.

Важная задача при построении аналитической группировки – выбор числа групп, на которые необходимо разбить изучаемую совокупность единиц наблюдения, и определение их границ.

Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по груп–пировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.

Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.

Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировоч–ным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.

При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.

Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку Различают группировки по используемой информации:

1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;

2) вторичные – это результат соединения или расчленения группировки.

3. Принципы построения группировок

Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.

Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.

В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.

Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.

Для определения числа групп можно воспользоваться формулой Стерджесса:

где h – число групп;

N – число единиц совокупности;

lgN – десятичный логарифм от N.

Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.

На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.

Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.

Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

h = R/n = ( х мах – х min ) / n,

Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.

В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.

Источник

Группировка данных и построение ряда распределения

Виды статистических группировок

Принципы построения статистических группировок

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

Длину частичных интервалов вычисляют как h=(xmax-xmin)/k

Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение

Пример. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение

Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона, при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока.
Методические рекомендации. Задание 13.3 выполняется с помощью этого сервиса.
Скачать решение

Задача. Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *