Как сделать группировку статистических данных

Группировка данных и построение ряда распределения

Виды статистических группировок

Принципы построения статистических группировок

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

Длину частичных интервалов вычисляют как h=(xmax-xmin)/k

Построить вариационный ряд. По найденному ряду построить полигон распределения, гистограмму, кумуляту. Определить моду и медиану.
Скачать решение

Пример. По результатам выборочного наблюдения (выборка А приложение):
а) составьте вариационный ряд;
б) вычислите относительные частоты и накопленные относительные частоты;
в) постройте полигон;
г) составьте эмпирическую функцию распределения;
д) постройте график эмпирической функции распределения;
е) вычислите числовые характеристики: среднее арифметическое, дисперсию, среднее квадратическое отклонение. Решение

Требуется: ранжировать ряд, построить интервальный ряд распределения, вычислить среднее значение, колеблемость среднего значения, моду и медиану для ранжированного и интервального рядов.

На основе исходных данных построить дискретный вариационный ряд; представить его в виде статистической таблицы и статистических графиков. 2). На основе исходных данных построить интервальный вариационный ряд с равными интервалами. Число интервалов выбрать самостоятельно и объяснить этот выбор. Представить полученный вариационный ряд в виде статистической таблицы и статистических графиков. Указать виды примененных таблиц и графиков.

С целью определения средней продолжительности обслуживания клиентов в пенсионном фонде, число клиентов которого очень велико, по схеме собственно-случайной бесповторной выборки проведено обследование 100 клиентов. Результаты обследования представлены в таблице. Найти:
а) границы, в которых с вероятностью 0.9946 заключено среднее время обслуживания всех клиентов пенсионного фонда;
б) вероятность того, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине);
в) объем повторной выборки, при котором с вероятностью 0.9907 можно утверждать, что доля всех клиентов фонда с продолжительностью обслуживания менее 6 минут отличается от доли таких клиентов в выборке не более чем на 10% (по абсолютной величине).
2. По данным задачи 1, используя X 2 критерий Пирсона, на уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – время обслуживания клиентов – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Скачать решение

Имеются следующие выборочные данные (выборка 10%-ная, механическая) о выпуске продукции и сумме прибыли, млн. руб. По исходным данным:
Задание 13.1.
13.1.1. Постройте статистический ряд распределения предприятий по сумме прибыли, образовав пять групп с равными интервалами. Постройте графики ряда распределения.
13.1.2. Рассчитайте числовые характеристики ряда распределения предприятий по сумме прибыли: среднюю арифметическую, среднее квадратическое отклонение, дисперсию, коэффициент вариации V. Сделайте выводы.
Задание 13.2.
13.2.1. Определите границы, в которых с вероятностью 0.997 заключена сумма прибыли одного предприятия в генеральной совокупности.
13.2.2. Используя x2-критерий Пирсона, при уровне значимости α проверить гипотезу о том, что случайная величина X – сумма прибыли – распределена по нормальному закону.
Задание 13.3.
13.3.1. Определите коэффициенты выборочного уравнения регрессии.
13.3.2. Установите наличие и характер корреляционной связи между стоимостью произведённой продукции (X) и суммой прибыли на одно предприятие (Y). Постройте диаграмму рассеяния и линию регрессии.
13.3.3. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами X и Y, используя шкалу Чеддока.
Методические рекомендации. Задание 13.3 выполняется с помощью этого сервиса.
Скачать решение

Задача. Следующие данные представляют собой затраты времени клиентов на заключение договоров. Построить интервальный вариационный ряд представленных данных, гистограмму, найти несмещенную оценку математического ожидания, смещенную и несмещенную оценку дисперсии.

Решение:
Для построения группировка с равными интервалами воспользуемся сервисом Группировка статистических данных.

Источник

Статистика. Сводка и группировка статистических данных.

Статистика. Сводка и группировка статистических данных.

Вопросы

Задай свой вопрос по этому материалу!

Поделись с друзьями

Комментарии преподавателя

Статистическая сводка является следующим после статистического наблюденияэтапом статистической работы. Её задача заключается в том, чтобы привести собранную информацию и материалы в определенный порядок, систематизировать и на этой основе дать сводную характеристику всей изучаемойсовокупности.

Различают простую и сложную сводку:

Сводка называется децентрализованной если единое руководство работой осуществляется из центра, а непосредственная работа проводится на местах (обычно используется при обработке статистической отчетности).
Если же сбор и обработка данных проводится в одном месте, то сводка называется централизованной. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.

Проведению статистической сводки и группировки предшествует разработка программы статистического наблюдения, состоящая из нескольких этапов: выбор группировочного признака, разработка системы статистических показателей.

Статистическая сводка должна проводиться по определенной программе и плану.

Сводка состоит из следующих этапов:

Понятие и виды группировки

Чаще всего простые итоговые сводки не удовлетворяют исследователя, так как они дают слишком общие представления об изучаемом явлении. Поэтому статистический материал подвергается группировке.

Группировка — это метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку. Например, группировка предприятий по формам собственности или группировка населения по размеру среднедушевого дохода.

Группировка создаёт основу для последующей сводки и анализа данных.

Третий этап статистического исследования состоит в том, что с помощью обобщающих обобщающих статистических показателей: относительных и средних величин, показателей вариации и динамики, экономических индексов, а также с помощью табличного и графического методов осуществляется анализ полученных данных.

Группировка статистических данных

Группировка — это метод, при котором вся исследуемая совокупность разделяется на группы по какому-то существенному признаку.

Признак, по которому осуществляется группировка называется группировочным признаком или основанием группировки.

Группировка представляет собой способ подразделения рассматриваемой совокупности данных на однородные по изучаемым признакам группы. Это делается с целью изучения структуры этой совокупности либо взаимосвязей между отдельными элементами этой совокупности. С помощью группировки можно выявить влияние отдельных единиц на средние итоговые показатели. Так, например, группировка рабочих данной организации по уровню производительности труда используется с целью выявления влияния высокой производительности труда отдельных рабочих на среднюю производительность по организации и для определения резерва, кроющегося в повышении производительности труда всех рабочих до уровня передовых рабочих.

Как будет показано в статьях данного сайта, наибольшее распространение в экономическом анализе имеет группировка по факторам, связанным:

Эти три группы факторов оказывают влияние на объем продукции, выпускаемой данной организацией.

Выбор группировочного признака зависит от цели данной группировки и предварительного экономического анализа явления.

В зависимости от решаемых задач различают типологические, структурные и аналитические группировки:

В процессе проведения экономического анализа, как правило, применяются два основных вида группировок:структурные и аналитические.

Структурные группировки используются с целью исследования состава и структуры совокупности данных, а также с целью изучения тех изменений в этой совокупности, которые имеют место в соответствии с выбранным изменяющимся признаком.

Аналитические же группировки используются для исследования взаимных связей, существующих между показателями, характеризующими рассматриваемую совокупность данных. В этих условиях один из показателей является обобщающим, результативным, а другие показатели рассматриваются как факторы, влияющие на обобщающий показатель.

Принципы построения группировок

1. Выбор группировочного признака

В зависимости от вида группировочных признаков различают группировки по количественным и качественным (атрибутивным) признакам.

2. Определение числа групп:

Если в основании группировки атрибутивный (качественный) признак, то количество групп равняется количеству значений этого признака

Если в основании группировки лежит количественный признак, то число групп определяют по формуле Стерджесса:

Получаем следующее соотношение:

15-2425-4445-8990-179180-359360-719
5678910

3. Выбор интервала группировки:

Интервал группировки — это значение варьирующего признака, лежащее в определенных пределах. Нижняя граница интервала — это значение наименьшего признака в интервале. Верхняя граница — это наибольшее значение в интервале.

Величина интервала — это разница между верхней и нижней границами.

Интервалы группировок могут быть равными и неравными.
Равные интервалы применяются в тех случаях, когда значение количественного признака внутри совокупности изменяется равномерно.

Величина равных интервалов определяется по формуле:

Правила округления интервалов:

Интервалы бывают открытые и закрытые. Закрытым считается интервал, в котором есть и нижняя и верхняя границы, в противном случае интервал считается открытым. При решении задач неизвестную границу открытого интервала определяют по величине смежного с ним интервала.

От группировок следует отличать классификацию. Классификация является основой группировок.

Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Отличительной чертой классификации является то, что в основу ее кладется качественный признак.

Пример. Распределение предприятий по региона по величине розничного товарооборота в текущем году.

Как сделать группировку статистических данных. Смотреть фото Как сделать группировку статистических данных. Смотреть картинку Как сделать группировку статистических данных. Картинка про Как сделать группировку статистических данных. Фото Как сделать группировку статистических данных

где — чило единиц совокупности.

Величину интервала определяют по следующей формуле:

Как сделать группировку статистических данных. Смотреть фото Как сделать группировку статистических данных. Смотреть картинку Как сделать группировку статистических данных. Картинка про Как сделать группировку статистических данных. Фото Как сделать группировку статистических данных

Результаты представим в табличной форме.

Как сделать группировку статистических данных. Смотреть фото Как сделать группировку статистических данных. Смотреть картинку Как сделать группировку статистических данных. Картинка про Как сделать группировку статистических данных. Фото Как сделать группировку статистических данных

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

Имеется группировка сотрудников двух управлений одного из банков по размеру месячной заработной платы.

Источник

Лекция 4. Сводка и группировка статистических данных

4.1. Задачи сводки и группировки.

4.2. Типы группировок.

4.2.1. Структурные группировки.

4.2.3. Аналитические группировки.

4.3. Сложные группировки.

4.4. Статистические таблицы и графики.

4.1. Задачи сводки и группировки.

Для получения обобщающих характеристик собранную информацию необходимо систематизировать, превратить ее в упорядоченную систему статистических показателей. Систематизация полученной информации и обобщение наблюдаемых факторов является содержанием второй стадии статистического исследования, называемой сводкой и группировкой.

Статистическая сводка представляет собой комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению.

Целью сводкиявляется получение итоговых данных путем подсчета единичных сведений.

Классификация:

1. По глубине проработки материала:

v Простой сводкой называется операция по подсчету общих итогов по совокупности единиц наблюдения, то есть определение размера исследуемого явления.

v Сложной сводкой называется комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и совокупности в целом, а также представление результатов группировки в табличной форме.

2. По форме обработки материала:

v централизованная сводкавесь первичный материал поступает в одну организацию, где и подвергается обработке по принятой программе, по единой методике (например, в Государственном комитете по статистике РФ или территориальных управлениях статистики).

Программа статистической сводки включает в себя:

• выбор группировочных признаков;

• определение порядка формирования групп;

• разработка системы статистических показателей для характеристики выделенных групп и совокупности в целом;

• разработка макетов таблиц для представления результатов сводки.

План статистической сводки содержит указания о сроках и последовательности выполнения отдельных этапов сводки, ее исполнителях, о порядке представления ее результатов.

Научной основой сводки является статистическая группировка,которая представляет собой процесс образования однородных групп на основе расчленения (разделения) статистической совокупности на части или объединение изучаемых статистических единиц в частные совокупности по существенным для них признакам.

Основными категориями метода группировок являются группировочный признак (основание группировки)и интервал.

Ø Группировочным признаком (основанием группировки)называется признак, по которому происходит выделение однородных групп. В качестве группировочного обычно выбирается один из существенных легко распознаваемых признаков, носящих как атрибутивный, так и количественный характер.

Ø Интервал – это совокупность варьирующих значений признака в группе, он определяет количественные границы групп, а его ширина представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Типы интервалов:

равные – во всех выделенных группах ширина интервала является одинаковой;

неравные – в каждой группе ширина интервала различна; при этом ее изменение может изменяться закономерно (например, равномерно возрастать), или произвольно, то есть быть свободной;

закрытые _ если известны верхняя и нижняя границы интервалов (максимальное и минимальное значения признака в группах);

С помощью группировок в статистике решают следующие задачи:

изучение состава статистических совокупностей;

выделение отдельных типов явлений внутри совокупности;

выявление причинно-следственных связей разных признаков внутри совокупности;

классификация единиц совокупности по множеству признаков.

Типы группировок

В зависимости от степени сложности изучаемого явления и от поставленных задач статистические группировки могут выполняться по одному или нескольким группировочным признакам. Группировка

называется простой (одномерной), если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

структурные – предназначены для выявления состава изучаемого явления;

типологические – предназначены для выделения в статистической совокупности различных социально-экономических типов явлений;

аналитические (факторные) – используются для изучения связей и зависимости между варьирующими признаками.

Типологическая группировка

Ее цельсостоит в изучении распространенности различных типов экономических явлений в статистической совокупности.

Типологические группировки применяются, как правило, к неоднородной совокупности и осуществляются посредством сложных неравноинтервальных группировок. Результатом типологических группировок является разделение совокупности на классы, социально-экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная, смешанная) или группировка секторов экономики.

При выполнении типологических группировок важно правильно выбрать основание группировки. Для этого необходимо предварительно выявить возможные типы явления на основе анализа сущности и закономерностей его развития. Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Аналитические группировки

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы:

факторные и результативные. Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Аналитические группировки отличаются от структурных и типологических по технике выполнения, которая заключается в следующем:

1. Производится группировка единиц совокупности по факторному признаку, она выполняется как структурная.

2. В каждой выделенной группе отбираются соответствующие значения результативного признака, и на их основе рассчитывается некоторый обобщающий показатель, обычно, среднее значение.

3. Анализируются изменения обобщающего показателя – среднего значения результативного признака по группам, и делается вывод о наличии или отсутствии взаимосвязи и ее направлении. Если при изменении значений факторного признака, положенного в основу группировки изменяется величина результативного, то признается наличие связи между признаками; при этом, если с увеличением значений факторного признака увеличивается значение результативного, то связь

относится к прямой; в противном случае – к обратной.

Сложные группировки

К сложным группировкам относятся группировки, выполняемые по двум и более основаниям. Сложные группировки делятся на комбинационные и многомерные.

Такие группировки предназначены для более глубокого анализа изучаемого явления, позволяют выявить и сравнить различия и связи между исследуемыми признаками, которые невозможно установить на основе изолированных группировок по каждому из исследуемых признаков.Комбинационная группировка по двум признакам (X, Y) оформляется в виде шахматной таблицы, в которой значения одного признака X откладываются по строкам, а значения второго признака Y –

Цель многомерных группировок – классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно. В процессе такой группировки решаются, например, задачи типизации – выделяются самостоятельные экономические или социальные типы явлений. Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *