в группе на занятии по статистике проводится эксперимент по регистрации номера месяца рождения
Задачи по математической статистике
I. а) Составить ряд распределения по выборке.
б) Построить статистические графики.
в) Найти числовые характеристики выборки (среднее арифметическое значение, дисперсию, среднее квадратическое отклонение, моду, медиану, коэффициент вариации).
1.Регистрация номеров продаваемой магазином мужской обуви дала следующие данные о покупках:
39 40 38 43 41 42 40 38 41 42
36 43 41 42 38 41 40 42 41 42
42 40 40 39 41 39 38 40 41 41
37 40 42 43 42 38 40 41 41 41
43 41 40 43 41 42 42 39 43 41
2.Из общего числа 400 стальных проволок отобраны 50 проволок и проведены испытания на прочность. Результаты испытаний следующие:
40 41 46 50 42 48 44 47 50 49
43 41 49 44 46 43 47 42 43 45
45 46 44 42 47 45 50 45 46 48
48 46 45 44 47 40 48 49 47 43
49 47 46 47 48 41 45 47 44 42
3 1 2 5 4 1 0 1 5 3
6 3 2 2 1 7 2 2 4 1
3 7 1 3 2 4 6 2 5 4
3 1 2 3 2 3 2 3 1 1
2 2 1 4 1 1 3 3 1 2
4.В случайном порядке было отобрано 50 личных карточек студентов и выписаны их экзаменационные оценки по математике:
4 4 2 3 5 3 5 4 3 3
4 2 4 3 5 4 4 3 3 3
2 2 3 4 5 4 3 3 2 4
4 3 4 3 3 4 2 3 3 3
5 3 3 3 4 5 2 4 3 3
5.В группах на занятии по статистике проводится эксперимент по регистрации номера месяца рождения каждого из 50 студентов:
5 1 1 5 5 4 3 7 10 5
5 4 2 4 2 6 2 10 7 11
2 7 7 4 2 4 12 11 8 9
10 7 2 7 7 4 2 4 11 9
12 3 1 9 6 1 3 4 5 2
6.На заводе изготовлено 10000 тысяч болванок. Результаты выборочной проверки веса 50 болванок были следующие:
29 31 30 31 30 30 30 29 30 30
30 30 29 32 31 32 31 33 31 31
31 32 30 31 29 31 30 31 30 34
31 31 30 32 31 31 30 30 32 30
30 30 31 31 30 32 31 31 30 31
7.Выборочные испытания на прочность (на растяжение) стальной проволоки дали следующие результаты:
44 46 41 42 43 46 44 47 44 45
48 40 46 43 44 45 43 42 43 50
44 46 41 42 43 46 44 47 44 45
42 43 44 45 46 45 46 45 45 44
44 45 47 47 47 44 45 43 42 41
43 44 42 45 48 42 44 44 43 48
8.Учет количества изготовленных за смену деталей 50 рабочими цеха дало следующие результаты:
25 20 24 25 23 24 21 22 23 20
23 23 21 23 22 23 24 23 22 23
22 24 23 24 23 24 25 24 23 21
23 23 24 23 24 21 23 24 24 24
21 25 22 23 23 22 24 23 24 22
9.Дано распределение размеров 45 пар обуви мужской обуви, проданных в магазине за день:
39 40 42 41 43 41 40 40 38
41 42 41 42 38 41 40 41 39
40 44 43 39 41 40 39 42 41
42 40 39 41 42 38 41 40 41
41 43 42 37 43 44 42 43 42
10.Дано распределение 60 абитуриентов по числу баллов, полученных ими на приемных экзаменах:
20 23 21 19 17 20 20 25 23 20
19 17 24 20 22 17 21 22 21 23
22 20 21 24 20 21 18 20 19 22
24 16 18 21 16 17 22 19 22 25
24 15 23 20 22 19 23 21 21 21
18 23 21 18 18 20 21 24 19 21
II.Полагая, что между переменными Х и У существует корреляционная зависимость:
а) определить коэффициент корреляции, сделать вывод о тесноте и направлении связи; б) найти уравнение прямой регрессии.
xi | |||||
yi | 4,6 | 5,0 | 4,1 | 2,1 | 2,9 |
xi | |||||
yi | 3,2 | 4,2 | 2,7 | 0,7 | 1,5 |
xi | |||||
yi | 4,4 | 5,4 | 3,9 | 3,1 | 5,9 |
xi | |||||
yi | 0,8 | 0,3 | 2,3 | 3,8 | 2,8 |
xi | 2,2 | 4,5 | 5,1 | |||
yi | 0,7 | 1,6 | 3,1 | 3,3 | 3,5 | 4,1 |
xi | ||||||
yi | 1,3 | 2,5 | 0,8 | 3,8 | 1,8 | 3,5 |
xi | ||||||
yi | 3,5 | 10,3 | 19,8 | 22,9 | 24,0 | 24,5 |
xi | 4,1 | 3,8 | 3,9 | 1,2 | 3,9 | 4,1 | 0,8 | 0,7 | 1,3 | |
yi | 23,6 | 31,9 | 35,2 | 36,4 | 23,6 | 34,0 | 38,2 | 17,3 | 28,8 | 19,7 |
a \ m | |
0,1 | 0,90484 |
0,2 | |
0,3 | |
0,4 | |
0,5 | |
0,6 | |
0,7 | |
0,8 | |
0,9 |
a \ k | ||||||
0,1 | 0,90484 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | 1,0000 |
0,2 | 1,0000 | 1,0000 | 1,0000 | 1,0000 | ||
0,3 | 1,0000 | 1,0000 | 1,0000 | |||
0,4 | 1,0000 | 1,0000 | 1,0000 | |||
0,5 | 1,0000 | 1,0000 | ||||
0,6 | 1,0000 | 1,0000 | ||||
0,7 | 1,0000 | |||||
0,8 | 1,0000 | |||||
0,9 | 1,0000 | |||||
04-43 |
Значения функции j(х)=
x | |
0,0 | 0,3989 |
0,1 | |
0,2 | |
0,3 | |
0,4 | |
0,5 | |
0,6 | |
0,7 | |
0,8 | |
0,9 | |
1,0 | |
1,1 | |
1,2 | |
1,3 | |
1,4 | |
1,5 | |
1,6 | |
1,7 | |
1,8 | |
1,9 | |
2,0 | |
2,1 | |
2,2 | |
2,3 | |
2,4 | |
2,5 | |
2,6 | |
2,7 | |
2,8 | |
2,9 | |
3,0 | |
3,1 | |
3,2 | |
3,3 | |
3,4 | |
3,5 |
Значения функции Ф(х)=
x | |
0,0 | 0,0000 |
0,1 | |
0,2 | |
0,3 | |
0,4 | |
0,5 | |
0,6 | |
0,7 | |
0,8 | |
0,9 | |
1,0 | |
1,1 | |
1,2 | |
1,3 | |
1,4 | |
1,5 | |
1,6 | |
1,7 | |
1,8 | |
1,9 | |
2,0 | |
2,1 | |
2,2 | |
2,3 | |
2,4 | |
2,5 | |
2,6 | |
2,7 | |
2,8 | |
2,9 |
x | x | x | x | ||||
3,0 | 0,49865 | 3,5 | 0,49977 | 4,0 | 0,499968 | 4,5 | 0,4999966 |
3,1 | 0,49903 | 3,6 | 0,49984 | 4,1 | 0,499979 | 4,6 | 0,4999979 |
3,2 | 0,49931 | 3,7 | 0,49989 | 4,2 | 0,499987 | 4,7 | 0,4999987 |
3,3 | 0,49952 | 3,8 | 0,49993 | 4,3 | 0,499991 | 4,8 | 0,4999992 |
3,4 | 0,49966 | 3,9 | 0,49995 | 4,4 | 0,499995 | 4,9 | 0,4999995 |
Не нашли, что искали? Воспользуйтесь поиском:
Ваш психолог. Работа психолога в школе.
Самое популярное
1. ВВЕДЕНИЕ.
2. ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ.
3. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА ИЗ НЕЕ. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ.
4. ОСНОВНЫЕ СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ.
5. ШКАЛЫ ИЗМЕРЕНИЙ.
6. ТАБУЛИРОВАНИЕ ДАННЫХ.
7. КВАНТИЛЬ.
8. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ.
9. МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ.
10. МЕРЫ ИЗМЕНЧИВОСТИ.
11. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ.
12. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ВЫБОРКИ.
13. СТАТИСТИЧЕСКИЙ ВЫВОД. ПРОВЕРКА ГИПОТЕЗ.
14. ОБЩАЯ СХЕМА ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ.
15. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК.
16. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ ЗАВИСИМЫХ (СВЯЗАННЫХ) ВЫБОРОК.
17. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ РАНЖИРОВАННЫХ ПРИЗНАКОВ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК.
18. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ РАНЖИРОВАННЫХ ПРИЗНАКОВ ДВУХ СВЯЗАННЫХ ВЫБОРОК.
19. СРАВНЕНИЕ ДИСПЕРСИЙ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК.
20. СРАВНЕНИЕ ДИСПЕРСИЙ ДВУХ ЗАВИСИМЫХ (СВЯЗАННЫХ) ВЫБОРОК
21. АНАЛИЗ ВЗАИМОСВЯЗЕЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА.
22. ЗНАЧИМОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ.
23. АНАЛИЗ ВЗАИМОСВЯЗИ РАНЖИРОВАННЫХ ПРИЗНАКОВ.
24. КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ КЕНДАЛЛА.
25. АНАЛИЗ ВЗАИМОСВЯЗИ НОМИНАЛЬНЫХ ПРИЗНАКОВ С ПОМОЩЬЮ КОРРЕЛЯЦИОННОГО АНАЛИЗА.
26. БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ (БКК).
27. РАНГОВЫЙ БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ.
28. АНАЛИЗ ВЗАИМОСВЯЗЕЙ НОМИНАЛЬНЫХ ПРИЗНАКОВ С ПОМОЩЬЮ ТАБЛИЦ СОПРЯЖЕННОСТИ.
29. ОДНОФАКТОРНЫЙ АНАЛИЗ (ОФА).
30. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (ОДА).
31. ДВУХФАКТОРНЫЙ АНАЛИЗ.
32. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (ДДА).
33. ПРОВЕРКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ ИСХОДНЫХ ДАННЫХ..
Литература.
1. ВВЕДЕНИЕ
Математическую статистику условно делят на 3 части:
-описательная статистика;
-теория статистического вывода;
-планирование и анализ эксперимента.
Описательная статистика занимается описанием, графическим представлением и табулированием совокупности исходных данных.
Теория статистического вывода – общий класс задач, характеризующийся попытками вывести свойства большого массива данных путем обследования небольшого массива данных, т.е. выборки.
Планирование и анализ эксперимента – статистические методы, разработанные для обнаружения и проверки причинной связи между изучаемыми переменными (показателями).
2. ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ
1 этап – исходный предварительный анализ исследуемой реальной системы. В результате этого этапа определяются:
— основные цели исследования на содержательном неформализованном уровне;
— совокупность единиц, представляющих предмет статистического исследования;
— перечень отобранных из представленных специалистами априорных (независимых от опыта человека) показателей, характеризующих каждого из исследуемых объектов;
— степень формализации соответствующих записей при сборе исходных данных;
— общее время и трудозатраты на планируемые работы.
— формализованная постановка задачи, по возможности включающая статистическую модель изучаемого явления.
2 этап – составление детального плана сбора исходной информации. При составлении этого плана необходимо по возможности учитывать полную схему дальнейшего статистического анализа.
3 этап – сбор исходного материала и ввод этих данных в ЭВМ.
4 этап – первичная статистическая обработка данных. В ходе этой обработки решаются следующие задачи:
1.Отображение переменных, описанных текстом в номинальную или порядковую шкалу.
5 этап – составление детального плана вычислительного анализа исходного материала. На этом этапе определяются основные группы, для которых будет проводиться дальнейший анализ. Обычно описывается блок-схема анализа с указанием привлекаемого метода.
6 этап – вычислительная реализация основной части статистической обработки данных.
7 этап – подведение итогов исследования. На этом этапе проверяется, в какой мере достигнуты сформулированные на 1 этапе содержательные цели работы. Если эти цели не достигнуты, то объясняется, почему. Работа завершается содержательной формулировкой новых задач, вытекающих из проведенного исследования.
3. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА ИЗ НЕЕ. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ
Генеральная совокупность – это совокупность всех мысленных наблюдений (или всех мыслимо возможных объектов), которые могут быть проведены при данном реальном комплексе условий.
Понятие ГС – это абстрактное математическое понятие. ГС может быть конечной или бесконечной.
Выборка из данной ГС представляет собой результат ограниченного ряда наблюдений интересующего нас показателя (признака, переменной). ГС всегда больше, чем выборка. В статистике выборка обозначается х1, х2, …, хn количество наблюдений n.
Количество наблюдений – «n»- называется объемом выборки.
Сущность статистических методов – чтобы по некоторой части ГС, т.е. по выборке, выносить суждения о свойствах ГС в целом.
Одним из важнейших вопросов, от успешного решения которого зависит достоверность выводов, получаемых в результате статистической обработки данных, является вопрос репрезентативности выборки, т.е. вопрос полноты и адекватности представления выборкой интересующих нас свойств ГС. Одним из важных путей повышения степени репрезентативности выборки является достижение полностью случайного отбора объектов из ГС.
4. ОСНОВНЫЕ СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ
5. ШКАЛЫ ИЗМЕРЕНИЙ
Считается, что в психологии примером шкалы отношений являются шкала порога абсолютной чувствительности. Примечание: данные, полученные в одной шкале, можно перевести в другую шкалу только в следующих направлениях: : 3 2 1. От количественной к порядковой к номинальной (много курит, немного курит, не курит). В обратном направлении перевод информации не возможен. По мере возможности нужно стараться измерять в количественной шкале, т.к. в этом случае мы сможем перейти к любой из рассматриваемых выше шкал. Однако при этом происходит частичная потеря информации. Перевод исходной выборки из количественной шкалы называется ранжированием. При ранжировании каждому элементу выборки приписывается ранг, который соответствует месту этого элемента в упорядоченной выборке. Наиболее часто выборку ранжируют по возрастанию, т.е. ранг, равный 1, получает наименьший элемент выборки. В результате ранжирования «новая» выборка содержит значения от 1 до n. Пример ранжирования выборки. Пусть в ходе эксперимента измерялся коэффициент IQ и получена следующая выборка:
112, 108, 84, 96, 75, 124, 106, 89. n=8
7 6 2 4 1 8 5 3
Проранжировать полученную выборку (не путать с упорядочиванием). 75, 84, 89, 96, 106, 108, 112, 124.
Иногда в выборке встречаются несколько одинаковых значений. Такая ситуация называется проблемой совпадающих рангов. В этом случае каждому из совпадающих значений присваивается ранг, равный среднему значению рангов, если бы эти элементы не совпадали.
Пример: 108, 96, 96, 74, 84, 108, 104, 108, 103. (3+4):2=3,5
8 3,5 3,5 1 2 8 6 8 5 (7+8+9):3=8
Пример перевода исходной выборки из количественной шкалы в номинальную. Пусть в ходе эксперимента измеряется уровень тревожности в диапазоне от 0 до 20. Необходимо перевести полученные данные в номинальную шкалу, содержащую 3 класса: высший (15-20); средний (6-14); низший (0-5). Исходная выборка имеет вид:
Количественная 14, 6, 8, 4, 18, 12, 10, 9.
Номинальная с с с н в с с с.
Переводя, мы теряем информацию. в-1, с-6, н-1.
6. ТАБУЛИРОВАНИЕ ДАННЫХ
15. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК
Пример: был проведен эксперимент по исследованию влияния усовершенствованного пособия (вводный материал, подготавливаемый к восприятию изучаемого предмета) на успеваемость по определенному разделу математики. 50 учащихся были разбиты случайным образом на две группы: 25 (1 группа) знакомились с усовершенствованным пособием, а 25 (2 группа) не знакомились, в конце эксперимента всем учащимся был предложен тест на усвоение понятий определенного раздела математики. В качестве измеряемых признаков рассматривалось количество правильных ответов. Проверить гипотезу о наличии или отсутствии влияния усовершенствованного пособия на успеваемость по математике.
В нашем случае в качестве измеряемой переменной рассматривалось количество правильных ответов, поэтому она измерена в количественной шкале. Так как учащиеся разбивались на 2 группы случайно, то в результате эксперимента мы получили две независимых выборки. х1, х2, …, х25 и у1, у2, …, у25. По полученным выборкам были найдены средние значения х=7,65;
2 2
у=6,0 и дисперсии Sx=6,5 Sy=5,9 n=25 m=25 =0,05
tнабл. > tкр., то мы должны принимать альтернативную гипотезу Н1 о статистическом различии средних значений. Имеется влияние усовершенствованного пособия на среднюю успеваемость по математике на уровне значимости 0,05 (5% ошибок допускается). Глядя на соотношение между х и у (в нашем случае х>у), делаем вывод, что усовершенствованное пособие повышает среднюю успеваемость по математике.
Примечания.
1. Рассмотренный в этом параграфе критерий должен применяться для выборок, извлеченных из ГС и имеющих нормальное распределение с одинаковыми дисперсиями.
2. Если исходные выборки извлечены не из нормальной ГС, то необходимо воспользоваться критерием, рассмотренным далее в параграфе 17 или критерием этого параграфа, но при этом помнить, что полученные выводы будут приближенными, т.е. могут оказаться неправильными.
3. Предположение о равенстве дисперсий может легко, если брать обе выборки одинакового объема.
4. Рассмотренный в этом параграфе критерий в литературе обычно называется t-критерий Стьюдента.
16. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ ЗАВИСИМЫХ (СВЯЗАННЫХ) ВЫБОРОК
Иногда нам приходится измерять один и тот же признак (показатель) для одной и той же группы лиц, но в различные моменты времени. Например, до проведения эксперимента и после эксперимента. В результате в качестве исходных данных мы получаем две выборки одинакового объема х1, х2, …, хn и у1, у2, …, уn (одни и те же люди). Причем элементы выборки, стоящие на одном и том же месте в каждой из выборок должны соответствовать измененному показателю для одного и того же лица. Поэтому такие выборки часто называются связанными. Они являются зависимыми, т.к. значения элементов второй выборки зависят от значений элементов первой выборки. Исходные данные в рассматриваемом примере называются типа «до – после». Связанными выборками могут рассматриваться также данные типа «брат – сестра» (в 1 выборке показываем мальчиков, во второй – девочек), «муж – жена». Для таких данных можно рассмотреть задачу сравнения средних значений двух выборок, для решения которой применяется общая схема проверки статистической гипотезы.
1 и 2 этапы – см. 15.
3 этап – вычисляем наблюдаемое значение статистики критерия. Для этого сначала из двух исходных выборок получаем одну выборку разностей, которую будем обозначать d1, d2, …, dn, где di = xi – yi. По полученной
n
выборке разностей вычисляем среднее значение d = di : n, а также
n 2 i=1
стандартное отклонение Sd = (di – d) : (n – 1), тогда наблюдаемое
i=1
значение статистики критерия вычисляется по следующей формуле:
tнабл. = n d/Sd
4 этап – находим критическое значение статистики критерия. В нашем случае статистика критерия имеет t-распределение Стьюдента с числом степеней свободы = n – 1, поэтому для нахождения t-критического необходимо воспользоваться статистической таблицей распределения Стьюдента (см 4 этап 15 параграфа).
5 этап – делаем вывод о правильности той или иной гипотезы по следующему правилу:
1) если –tкр tкр, то принимается альтернативная гипотеза, т.е. мы делаем вывод о том, что средние значения рассматриваемых ГС статистически различны или, другими словами, эксперимент привел к изменению среднего значения изучаемого показателя. Для того, чтобы выяснить, в какую сторону произошло изменение среднего значения (стало больше или меньше), необходимо сравнить среднее значение двух исходных выборок х и у (арифметически).
Примечание. 1) рассмотренный критерий должен применяться для выборок, извлеченных из ГС, имеющих нормальное распределение с одинаковыми дисперсиями. 2) если эти условия не выполняются, то необходимо воспользоваться критерием, рассмотренным далее в параграфе 18. 3) рассмотренный в данном параграфе критерий в литературе обычно называется парным t-критерием.
ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ
ВВЕДЕНИЕ
Математическую статистику условно делят на 3 части:
-описательная статистика;
-теория статистического вывода;
-планирование и анализ эксперимента.
Описательная статистика занимается описанием, графическим представлением и табулированием совокупности исходных данных.
Теория статистического вывода – общий класс задач, характеризующийся попытками вывести свойства большого массива данных путем обследования небольшого массива данных, т.е. выборки.
Планирование и анализ эксперимента – статистические методы, разработанные для обнаружения и проверки причинной связи между изучаемыми переменными (показателями).
ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ
1 этап – исходный предварительный анализ исследуемой реальной системы. В результате этого этапа определяются:
— основные цели исследования на содержательном неформализованном уровне;
— совокупность единиц, представляющих предмет статистического исследования;
— перечень отобранных из представленных специалистами априорных (независимых от опыта человека) показателей, характеризующих каждого из исследуемых объектов;
— степень формализации соответствующих записей при сборе исходных данных;
— общее время и трудозатраты на планируемые работы.
— формализованная постановка задачи, по возможности включающая статистическую модель изучаемого явления.
2 этап – составление детального плана сбора исходной информации. При составлении этого плана необходимо по возможности учитывать полную схему дальнейшего статистического анализа.
3 этап – сбор исходного материала и ввод этих данных в ЭВМ.
4 этап – первичная статистическая обработка данных. В ходе этой обработки решаются следующие задачи:
1.Отображение переменных, описанных текстом в номинальную или порядковую шкалу.
1. Анализ резко выделяющихся наблюдений.
2. Восстановление пропущенных наблюдений.
3. Проверка статистической независимости элементов исходной выборки.
5 этап – составление детального плана вычислительного анализа исходного материала. На этом этапе определяются основные группы, для которых будет проводиться дальнейший анализ. Обычно описывается блок-схема анализа с указанием привлекаемого метода.
6 этап – вычислительная реализация основной части статистической обработки данных.
7 этап – подведение итогов исследования. На этом этапе проверяется, в какой мере достигнуты сформулированные на 1 этапе содержательные цели работы. Если эти цели не достигнуты, то объясняется, почему. Работа завершается содержательной формулировкой новых задач, вытекающих из проведенного исследования.
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА ИЗ НЕЕ. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ
Генеральная совокупность – это совокупность всех мысленных наблюдений (или всех мыслимо возможных объектов), которые могут быть проведены при данном реальном комплексе условий.
Понятие ГС – это абстрактное математическое понятие. ГС может быть конечной или бесконечной.
Выборкаиз данной ГС представляет собой результат ограниченного ряда наблюдений интересующего нас показателя (признака, переменной). ГС всегда больше, чем выборка. В статистике выборка обозначается х1, х2, …, хn количество наблюдений n.
Количество наблюдений – «n»- называется объемом выборки.
Сущность статистических методов – чтобы по некоторой части ГС, т.е. по выборке, выносить суждения о свойствах ГС в целом.
Одним из важнейших вопросов, от успешного решения которого зависит достоверность выводов, получаемых в результате статистической обработки данных, является вопрос репрезентативности выборки, т.е. вопрос полноты и адекватности представления выборкой интересующих нас свойств ГС. Одним из важных путей повышения степени репрезентативности выборки является достижение полностью случайного отбора объектов из ГС.
ШКАЛЫ ИЗМЕРЕНИЙ
Считается, что в психологии примером шкалы отношений являются шкала порога абсолютной чувствительности. Примечание: данные, полученные в одной шкале, можно перевести в другую шкалу только в следующих направлениях: : 3 2 1. От количественной к порядковой к номинальной (много курит, немного курит, не курит). В обратном направлении перевод информации не возможен. По мере возможности нужно стараться измерять в количественной шкале, т.к. в этом случае мы сможем перейти к любой из рассматриваемых выше шкал. Однако при этом происходит частичная потеря информации. Перевод исходной выборки из количественной шкалы называется ранжированием. При ранжировании каждому элементу выборки приписывается ранг, который соответствует месту этого элемента в упорядоченной выборке. Наиболее часто выборку ранжируют по возрастанию, т.е. ранг, равный 1, получает наименьший элемент выборки. В результате ранжирования «новая» выборка содержит значения от 1 до n. Пример ранжирования выборки. Пусть в ходе эксперимента измерялся коэффициент IQ и получена следующая выборка:
112, 108, 84, 96, 75, 124, 106, 89. n=8
7 6 2 4 1 8 5 3
Проранжировать полученную выборку (не путать с упорядочиванием). 75, 84, 89, 96, 106, 108, 112, 124.
Иногда в выборке встречаются несколько одинаковых значений. Такая ситуация называется проблемой совпадающих рангов. В этом случае каждому из совпадающих значений присваивается ранг, равный среднему значению рангов, если бы эти элементы не совпадали.
Пример: 108, 96, 96, 74, 84, 108, 104, 108, 103. (3+4):2=3,5
8 3,5 3,5 1 2 8 6 8 5 (7+8+9):3=8
Пример перевода исходной выборки из количественной шкалы в номинальную. Пусть в ходе эксперимента измеряется уровень тревожности в диапазоне от 0 до 20. Необходимо перевести полученные данные в номинальную шкалу, содержащую 3 класса: высший (15-20); средний (6-14); низший (0-5). Исходная выборка имеет вид:
Количественная 14, 6, 8, 4, 18, 12, 10, 9.
Номинальная с с с н в с с с.
Переводя, мы теряем информацию. в-1, с-6, н-1.
ТАБУЛИРОВАНИЕ ДАННЫХ