Функция медиана в excel что это
Медиана в сводной таблице в Excel 2010?
Удивительно, что такой функциональности нет в таком древнем приложении
Есть ли известный обходной путь?
Я расскажу о той части, где вы можете изменить тип агрегации для поля значения: в нем есть сумма, минимум, максимум, среднее и т. Д., Но не медиана
Для простых примеров вы можете использовать формулы массива вместо сводной таблицы.
Если у вас есть исходные данные в строках 10: 1000, обозначения категорий исходных данных в столбце A, значения исходных данных в столбце C и категория, рассматриваемая в G3, следующая формула массива найдет медиану:
Зафиксируйте запись с помощью Ctrl + Shift + Enter и скопируйте для категорий в G4, G5 и т. Д.
К сожалению, нет ничего встроенного в функцию сводной таблицы Excel, которая будет делать это. Вы можете попробовать это дополнение, хотя. Он утверждает, что может сделать это, но я никогда не использовал это.
Вы действительно можете использовать iserror функцию, чтобы исключить общее количество строк из медианы. Например, если Total row метки находятся, row A а данные, для которых вы хотите получить медиану, находятся в row I :
есть способ сделать медиану (или любую формулу), если ваша сводная таблица проста (в таблице нет промежуточных итогов). кроме этого, нет другого способа изящно включить срединные кальки в сводную таблицу.
ПРИМЕЧАНИЕ: вы не можете поместить ячейку формулы медианы / смещения в тот же столбец, из которого вы получаете медианное значение. ТАКЖЕ, смещение позволяет вам получить медиану из значения столбца за вычетом итоговой строки.
к сожалению, нет изящного способа сделать срединное (или любое другое) вычисление, когда вы работаете с более сложной сводной таблицей (т. е. у которой есть промежуточные итоги в сводной таблице).
Я нашел решение, если вы хотите быстро получить некоторые конкретные медианные значения в сводной таблице: не идеально, но в некоторых ситуациях это может помочь.
Как рассчитать медиану в Excel
Медиана представляет собой значение, отделяющее верхнюю половину от нижней половины выборки данных. В Microsoft Excel есть функция, позволяющая легко вычислить медианное значение. Посмотрим, как это сделать расчет медианы в Excel.
Расчет медианы в Excel
Медианную функцию в Excel можно отнести к категории статистических функций. Его можно ввести как часть формулы в ячейку рабочего листа. Синтаксис функции МЕДИАНА следующий:
Где число1, число2,… — числовые значения, для которых вы хотите вычислить медиану. Это могут быть числа, именованные диапазоны или ссылки на ячейки, содержащие числа. Number1 является обязательным, последующие числа необязательны.
Чтобы использовать функцию МЕДИАНА в качестве функции рабочего листа в Microsoft Excel:
1]Введите значения в ячейки
Предположим, вы хотите найти медиану чисел в ячейках. D2: D8. Просто введите значение данных, открыв пустой лист Excel и выполнив следующие действия:
Сделайте один столбец «Средние ежемесячные расходы» и соседний столбец «Сумма».
Введите описание в столбец 1 и соответствующее ему значение или сумму в столбце 2.
2]Используйте формулу для вычисления значения
Теперь, чтобы рассчитать средний клик внутри любой ячейки и использовать такую простую формулу:
Вам не нужно беспокоиться о ячейках с текстом, поскольку пустые ячейки, а также ячейки, содержащие текст и логические значения, игнорируются.
Примечание: Ячейки с нулевыми значениями (0) включаются в вычисления.
В самых последних версиях Microsoft Excel функция МЕДИАНА принимает до 255 аргументов.
Функция МЕДИАНА
В этой статье описаны синтаксис формулы и использование функции МЕДИАНА в Microsoft Excel.
Описание
Возвращает медиану заданных чисел. Медиана — это число, которое является серединой множества чисел.
Синтаксис
Аргументы функции МЕДИАНА описаны ниже.
Число1, число2. Аргумент «число1» является обязательным, последующие числа необязательные. От 1 до 255 чисел, для которых требуется определить медиану.
Замечания
Если в наборе имеется ряду чисел, медиана вычисляет среднее значение двух чисел в середине. См. вторую формулу в примере.
Аргументы могут быть либо числами, либо содержащими числа именами, массивами или ссылками.
Учитываются логические значения и текстовые представления чисел, которые непосредственно введены в список аргументов.
Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, то такие значения пропускаются; однако ячейки, которые содержат нулевые значения, учитываются.
Аргументы, которые являются значениями ошибки или текстами, не преобразуемыми в числа, приводят в возникновению ошибок.
Примечание: Функция МЕДИАНА измеряет центральную тенденцию, которая является центром множества чисел в статистическом распределении. Существует три наиболее распространенных способа определения центральной тенденции:
Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.
Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.
Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.
При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При смещенном распределении множества чисел значения могут быть разными.
Пример
Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.
Среднее значение VS Медиана
Уверен, многие из Вас знакомы с такой функцией MS Excel как СРЗНАЧ(). Эта функция, как и понятно из её названия, вычисляет среднее значение диапазона данных. Но ещё в MS Excel есть функция МЕДИАНА() и человеку далёкому от статистики трудно понять в чём состоит разница между этими функциями.
К примеру, если у нас имеется выборка данных 1, 2, 3, 4, 5 то результат обоих функций будет одинаковым.
Как видим, функции СРЗНАЧ() и МЕДИАНА() дают совершенно разные результаты. Почему же это происходит?
Посмотрите на эту гистограмму (созданную на основе нашей таблицы) и посчитайте сколько столбцов находятся ниже линии медианы и сколько столбцов находятся выше этой линии.
Если количество данных является нечётным, то медиана равняется числу находящемуся в середине отсортированного списка. Если же, как в нашем примере, количество данных в диапазоне является чётным, то медиана равняется среднему значению чисел находящихся ближе всего к линии разделения (в нашем примере значения строк №5 и №6).
Медиана в статистике
Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана.
Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.
Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение.
Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.
Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам).
Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).
Формула медианы
Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.
Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:
№Me – номер значения, соответствующего медиане,
N – количество значений в совокупности данных.
Тогда медиана обозначается, как
Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:
В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.
Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.
Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.
Обратимся к наглядной схеме.
Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:
где xMe — нижняя граница медианного интервала;
iMe — ширина медианного интервала;
∑f/2 — количество всех значений, деленное на 2 (два);
S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;
fMe — число наблюдений в медианном интервале.
Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.
Для примера рассчитаем медиану по следующим данным.
Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.
По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.
То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.
Расчет медианы в Excel
Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.
Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:
Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.
Ниже видеоролик о том, как рассчитать медиану в Excel.