КОНТРОЛЬНАЯ РАБОТА

На тему: "Мода. Медиана. Способы их расчета"


Введение

Средние величины и связанные с ними показатели вариации играют в статистике очень большую роль, что обусловлено предметом ее изучения. Поэтому данная тема является одной из центральных в курсе.

Средняя является очень распространенным обобщающим показателям в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку. Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку. Средняя показывает уровень этого признака, отнесенный к единице совокупности.

Изучая общественные явления и стремясь выявить их характерные, типичные черты в конкретных условиях места и времени, статистики широко используют средние величины. С помощью средних можно сравнивать между собой различные совокупности по варьирующим признакам.

Средние, которые применяются в статистике, относятся к классу степенных средних. Из степенных средних наиболее часто применяется средняя арифметическая, реже – средняя гармоническая; средняя гармоническая применяется только при исчислении средних темпов динамики, а средняя квадратическая – только при исчислении показателей вариации.

Средняя арифметическая есть частное от деления суммы вариант на их число. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных ее единиц. Средняя арифметическая – наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.

По своему определяющему свойству средняя гармоническая должна применяться тогда, когда общий объем признака образуется как сумма обратных значений вариант. Ее применяют тогда, когда в зависимости от имеющего материала веса приходиться не умножать, а делить на варианты или, что то же самое, умножать на обратное их значение. Средняя гармоническая в этих случаях – это величина обратная средней арифметической из обратных значений признака.

К средней гармонической следует прибегать в тех случаях, когда в качестве весов применяются не единицы совокупности – носители признака, а произведения этих единиц на значение признака.


1. Определение моды и медианы в статистике

Средние арифметическая и гармоническая являются обобщающими характеристиками совокупности по тому или иному варьирующему признаку. Вспомогательными описательными характеристиками распределения варьирующего признака являются мода и медиана.

Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

Медианной в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

Мода и медиана в отличии от степенных средних являются конкретными характеристиками, их значение имеет какая-либо конкретная варианта в вариационном ряду.

Мода применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака. Если надо, например, узнать наиболее распространенный размер заработной платы на предприятии, цену на рынке, по которой было продано наибольшее количество товаров, размер ботинок, пользующийся наибольшим спросом у потребителей, и т.д., в этих случаях прибегают к моде.

Медиана интересна тем, что показывает количественную границу значение варьирующего признака, которую достигла половина членов совокупности. Пусть средняя заработная плата работников банка составила 650000 руб. в месяц. Эта характеристика может быть дополнена, если мы скажем, что половина работников получила заработную плату 700000 руб. и выше, т.е. приведем медиану. Мода и медиана являются типичными характеристиками в тех случаях, когда взяты совокупности однородные и большой численности.


2. Нахождение моды и медианы в дискретном вариационном ряду

Найти моду и медиану в вариационном ряду, где значения признака заданы определенными числами, не представляет большой трудности. Рассмотрим таблицу 1. с распределение семей по числу детей.

Таблица 1. Распределение семей по числу детей

Очевидно, в этом примере модой будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей. Могут быть распределения, где все варианты встречаются одинаково часто, в этом случае моды нет или, иначе, можно сказать, что все варианты одинаково модальны. В других случаях не одна, а две варианты могут быть наибольшей частоты. Тогда будет две моды, распределение будет бимодальным. Бимодальные распределения могут указывать на качественную неоднородность совокупности по исследуемому признаку.

Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному результату добавить ½. Так, в распределении 185 семьи по числу детей медианой будет: 185/2 + ½ = 93, т.е. 93-я варианта, которая делит упорядоченный ряд пополам. Каково же значение 93-ей варианты? Для того чтобы это выяснить, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 40. Ясно, что здесь 93 варианты нет. Если прибавить к 40 частоту 3-й варианты, то получим сумму, равную 40 + 75 = 115. Следовательно, 93-я варианта соответствует третьему значению варьирующего признака, и медианой будет семья, имеющая двоих детей.

Мода и медиана в данном примере совпали. Если бы у нас была четная сумма частот (например, 184), то, применяя указанную выше формулу, получим номер медианной варианты, 184/2 + ½ =92,5. Поскольку варианты с дробным номером не существует, полученный результат указывает, что медиана находится посередине между 92 и 93 вариантами.

3. Расчет моды и медианы в интервальном вариационном ряду

Описательный характер моды и медианы связан с тем, что в них не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Поэтому мода и медиана не требуют для своего нахождения расчетов, если известны все значения признака. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.

Для расчета определенного значения модальной величины признака, заключенного в интервале, применяют формулу:

М о = Х Мо + i Мо *(f Мо – f Мо-1)/((f Мо – f Мо-1) + (f Мо – f Мо+1)),

Где Х Мо – минимальная граница модального интервала;

i Мо – величина модального интервала;

f Мо – частота модального интервала;

f Мо-1 – частота интервала, предшествующего модальному;

f Мо+1 – частота интервала, следующего за модальным.

Покажем расчет моды на примере, приведенном в таблице 2.


Таблица 2. Распределение рабочих предприятия по выполнению норм выработки

Чтобы найти моду, первоначально определим модальный интервал данного ряда. Из примера видно, что наибольшая частота соответствует интервалу, где варианта лежит в пределах от 100 до 105. Это и есть модальный интервал. Величина модального интервала равна 5.

Подставляя числовые значения из таблицы 2. в указанную выше формулу, получим:

М о = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Смысл этой формулы заключается в следующем: величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 100 прибавляем 8,8, т.е. больше половины интервала, потому что частота предшествующего интервала меньше частоты последующего интервала.

Исчислим теперь медиану. Для нахождения медианы в интервальном вариационном ряду определяем сначала интервал, в котором она находится (медианный интервал). Таким интервалом будет такой, комулятивная частота которого равна или превышает половину суммы частот. Комулятивные частоты образуются путем постепенного суммирования частот, начиная от интервала с наименьшим значением признака. Половина суммы частот у нас равна 250 (500:2). Следовательно, согласно таблицы 3. медианным интервалом будет интервал со значением заработной платы от 350000 руб. до 400000 руб.

Таблица 3. Расчет медианы в интервальном вариационном ряду

До этого интервала сумма накопленных частот составила 160. Следовательно, чтобы получить значение медианы, необходимо прибавить еще 90 единиц (250 – 160).

Функция МЕДИАНА в Excel используется для анализа диапазона числовых значений и возвращает число, которое является серединой исследуемого множества (медианой). То есть, данная функция условно разделяет множество чисел на два подмножества, первое из которых содержит числа меньше медианы, а второе – больше. Медиана является одним из нескольких методов определения центральной тенденции исследуемого диапазона.

Примеры использования функции МЕДИАНА в Excel

При исследовании возрастных групп студентов использовались данные случайно выбранной группы учащихся в ВУЗе. Задача – определить срединный возраст студентов.

Исходные данные:

Формула для расчета:


Описание аргумента:

  • B3:B15 – диапазон исследуемых возрастов.

Полученный результат:

То есть в группе есть студенты, возраст которых меньше 21 года и больше этого значения.



Сравнение функций МЕДИАНА и СРЗНАЧ для вычисления среднего значения

Во время вечернего обхода в больнице каждому больному была замерена температура тела. Продемонстрировать целесообразность использования параметра медиана вместо среднего значения для исследования ряда полученных значений.

Исходные данные:

Формула для нахождения среднего значения:

Формула для нахождения медианы:

Как видно из показателя среднего значения, в среднем температура у пациентов выше нормы, однако это не соответствует действительности. Медиана показывает, что как минимум у половины пациентов наблюдается нормальная температура тела, не превышающая показатель 36,6.

Внимание! Еще одним методом определения центральной тенденции является мода (наиболее часто встречающееся значение в исследуемом диапазоне). Чтобы определить центральную тенденцию в Excel следует использовать функцию МОДА. Обратите внимание: в данном примере значения медианы и моды совпадают:

То есть срединная величина, делящая одно множество на подмножества меньших и больших значений также является и наиболее часто встречающимся значением в множестве. Как видно, у большинства пациентов температура составляет 36,6.

Пример расчета медианы при статистическом анализе в Excel

Пример 3. В магазине работают 3 продавца. По результатам последних 10 дней необходимо определить работника, которому будет выдана премия. При выборе лучшего работника учитывается степень эффективности его работы, а не число проданных товаров.

Исходная таблица данных:


Для характеристики эффективности будем использовать сразу три показателя: среднее значение, медиана и мода. Определим их для каждого работника с использованием формул СРЗНАЧ, МЕДИАНА и МОДА соответственно:


Для определения степени разброса данных используем величину, которая является суммарным значением модуля разницы среднего значения и моды, среднего значения и медианы соответственно. То есть коэффициент x=|av-med|+|av-mod|, где:

  • av – среднее значение;
  • med – медиана;
  • mod – мода.

Рассчитаем значение коэффициента x для первого продавца:

Аналогично проведем расчеты для остальных продавцов. Полученные результаты:


Определим продавца, которому будет выдана премия:

Примечание: функция НАИМЕНЬШИЙ возвращает первое минимальное значение из рассматриваемого диапазона значений коэффициента x.


Коэффициент x является некоторой количественной характеристикой стабильности работы продавцов, которую ввел экономист магазина. С его помощью удалось определить диапазон с наименьшими отклонениями значений. Этот способ демонстрирует, как можно использовать сразу три метода определения центральной тенденции для получения наиболее достоверных результатов.

Особенности использования функции МЕДИАНА в Excel

Функция имеет следующий синтаксис:

МЕДИАНА(число1; [число2];...)

Описание аргументов:

  • число1 – обязательный аргумент, характеризующий первое числовое значение, содержащееся в исследуемом диапазоне;
  • [число2] – необязательный второй (и последующие аргументы, всего до 255 аргументов), характеризующий второе и последующие значения исследуемого диапазона.

Примечания 1:

  1. При расчетах удобнее передавать сразу весь диапазон исследуемых значений вместо последовательного ввода аргументов.
  2. В качестве аргументов принимаются данные числового типа, имена, содержащие числа, данные ссылочного типа и массивы (например, =МЕДИАНА({1;2;3;5;7;10})).
  3. При расчете медианы учитываются ячейки, содержащие пустые значения или логические ИСТИНА, ЛОЖЬ, которые будут интерпретированы как числовые значения 1 и 0 соответственно. Например, результат выполнения функции с логическими значениями в аргументах (ИСТИНА;ЛОЖЬ) эквивалентен результату выполнения с аргументами (1;0) и равен 0,5.
  4. Если один или несколько аргументов функции принимают текстовые значения, которые не могут быть преобразованы в числовые, или содержат коды ошибок, результатом выполнения функции будет код ошибки #ЗНАЧ!.
  5. Для определения медианы выборки могут быть использованы другие функции Excel: ПРОЦЕНТИЛЬ.ВКЛ, КВАРТИЛЬ.ВКЛ, НАИБОЛЬШИЙ Примеры использования:
  • =ПРОЦЕНТИЛЬ.ВКЛ(A1:A10;0,5), поскольку по определению медиана – 50-я процентиль.
  • =КВАРТИЛЬ.ВКЛ(A1:A10;2), так как медиана – 2-я квартиль.
  • =НАИБОЛЬШИЙ(A1:A9;СЧЁТ(A1:A9)/2), но только если количество чисел в диапазоне является нечетным числом.

Примечания 2:

  1. Если в исследуемом диапазоне все числа распределены симметрично относительно среднего значения, среднее арифметическое и медиана для данного диапазона будут эквивалентны.
  2. При больших отклонениях данных в диапазоне («разбросе» значений) медиана лучше отражает тенденцию распределения значений, чем среднее арифметическое. Отличным примером является использование медианы для определения реального уровня зарплат у населения государства, в котором чиновники получают на порядок больше обычных граждан.
  3. Диапазон исследуемых значений может содержать:
  • Нечетное количество чисел. В этом случае медианой будет являться единственное число, разделяющее диапазон на два подмножества больших и меньших значений соответственно;
  • Четное количество чисел. Тогда медиана вычисляется как среднее арифметическое для двух числовых значений, разделяющих множество на два указанных выше подмножества.

Соблюдение Вашей конфиденциальности важно для нас. По этой причине, мы разработали Политику Конфиденциальности, которая описывает, как мы используем и храним Вашу информацию. Пожалуйста, ознакомьтесь с нашими правилами соблюдения конфиденциальности и сообщите нам, если у вас возникнут какие-либо вопросы.

Сбор и использование персональной информации

Под персональной информацией понимаются данные, которые могут быть использованы для идентификации определенного лица либо связи с ним.

От вас может быть запрошено предоставление вашей персональной информации в любой момент, когда вы связываетесь с нами.

Ниже приведены некоторые примеры типов персональной информации, которую мы можем собирать, и как мы можем использовать такую информацию.

Какую персональную информацию мы собираем:

  • Когда вы оставляете заявку на сайте, мы можем собирать различную информацию, включая ваши имя, номер телефона, адрес электронной почты и т.д.

Как мы используем вашу персональную информацию:

  • Собираемая нами персональная информация позволяет нам связываться с вами и сообщать об уникальных предложениях, акциях и других мероприятиях и ближайших событиях.
  • Время от времени, мы можем использовать вашу персональную информацию для отправки важных уведомлений и сообщений.
  • Мы также можем использовать персональную информацию для внутренних целей, таких как проведения аудита, анализа данных и различных исследований в целях улучшения услуг предоставляемых нами и предоставления Вам рекомендаций относительно наших услуг.
  • Если вы принимаете участие в розыгрыше призов, конкурсе или сходном стимулирующем мероприятии, мы можем использовать предоставляемую вами информацию для управления такими программами.

Раскрытие информации третьим лицам

Мы не раскрываем полученную от Вас информацию третьим лицам.

Исключения:

  • В случае если необходимо - в соответствии с законом, судебным порядком, в судебном разбирательстве, и/или на основании публичных запросов или запросов от государственных органов на территории РФ - раскрыть вашу персональную информацию. Мы также можем раскрывать информацию о вас если мы определим, что такое раскрытие необходимо или уместно в целях безопасности, поддержания правопорядка, или иных общественно важных случаях.
  • В случае реорганизации, слияния или продажи мы можем передать собираемую нами персональную информацию соответствующему третьему лицу – правопреемнику.

Защита персональной информации

Мы предпринимаем меры предосторожности - включая административные, технические и физические - для защиты вашей персональной информации от утраты, кражи, и недобросовестного использования, а также от несанкционированного доступа, раскрытия, изменения и уничтожения.

Соблюдение вашей конфиденциальности на уровне компании

Для того чтобы убедиться, что ваша персональная информация находится в безопасности, мы доводим нормы соблюдения конфиденциальности и безопасности до наших сотрудников, и строго следим за исполнением мер соблюдения конфиденциальности.

Краткая теория

Наиболее широкое применение в статистике имеют структурные средние, к числу которых относятся мода и медиана (непараметрические средние).

Мода - величина признака (варианта), которая встречается в ряду распределения с наибольшей частотой (весом). К моде (Мо) прибегают для выявления величины признака, имеющей наибольшее распространение (цена на рынке, по которой было совершено наибольшее число продаж данного товара, номер обуви, который пользуется наибольшим спросом у покупателей и т. д.). Мода используется только в совокупностях большой численности. В дискретном ряду мода находится как варианта, имеющая наибольшую частоту. В интервальном ряду сначала находится модальный интервал, то есть интервал, обладающий наибольшей частотой, а затем – приближенное значение модальной величины признака по формуле:

– нижняя граница модального интервала

- величина модального интервала

– частота интервала, предшествующего модальному

– частота модального интервала

– частота интервала, следующего за модальным

Квантили - величины, разделяющие совокупность на определенной количество равных по численности элементов частей. Самый известный квантиль – медиана, делящая совокупность на две равные части. Кроме медианы часто используются квартили, делящие ранжированный ряд на 4 равные части, децили -10 частей и перцентили - на 100 частей.

Медиана - величина признака у единицы, находящейся в середине ранжированного (упорядоченного) ряда. Если ряд распределения представлен конкретными значениями признака, то медиана (Me) находится как серединное значение признака.

Если ряд распределения дискретный, то медиана находится как серединное значение признака (например, если число значений нечетное – 45, то соответствует 23 значению признака в ряду значений, расположенных в порядке возрастания, если число значений четное – 44, то медиана соответствует полусумме 22 и 23 значений признака).

Если ряд распределения интервальный, то первоначально находят медианный интервал, который содержит единицу, находящуюся в середине ранжированного ряда. Для определения этого интервала сумму частот делят пополам и на основании последовательного накопления (суммирования) частот интервалов, начиная с первого, находят интервал, где расположена медиана. Значение медианы в интервальном ряду вычисляют по формуле:

- нижняя граница медианного интервала

- величина медианного интервала

Сумма частот ряда

– сумма накопленных частот в интервалах, предшествующих медианному

– частота медианного интервала

Квартили - это значения признака в ранжированном ряду, выбранные таким образом, что 25% единиц совокупности будут меньше величины , 25% единиц будут заключены между и ; 25% - между и , остальные 25% превосходят . Квартили определяются по формулам, аналогичным формуле для расчета медианы. Для интервального ряда:

Децилем называется структурная переменная, делящая распределение на 10 равных частей по числу единиц в совокупности. Децилей 9, а децильных групп 10. Децили определяются по формулам, аналогичным формуле для расчета медианы и квартилей.

В целом общая формула для расчета квантилей в интервальном ряду такова:

– порядковый номер квантиля

– размерность квантиля (на сколько частей эти квартили делят совокупность)

– нижняя граница квантильного интервала

– ширина квантильного интервала

Накопленная частота предквантильного интервала

Для дискретного ряда номер квантиля можно найти по формуле:

Пример решения задачи

Условие задачи 1 (дискретный ранжированный ряд)

В результате исследований установлен среднемесячный доход жильцов одного подъезда:

Определите:

Модальный и медианный доход, квантили и децили дохода.

Решение задачи

Имеем уже ранжированный ряд - значения дохода жильцов распределены по возрастанию.

Мода - наиболее часто встречающееся значение. В данном случае имеем ряд с двумя модами.

Медиана - такое значение признака, которое делит упорядоченное множество данных пополам.

Квартили - значения признака в ранжированном ряду, выбранные таким образом, что 25% единиц совокупности будут меньше величины ; 25% единиц будут заключены между и ; 25% - между и ; остальные 25% превосходят .

Дицили делят ряд на 10 равных частей:

Если вам сейчас не требуется помощь, но может потребоваться в дальнейшем, то, чтобы не потерять контакт, вступайте в группу ВК .

Условие задачи 2 (интервальный ряд)

Для определения среднего размера вклада в кредитном учреждении были получены следующие данные:

Рассчитайте структурные средние (моду, медиану, квартили).

Решение задачи

Вычислим моду размера вклада:

Мода - варианта, которой соответствует наибольшая частота.

Мода вычисляется по формуле:

Начало модального интервала

Величина интервала

Частота модального интервала

Частота интервала, предшествующего модальному

Частота интервала, следующего за модальным

Таким образом, наибольшее количество вкладов имеют размер 30,7 тыс.р.

Медиана - варианта, находящаяся в середине ряда распределения.

Расчет медианы производится по формуле:

Начало (нижняя граница) медианного интервала

Величина интервала

Сумма всех частот ряда

Частота медианного интервала

Сумма накопленных частот вариантов до медианного

Таким образом, половина вкладов имеет размер до 28 тыс.р., другая половина - более 28 тыс.р.

Вычислим квантили:

Таким образом 25% вкладов меньше 20,8 тыс.р., 25% вкладов лежат в интервале от 20,8 тыс.р. до 28 тыс.р., 25% лежат в интервале от 28 тыс.р. до 33 тыс.р., 25% больше величины в 33 тыс.р.

Условие задачи 3

Постройте графики для вариационного ряда. На графике покажите моду, медиану, среднюю, квартили.

Решение задачи 3

Вычислим среднюю : Для этого просуммируем произведения середин интервалов и соответствующих частот, и полученную сумму разделим на сумму частот.

что такое медиана набора чисел? и как найти медиану 13, 19, 24, 17, 15, 11 ??? и получил лучший ответ

Ответ от Ўлия Деркач[гуру]
Медианой набора чисел называется такое число, которое разделяет набор на две равные по численности части. Вместо “медиана” можно было бы сказать “середина”.
1. Нужно написать числа в порядке возрастания (составить ранжированный ряд)
11,13,15,17,19,24
2. Одновременно зачеркиваем “самое большое” и “самое маленькое” числа данного набора чисел до тех пор пока не останется одно число или два числа.
3. Если осталось одно число, то оно и есть медиана.
4. Если осталось два числа, то медианой будет среднее арифметическое двух оставшихся чисел.
Ме= 15+17/2=16

Ответ от A.R.E. R.U. [активный]
Расположи их в порядке возрастания. То, что посередине и будет медианой.
Если их четное количество (как в твоем случае) , то медианой будет среднее арифметическое 2-х серединных чисел.
11, 13, 15, 17, 19, 24
(15+17)/2=16.


Ответ от Пользователь удален [эксперт]
расположи числа по порядку и в середине ряда будет твоя "медиана" обычно дают нечетное число чисел...а у тебя их 6?


Ответ от 3 ответа [гуру]

Привет! Вот подборка тем с ответами на Ваш вопрос: что такое медиана набора чисел? и как найти медиану 13, 19, 24, 17, 15, 11 ???