Тема 9. Ряды распределения

Статистические ряды распределения – это первичная характеристика массовой статистической совокупности, упорядоченное разложение единиц изучаемой совокупности на группы по группировочному признаку. Любой статистический ряд распределения состоит из двух элементов:

1) отдельных значений варьирующего признака (вариантов );

2) величин, которые показывают, сколько раз повторяется данная варианта (частот ).

Примечание . Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями ; это численность ряда распределения выражается суммой частот .

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда :

1) ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака; ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются; другие формы вариационного ряда - групповые таблицы , составленные по характеру вариации значений изучаемого признака;

2) дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением, между которыми нет промежуточных значений (дискретные признаки - тарифный разряд, количество детей в семье, число работников на предприятии и т.д.); эти признаки могут принимать только конечное число определенных значений;

Дискретный ряд представляет собой групповую таблицу , которая состоит из двух граф: в первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака;

3) если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный ряд (с равными или неравными интервалами).

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение. Частоты ряда f могут заменяться частностями w , выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме (9.1):



(9.1)

При построении вариационного ряда с интервальными значениями, прежде всего, необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп n (9.2):

где R = x max - x min ; n = 1 + 3,322 lgN(формула Стерджесса ); N - общее число единиц совокупности.

Интервальные вариационные ряды могут быть построены и для признаков с дискретной вариацией. Нередко в статистическом исследовании указывать отдельное значение дискретного признака нецелесообразно, т.к. это, как правило, затрудняет рассмотрение вариации признака. Поэтому возможные дискретные значения признака распределяются по группам и подсчитываются соответствующие им частоты (частности). При построении интервального ряда по дискретному признаку границы смежных интервалов не повторяют друг друга: следующий интервал начинается со следующего по порядку (после верхнего значения предыдущего интервала) дискретного значения признака.

При сравнении частот ряда с неравными интервалами для характеристики их наполненности рассчитывают плотность распределения. Средняя плотность в интервале – это частное от деления частоты и частности на величину интервала. В первом случае плотность абсолютная, во втором – относительная. Средняя плотность показывает, сколько единиц или их процентов приходится на единицу измерения варианты. Частота, частность, плотность и накопленная частота – это различные функции от величины варианты.

В процессе анализа статистических данных , представленных рядами распределения, кроме знания о характере распределения (или структуре совокупности) могут вычисляться различные статистические показатели (числовые характеристики), которые в обобщенном виде отражают особенности распределения изучаемых признаков. Эти характеристики (показатели) могут быть разделены на 3 основные группы

1) характеристики центра распределения (средняя, мода, медиана);

2) характеристики степени вариации (вариационный размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации);

3) характеристики формы (типа) распределения (показатели эксцесса и асимметрии, ранговые характеристики, кривые распределения).

Наиболее надежный путь выявления закономерности распределения состоит в следующем:
1) увеличить количество наблюдаемых случаев (в соответствии с законом больших чисел, в таких рядах случайные отклонения от общей закономерности у индивидуальных значений будут взаимно погашаться);

2) первоначально совокупность разбить на максимальное возможное число групп, затем, постепенно сокращая число групп, оптимизировать группировку с точки зрения выявления закономерности распределения.

При реализации такого подхода закономерность, характерная для данного распределения будет выступать все более и более ясно, а ломаная линия, изображающая полигон, будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.

Ряд в статистике-цифровые данные, показывающие изменение явления во времени и простанстве и дающие возможность производить стат сравнение явлений как в процессе их развития во времени, так и по различным формам и видам процессов.

Результаты сводки и группировки материалов статнаблюдения оформляются в виде статрядов распределения и таблиц. Рядами распределения называются ряды числовых показателей, характеризующие распределение единиц изучаемой совокупности в зависимости с группировочного признака. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.

В зависимости от группировочного признака ряды распределения могут быть: 1) атрибутивными, если они образованы по качественному признаку (специальность, национальность, пол и т.п.); 2) вариационными, если они образованы по количественному признаку (срок лишения свободы, размер штраф сумма иска и т.п.).

Вариационные ряды подразделяются на два вида: дискретные и интервальные. В дискретных рядах распределение признака дается только в виде целых чисел. Например, количество обвиняемых, приходящихся на одно уголовное дело. В интервальных рядах вариация исследуемого признака дается в виде непрерывно изменяющейся величины, т.е. значение признака может быть выражено любым дробным числом. Например, сроки лишения свободы, варьирующие в пределах года (6 месяцев, 9 месяцев и пр.). Для интервальных вариационных рядов характерно, что они строятся на основе количественного признака, выражающегося в виде интервала «от... до».

Процесс развития, движения соц явлений во времени в стат принято называть динамикой. Для отображения динамики строят ряды динамики (хронологические, временные), кот представляют собой ряды изменяющихся во времени значений стат показателя, располож в хронологич порядке. Их сост элементами явл цифровые значения данного показателя или моменты времени, к кот они относятся. Разл виды рд:1.ряды абсолютных и производных показателей;2.Моментные и интервальные.

При проведении стат анализа исп метод параллельных рядов –сопоставление 2х или неск рядов, находящихся во взаимной связи друг с другом, в рез-те чего появл зависимость между ними. \\ряды дают возможность не только сравнивать изменение явления в целом, но и улавливать и выражать в цифрах направление, тенденцию такого изменения для неск видов данного явления сразу.

6. Преобразование динамических рядов (укрупнение интервалов, сглаживание, смыкание динамического ряда).

Преобразование динамических рядов осуществляется с целью выявления обшей тенденции ряда и, следовательно, общей тенденции, закономерности развития изучаемого явления.

Дело в том, что не всякий динамический ряд сразу позволяет нам обнаружить ту или иную тенденцию, поскольку часто динамические ряды получаются колеблющимися, "прыгающими", в которых показатели то растут, то снижаются.

Для выявления скрытых закономерностей, тенденций применяют различные приемы преобразования динамических рядов. Среди различных приемов преобразования динамических рядов наиболее часто применяют такие, как сглаживание, укрупнение периодов, смыкание рядов динамики.

Сглаживание (метод скользящей среднем) динамического ряда заключается в том, что конкретные показатели ряда заменяются сглаженными (скользящими средними), в результате чего обнаруживается та или иная тенденция ряда.

Укрупнение периодов динамического ряда заключается в суммировании показателей ряда за более продолжительные отрезки времени. Если, например, динамика преступности по району, городу или области представлена по месяцам, то месячные показатели можно сгруппировать (укрупнить) в квартальные, и получить новый преобразованный динамический ряд, в котором случайные "перепады" в месячных показателях нейтрализуются и выявляется та или иная тенденция ряда. Таким же образом можно квартальные показатели укрупнять (группировать) в годовые, а годовые - в показатели за 3 года, 5 лет и т.д.

Смыкание динамических рядов. К этому методу прибегают тогда, когда имеет место несопоставимость показателей ряда вследствие территориальных или иных организационных изменений.

Суть этого метода заключается в следующем. За тот период (интервал), в течение которого произошла реорганизация, определяются уровни изучаемого показателя как до, так и после реорганизации (в нашем примере это 60 и 35), которые принимаются за базу сравнения (обычно за 100%). На основе этого исчисляются относительные величины динамики до реорганизации района (показатель 60, принятый за базу 100%) и после его реорганизации (показатель 35, принятый за базу 100%).

Показатели сомкнутого динамического ряда позволяют сделать вывод о динамике разводов за весь период 1991-1997 г.г.:

тенденция роста разводов сохранилась, хотя в абсолютных цифрах, число разводов до реорганизации резко отличается от аналогичных показателей после его реорганизации.

Более простой способ решения подобного рода проблем предлагает Ю.Ф. Кардополов, который справедливо считает, что при несопоставимости показателей динамического ряда вследствие территориальных изменений следует перейти от абсолютных показателей к относительным величинам интенсивности, которые рассчитываются на один и тот же "объем" населения (на 10 тыс. человек или на 100 тыс. человек).

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

Всероссийский заочный финансово-экономический институт


Кафедра Статистики


Курсовая работа

по дисциплине Статистика

Статистические ряды распределения в изучении структуры рынка


Руководитель: Пуляшкин В.В.


Введение

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

1) Понятие статистических рядов распределения, их виды;

2) Расчет средних величин, моды и медианы и представление рядов распределения графически;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания: Работа с таблицей «Выборочные данные торговых предприятий района: товарооборот и средние товарные запасы». Предметом исследования в работе будут служить так же торговые предприятия района (каждое предприятие, из которых, со своим товарооборотом). Работа содержит расчеты всех данных по ним, так же полное описание шагов действий для достижения конечного результата (вывода).

При написании курсовой работы использовались учебники курса, дополнительная литература, Интернет-ресурсы; при работе с табличными данными - персональный компьютер конфигурации:

Процессор – ADM Sempron 28000+S754

Память – DDR 512Mb PC3200 (DDR400)

Жесткий диск – 120Gb 7200/8 Mb/SATA

Принтер – hp deskjet 3325, струйный

OC – Windows XP Professional

ППП – Microsoft Word 2002, Excel

1. Теоретическая часть

1) Понятие статистических рядов распределения и их виды


Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные):

a) дискретные;

b) интервальные.

а) Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д. В правовой статистике - это виды преступлений (убийства, грабежи, разбои); занимаемая должность лиц, совершивших административные правонарушения; образование и т.д.

Пример атрибутивных рядов распределения:


Таблица 1.Распределение преступлений в г. Москве за сутки по видам

Виды преступлений

Количество преступлений


абсолютное

в % к итогу

Убийства

Тяжкие телесные повреждения

Изнасилования

Изъятия наркотиков


В данном примере группировочным признаком выступают виды преступлений. Данный ряд распределения является атрибутивным, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число правонарушений составляют кражи 56%; далее правонарушения распределяются поровну между грабежами и случаями изъятия наркотиков (16%) и убийствами и случаями нанесения тяжких телесных повреждений (3%); разбои составили 4.5%, и наименьшее число зарегистрированных правонарушений составили изнасилования -1%.

б) Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).

Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (число раскрытых преступлений и т.д.). Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число интервалов, на которые следует разбить все единицы изучаемой совокупности.


2) Графическое изображение статистических данных


Статистический график– это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.


Таблица 2. Распределение студентов по возрасту


Расчет показателей вариации .

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:

а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:


R = Xmax – Xmin


Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

б) Среднее линейное отклонение


(7) - невзвешенное;

(8) - взвешенное,


где: Х - варианты;

`Х - средняя величина;

n - число признаков;

f - частоты.

Линейное отклонение учитывает различия всех единиц изучаемой совокупности.

в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.


(9) - невзвешенная;

(10) - взвешенная.


Показатель дисперсии более объективно отражает меру вариации на практике.

г) Среднее квадратическое отклонение


(11) - взвешенное;

(12) - невзвешенное.


Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.

д) Показатель вариации.



Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.

Расчет моды и медианы .

Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В интервальном ряду распределения мода находится по следующей формуле:



где: минимальная граница модального интервала;

Величина модального интервала;

{частоты модального интервала, предшествующего и следующего за ним

Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.

Медиана - варианта, находящаяся в середине ряда распределения.

Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.

В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:


где - варианты, находящиеся в середине ряда

В интервальном ряду распределения медиана рассчитывается следующим образом:



где: - нижняя граница медианного интервала;

Величина медианного интервала;

Полусумма частот ряда;

Сумма накопленных частот, предшествующих медианному интервалу;

Частота медианного интервала.

Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

2. Расчетная часть


По результатам 20%-ного выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.)


Таблица 1. Исходные данные

Товарооборот

Средние товарные запасы

Товарооборот

Средние товарные запасы

Цель статистического исследования - анализ совокупности предприятий по признакам Товарооборот и Средние товарные запасы , включая:

· изучение структуры совокупности по признаку Товарооборота ;

· выявление наличия корреляционной связи между признаками Товарооборота и Средними товарными запасами предприятий, установление направления связи и оценка её тесноты;

· применение выборочного метода для определения статистических характеристик генеральной совокупности фирм.

Задание 1


По исходным данным (табл. 1) необходимо выполнить следующее:

1. Построить статистический ряд распределения предприятий по товарообороту , образовав пять групп с равными интервалами.

2. Графическим методом и путем расчетов определить значения моды и медианы полученного ряда распределения.

4. Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным для интервального ряда распределения. Объяснить причину их расхождения.

Сделать выводы по результатам выполнения Задания 1.

Выполнение Задания 1

является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения фирм по признаку Товарооборот.

1. Построение интервального ряда распределения предприятий по товарообороту

Для построения интервального ряда распределения определяем величину интервала h по формуле:

,


где –наибольшее и наименьшее значения признака в исследуемой совокупности, k - число групп интервального ряда.

При заданных k = 5, x max = 795 тыс.руб. и x min = 375тыс руб.

h = тыс.руб.


При h = 5 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):


Таблица 2

Номер группы

Нижняя граница, тыс.руб.

Верхняя граница, тыс.руб


Определяем число предприятий, входящих в каждую группу, используя принцип полуоткрытого интервала [) , согласно которому предприятия со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов (459, 543, 627, и 711 тыс.руб), будем относить ко второму из смежных интервалов.

Для определения числа предприятий в каждой группе строим разработочную таблицу 3 (данные графы 4 потребуются при выполнении Задания 2).


Таблица 3. Разработочная таблица для построения интервального ряда распределения и аналитической группировки

предприятия

Товарооборот,

Средние товарные запасы,



























На основе групповых итоговых строк «Всего» табл. 3 формируем итоговую таблицу 4, представляющую интервальный ряд распределения предприятий по товарообороту.

Таблица 4. Распределение предприятий по товарообороту


Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты S j , получаемые путем последовательного суммирования частот всех предшествующих (j -1) интервалов, и накопленные частости , рассчитываемые по формуле



Таблица 5. Структура предприятий по товарообороту

Группы предприятий по товарообороту, тыс.руб.x

Число предприятий,

Накопленная частота

Накопленная частость, %

в абсолютном выражении

в % к итогу




Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по товарообороту не является равномерным: преобладают предприятия с товарооборотом от 543 тыс.руб. до 627 тыс.руб. (это 11 предприятий, доля которых составляет 36,7%); самые малочисленная группа предприятий имеет 711-795 тыс.руб.. Группа включает 3 предприятия, что составляет по 10% от общего числа фирм.

2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения фирм по изучаемому признаку.


Рис. 1.Определение моды графическим методом


Расчет конкретного значения моды для интервального ряда распределения производится по формуле:


где х Мo – нижняя граница модального интервала,

h – величина модального интервала,

f Mo – частота модального интервала,

f Mo-1 – частота интервала, предшествующего модальному,

f Mo+1 – частота интервала, следующего за модальным.

Согласно табл. 4 модальным интервалом построенного ряда является интервал 35 - 40 чел., т.к. он имеет наибольшую частоту (f 4 =10). Расчет моды:


Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный товарооборот характеризуется средней величиной 593,4 тыс. руб.

Для определения медианы графическим методом строим по данным табл. 5 кумуляту распределения предприятий по изучаемому признаку.


Рис. 2. Определение медианы графическим методом

Расчет конкретного значения медианы для интервального ряда распределения производится по формуле



где х Ме – нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

f Ме – частота медианного интервала,

S Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Определяем медианный интервал. Медианным интервалом является интервал 543-627 тыс.руб., т.к. именно в этом интервале накопленная частота S j =20 впервые превышает полусумму всех частот ().

Расчет медианы:


Вывод . В рассматриваемой совокупности предприятий половина из них имеют товарооборот не более 588,3 тыс.руб., а другая половина – не менее 588,3 тыс.руб.

3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения, σ , σ 2 , V σ на основе табл. 5 строим вспомогательную таблицу 6 (– середина интервала).

Таблица 6. Расчетная таблица для нахождения характеристик ряда распределения

Группы предприятий по товарообороту, тыс.руб.

Середина интервала,

Число предприятий,

f j





Рассчитаем среднюю арифметическую взвешенную:

Рассчитаем среднее квадратическое отклонение:

Рассчитаем дисперсию:


σ2 = 972 = 9409


Рассчитаем коэффициент вариации:

Вывод . Анализ полученных значений показателей и σ говорит о том, что средняя величина товарооборота составляет 585 тыс.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 97 тыс. руб. (или 16,5%), наиболее характерный товарооборот находится в пределах от 488 до 628 тыс. руб. (диапазон).

Значение V σ = 16,5% не превышает 33%, следовательно, вариация товарооборота в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями, Мо и Ме незначительно (=585 тыс. руб., Мо =593,4 тыс. руб., Ме =588,3 чел.), что подтверждает вывод об однородности совокупности фирм. Таким образом, найденное среднее значение среднесписочной численности менеджеров (585тыс.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

4. Вычисление средней арифметической по исходным данным о среднесписочной численности менеджеров фирм

Для расчета применяется формула средней арифметической простой:



Причина расхождения средних величин, рассчитанных по исходным данным (17550 тыс. руб.) и по интервальному ряду распределения (17670 тыс. руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти фирм, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении товарооборота внутри каждой группы интервального ряда.

Задание 2


По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

1. Установить наличие и характер корреляционной связи между признаками товарооборот и средние товарные запасы , образовав шесть групп с равными интервалами по каждому из признаков, используя методы:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение .

Сделать выводы по результатам выполнения задания 2.

Выполнение задания 2

Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.

По условию Задания 2 факторным является признак товарооборот , результативным – признак средние товарные запасы .

1. Установление наличия и характера корреляционной связи между признаками товарооборотом и средними товарными запасами методами аналитической группировки и корреляционных таблиц

1а. Применение метода аналитической группировки

Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y . Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х - товарооборот и результативным признаком Y средние товарные запасы . Макет аналитической таблицы имеет следующий вид (табл. 7):


Таблица 7. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j


ИТОГО


Групповые средние значения получаем из таблицы 3, основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8:


Таблица 8. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы

Группы предприятий по

товарообороту, тыс. руб.

x

Число предприятий,

f j

Средние товарные запасы, тыс. руб.

в среднем на одно предприятие,

Вывод. Анализ данных табл. 8 показывает, что с увеличением товарооборота от группы к группе систематически возрастает и средний товарный запас по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

1б. Применение метода корреляционных таблиц

Корреляционная таблица строится как комбинация двух рядов распределения по факторному признаку Х и результативному признаку Y . На пересечении j -ой строки и k -ой графы таблицы указывается число единиц совокупности, входящих в j -ый интервал по признаку X и в k -ый интервал по признаку Y . Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками - прямой или обратной. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему, обратная - по диагонали от правого верхнего угла к левому нижнему.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y . Для факторного признака Х Товарооборот эти величины известны из табл. 4 Определяем величину интервала для результативного признака Y средние товарные запасы при k = 5 , у max = 301 тыс. руб., у min = 150 тыс. руб.:


Границы интервалов ряда распределения результативного признака Y имеют вид:

Таблица 9

Номер группы

Нижняя граница, Тыс. руб.

Верхняя граница, Тыс. руб.


Подсчитывая для каждой группы число входящих в нее фирм с использованием принципа полуоткрытого интервала [) , получаем интервальный ряд распределения результативного признака (табл. 10).


Таблица 10. Интервальный ряд распределения фирм по объёму продаж


Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).


Таблица 11. Корреляционная таблица зависимости объема продаж от среднесписочной численности менеджеров

Группы предприятий по товарообороту, тыс. руб.


Группы предприятий по среднему товарному запасу, тыс. руб.















Вывод . Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднесписочной численностью менеджеров и объемом продаж фирмами.

2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения

Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии:

где – общая дисперсия признака Y ,

– межгрупповая (факторная) дисперсия признака Y .

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных ) и вычисляется по формуле


где y i – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле



где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета показателей и необходимо знать величину общей средней , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:

Значения числителя и знаменателя формулы имеются в табл. 8. Используя эти данные, получаем общую среднюю:

228 тыс. руб.


Для расчета общей дисперсии применяется вспомогательная таблица 12.


Таблица 12. Вспомогательная таблица для расчета общей дисперсии

предприятия

Средние товарные запасы, тыс.руб.


Рассчитаем общую дисперсию:



Для расчета межгрупповой дисперсии строится вспомогательная таблица 13, При этом используются групповые средние значения из табл.

Таблица 13ю Вспомогательная таблица для расчета межгрупповой дисперсии

Группы предприятий

по товарообороту,

тыс. руб. x

Число предприятий,

f j

Среднее значение в группе,




Рассчитаем межгрупповую дисперсию:


Определяем коэффициент детерминации:


Вывод. 81% вариации объёма продаж товаров фирмами обусловлено вариацией среднесписочной численности менеджеров по продажам, а 19% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

Рассчитаем показатель:


Вывод : согласно шкале Чэддока связь между товарооборотом и средними товарными запасами предприятий является весьма тесной.

Задание 3


По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:

1) ошибку выборки для средней величины товарооборота торгового предприятия, а также границы, в которых будет находиться генеральная средняя.

2) ошибку выборки доли торговых предприятий с объемом товарооборота 627 и более тыс. руб., а также границы, в которых будет находиться генеральная доля фирм.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности предприятий района границ, в которых будут находиться средняя величина товарооборота, и доля предприятий с товарооборотом не менее 627 тыс. руб.

1. Определение ошибки выборки для величины товарооборота, а также границ, в которых будет находиться генеральная средняя

Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные харак- теристики, как правило, не совпадают, а отклоняются на некоторую величину ε .

Принято вычислять два вида ошибок выборки - среднюю и предельную .

Для расчета средней ошибки выборки применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка для выборочной средней определяется по формуле


где – общая дисперсия изучаемого признака,

N

n

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:



где – выборочная средняя,

– генеральная средняя.

Предельная ошибка выборки кратна средней ошибке с коэффициентом кратности t (называемым также коэффициентом доверия):

Коэффициент кратности t зависит от значения доверительной вероятности Р , гарантирующей вхождение генеральной средней в интервал, называемый доверительным интервалом .

Наиболее часто используемые доверительные вероятности Р и соответствующие им значения t задаются следующим образом (табл. 14):

Таблица 14


По условию Задания 2 выборочная совокупность насчитывает 30 фирм, выборка 20% механическая, следовательно, генеральная совокупность включает 150 фирм . Выборочная средняя, дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 15:


Таблица 15



Рассчитаем среднюю ошибку выборки:


Рассчитаем предельную ошибку выборки:



Определим доверительный интервал для генеральной средней:



Вывод. На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности предприятий средняя величина товарооборота находится в пределах от 553 до 616 тыс. руб.

2. Определение ошибки выборки для доли фирм товарооборотом 627 тыс. руб. и более, а также границ, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой



где m – число единиц совокупности, обладающих заданным свойством;

n – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле



где w – доля единиц совокупности, обладающих заданным свойством;

(1- w ) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:


По условию Задания 3 исследуемым свойством фирм является равенство или превышение товарооборота величины 627 тыс. руб .

Число предприятий с данным свойством определяется из табл. 3: m=7

Рассчитаем выборочную долю:

Рассчитаем предельную ошибку выборки для доли:

Определим доверительный интервал генеральной доли:


Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий района доля предприятий с товарооборотом 627 тыс. руб. и более будет находиться в пределах от 18% до 48,5%.

Задание 4


Имеются данные о продаже товара А на трех городских рынках:


Таблица 16

Базисный период

Отчетный период

Продано, т

Изменение цены, %

Индекс физического объема(q 1)

Без изменений


Определите:

2. Абсолютное изменение средней цены товара в результате влияния отдельных факторов.


Таблица 17



Базисный период

Отчетный период

Расчетные графы

Средняя цена за 1 кг., руб. (р 0)

Продано, т

Изменение цены, %

Индекс физического объема (q 1)









Вычислим индекс цен переменного состава:


Из таблицы видно, что цена продукции на каждом рынке в отчетном периоде по сравнению с базисным изменилась. В целом же средняя цена выросла на 4 % .Это объясняется влиянием изменений структуры реализации продукции по торговым городским рынкам. В базисном периоде по более низкой цене продавали продукцию меньше, чем в отчетном периоде по более высокой цене.

Рассчитываем индекс структурных сдвигов:



Первая часть приведенной формулы позволяет ответить на вопрос, какой была бы средняя цена в отчетном периоде. Вторая часть формулы отражает фактическую среднюю цену базисного периода.

Рассчитанный индекс показал, что за счет структурных сдвигов цены значительно не изменились.

Определим индекс фиксированного или постоянного состава, который не учитывает изменения структуры продаж:



Индекс цен фиксированного состава равен 104,1%, что позволяет сделать следующий вывод: если бы структура продаж продукции на городских рынках не изменилась, средняя цена возросла бы на 4,1%., что и произойдет в дальнейшем.

Между данными индексами существует следующая взаимосвязь:


Ip фс * I cc т = Ip пс;

1,041 * 0,99 =1,040


Определим абсолютное изменение средней цены товара в результате влияния отдельных факторов:


D pq = åp 1 q 1 - å p 0 q 0

D pq = 141407,9 – 134400 =7008 руб.

Заключение


Статистические ряды распределения являются базисным методом для любого статистического анализа.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.

Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.

Статистические методы используют комплексно. Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интепретация статистической информации.

Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.

Литература

1. Статистика: Учеб. пособие/А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры.- М.: Финансы и статистика, 2005.

2. Громыко Г.Л. Теория статистики: Учебник. - М.: ИНФРА-М, 2006.

3. Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры. - М.: Финстатинформ, 1999.

4. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ - ДАНА, 2001.

5. Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.

6. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник / Под. ред. Башиной О.Э., Спирина А.А. – М.: Финансы и статисика, 2005.

7. Практикум по теории статистики: Учебное пособие/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2004.

8. Теория статистики: Учебник/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2001; 2003; 2006.

9. http://www.gks.ru


Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Описание изменений варьирующего признака осуществляется с помощью рядов распределения.

Статистический ряд распределения - это упорядоченное распределение единиц статистической совокупности на отдельные группы по определенному варьирующему признаку.

Статистические ряды, построенные по качественному признаку называют атрибутивными . Если в основе ряда распределения лежит количественный признак, то ряд является вариационным .

В свою очередь вариационные ряды делят на дискретные и интервальные. В основе дискретного ряда распределения лежит дискретный (прерывный) признак, принимающий конкретные числовые значения (число правонарушений, число обращений граждан за юридической помощью). Интервальный ряд распределения строится на основе непрерывного признака, который может принимать любые значения из заданного диапазона (возраст осужденного, срок лишения свободы и т.д.)

Любой статистический ряд распределения содержит два обязательных элемента – варианты ряда и частоты. Варианты (x i ) – отдельные значения признака, которые он принимает в ряду распределения. Частоты (f i ) – это числовые значения, показывающие сколько раз встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности.

Частоты, выраженные в относительных единицах (долях или процентах) называются частостями (w i ). Сумма частостей равна единице, если Частости выражены в долях единицы, или 100, если они выражаются в процентах. Использование частостей позволяет производить сравнение вариационных рядов с разным объемом совокупности. Частости определяются по следующей формуле:

Для построения дискретного ряда ранжируются все встречающиеся в ряду индивидуальные значения признака, а затем подсчитываются частоты повторений каждого значения. Оформляется ряд распределения в идее таблицы, состоящей из двух строк и столбцов, в одной из которых приводятся значения вариантов ряда x i , во второй – значения частот f i .

Рассмотрим пример построения дискретного вариационного ряда.

Пример 3.1 . По данным УМВД зарегистрировано преступлений, совершенных в городе N несовершеннолетними в возрасте.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Построить дискретный ряд распределения.

Решение .

Сначала необходимо проранжировать данные о возрасте несовершеннолетних, т.е. записать их в порядке возрастания.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Таблица 3.1

Таким образом, частоты отображают количество человек данного возраста, например, 5 человек имеют возраст 13 лет, 8 человек – 14 лет, и т.д.

Построение интервальных рядов распределения осуществляют аналогично выполнению равноинтервальной группировки по количественному признаку, то есть вначале определяют оптимальное число групп, на которые будет разбита совокупность, устанавливаются границы интервалов по группам и подсчитываются частоты.

Проиллюстрируем построение интервального ряда распределения на следующем примере.

Пример 3.2 .

Построить интервальный ряд по следующей статистической совокупности – заработной плате юриста в конторе, тыс. руб.:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Решение.

Примем оптимальное количество групп равноинтервальной группировки для данной статистической совокупности, равное 4 (у нас 16 вариантов). Следовательно, численность каждой группы равна:

а величина каждого интервала будет равна:

Границы интервалов определяем по формулам:

,

где - соответственно нижняя и верхняя границы i-го интервала.

Опуская промежуточные вычисления границ интервалов, заносим их значения (варианты) и количество юристов (частоты), имеющих з/п в пределах каждого интервала, в таблицу 3.2, которая и иллюстрирует полученный интервальный ряд.

Таблица 3.2

Анализ статистических рядов распределения может производиться с использованием графического метода. Графическое представление рядов распределения позволяет наглядно проиллюстрировать закономерности распределения исследуемой совокупности путем ее изображения в виде полигона, гистограммы и кумуляты. Остановимся на каждом из перечисленных графиков.

Полигон – ломаная, отрезки которой соединяют точки с координатами (x i ;f i ). Обычно полигон используют для изображения дискретных рядов распределения. Для его построения на оси абсцисс откладывают ранжированные индивидуальные значения признака x i , на оси ординат – соответствующие этим значениям частоты. В результате, соединив отрезками точки, соответствующие данным, отмеченным по осям абсцисс и ординат, получают ломаную, называемую полигоном. Приведем пример построения полигона частот.

Для иллюстрации построения полигона возьмем результат решения примера 3.1 на построение дискретного ряда – рисунок 1. По оси абсцисс отложен возраст осужденных, по оси ординат – количество несовершеннолетних осужденных, имеющих данный возраст. Анализируя данный полигон, можно сказать, что наибольшее количество осужденных – 14 человек, имеют возраст 15 лет.

Рисунок 3.1 – Полигон частот дискретного ряда.

Полигон можно построить и для интервального ряда, в этом случае по оси абсцисс откладывают середины интервалов, а по оси ординат – соответствующие им частоты.

Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы значения признака, а высоты равны соответствующим частотам. Гистограмма применяется только для изображения интервальных рядов распределения. Если интервалы являются неравными, то для построения гистограммы на оси ординат откладывают не частоты, а отношение частоты к ширине соответствующего интервала. Гистограмму можно преобразовать в полигон распределения, если середины ее столбиков соединить между собой отрезками.

Для иллюстрации построения гистограммы возьмем результаты построения интервального ряда из примера 3.2– рисунок 3.2.

Рисунок 3.2 – Гистограмма распределения заработной платы юристов.

Для графического изображения вариационных рядов также используют кумуляту. Кумулята – кривая, изображающая ряд накопленных частот и соединяющая точки с координатами (x i ;f i нак ). Накопленные частоты вычисляются последовательным суммированием всех частот ряда распределения и показывают число единиц совокупности, имеющих значение признака не больше, чем указанное. Проиллюстрируем вычисление накопленных частот для вариационного интервального ряда, представленного в примере 3.2 – таблица 3.3.

Таблица 3.3

Для построения кумуляты дискретного ряда распределения по оси абсцисс откладывают ранжированные индивидуальные значения признака, а по оси ординат – соответствующие им накопленные частоты. При построении кумулятивной кривой интервального ряда первая точка будет иметь абсциссу, равную нижней границе первого интервала, а ординату, равную 0. Все последующие точки должны соответствовать верхним граница интервалов. Построим кумуляту, используя данные таблицы 3.3 – рисунок 3.3.

Рисунок 3.3 – Кумулятивная кривая распределения заработной платы юристов.

Контрольные вопросы

1. Понятие статистического ряда распределения, его основные элементы.

2. Виды статистических рядов распределения. Их краткая характеристика.

3. Дискретные и интервальные ряды распределения.

4. Методика построения дискретных рядов распределения.

5. Методика построения интервальных рядов распределения.

6. Графическое изображение дискретных рядов распределения.

7. Графическое изображение интервальных рядов распределения.

Задачи

Задача 1 . Имеются следующие данные об успеваемости 25 студен­тов группы по ТГП в сессию: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Постройте дискретный вариационный ряд распределения студентов по баллам оценок, получен­ных в сессию. Для полученного ряда рассчитайте Частости, накопленные Частости, накопленные частоты. Сделайте выводы.

Задача 2 . В колонии содержатся 1000 осужденных, их распределение по возрасту представлено в таблице:

Изобразите данный ряд графически. Сделайте выводы.

Задача 3 . Имеются следующие данные о сроках лишения свободы заключенных:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Постройте интервальный ряд распределения заключенных по срокам лишения свободы. Сделайте выводы.

Задача 4 . Имеются следующие данные о распределении осужденных в области за изучаемый период по возрастным группам:

Изобразите данный ряд графически, сделайте выводы.