Анализ вариационных рядов.

💖 Нравится? Поделись с друзьями ссылкой

​ Вариационный ряд – ряд, в котором сопоставлены (по степени возрастания или убывания) варианты и соответствующие им частоты

​Варианты – отдельные количественные выражения признака. Обозначаются латинской буквой V . Классическое понимание термина "варианта" предполагает, что вариантой называется каждое уникальное значение признака, без учета количества повторов.

Например, в вариационном ряду показателей систолического артериального давления, измеренного у десяти пациентов:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

вариантами являются только 6 значений:

110, 120, 130, 140, 160, 170.

​Частота – число, показывающее, сколько раз повторяется варианта. Обозначается латинской буквой P . Сумма всех частот (которая, разумеется, равна числу всех исследуемых) обозначается как n .

    В нашем примере частоты будут принимать следующие значения:
  • для варианты 110 частота Р = 1 (значение 110 встречается у одного пациента),
  • для варианты 120 частота Р = 2 (значение 120 встречается у двух пациентов),
  • для варианты 130 частота Р = 3 (значение 130 встречается у трех пациентов),
  • для варианты 140 частота Р = 2 (значение 140 встречается у двух пациентов),
  • для варианты 160 частота Р = 1 (значение 160 встречается у одного пациента),
  • для варианты 170 частота Р = 1 (значение 170 встречается у одного пациента),

Виды вариационных рядов:

  1. простой - это ряд, в котором каждая варианта встречается только по одному разу (все частоты при этом равны 1);
  2. взвешенный - ряд, в котором одна или несколько вариант встречаются неоднократно.

Вариационный ряд служит для описания больших массивов чисел, именно в этой форме изначально представляются собранные данные большинства медицинских исследований. Для того, чтобы охарактеризовать вариационный ряд, рассчитываются специальные показатели, в том числе средние величины, показатели вариабельности (так называемой, дисперсии), показатели репрезентативности выборочных данных.

Показатели вариационного ряда

1) Средняя арифметическая - это обобщающий показатель, характеризующий размер изучаемого признака. Средняя арифметическая обозначается как M , представляет собой самый распространенный вид средней. Средняя арифметическая рассчитывается как отношение суммы значений показателей всех единиц наблюдения к числу всех исследуемых. Методика расчета средней арифметической различается для простого и взвешенного вариационного ряда.

Формула для расчета простой средней арифметической:

Формула для расчета взвешенной средней арифметической:

M = Σ(V * P)/ n

​ 2) Мода – еще одна средняя величина вариационного ряда, соответствующая наиболее часто повторяющейся варианте. Или, если выразиться по другому, это варианта, которой соответствует наибольшая частота. Обозначается как Мо . Мода рассчитывается только для взвешенных рядов, так как в простых рядах ни одна из вариант не повторяется и все частоты равны единице.

Например, в вариационном ряду значений частоты сердечных сокращений:

80, 84, 84, 86, 86, 86, 90, 94;

значение моды составляет 86, так как данная варианта встречается 3 раза, следовательно ее частота - наибольшая.

3) Медиана – значение варианты, делящей вариационный ряд пополам: по обе стороны от нее находится равное число вариант. Медиана также, как и средняя арифметическая и мода, относится к средним величинам. Обозначается как Me

4) Среднее квадратическое отклонение (синонимы: стандартное отклонение, сигмальное отклонение, сигма) - мера вариабельности вариационного ряда. Является интегральным показателем, объединяющим все случаи отклонения вариант от средней. Фактически, отвечает на вопрос: насколько далеко и как часто варианты распространяются от средней арифметической. Обозначается греческой буквой σ ("сигма") .

При численности совокупности более 30 единиц, стандартное отклонение рассчитывается по следующей формуле:

Для малых совокупностей - 30 единиц наблюдения и менее - стандартное отклонение рассчитывается по другой формуле:

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности непостоянны, более или менее различаются между собой.

Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака.

Наличие вариации обусловлено влиянием большого числа факторов на формирование уровня признака. Эти факторы действуют с неодинаковой силой и в разных направлениях. Для описания меры изменчивости признаков используют показатели вариации.

Задачи статистического изучения вариации:

  • 1) изучение характера и степени вариации признаков у отдельных единиц совокупности;
  • 2) определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности.

В статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация.

Исследование вариаций имеет важное значение. Измерение вариаций необходимо при проведении выборочного наблюдения, корреляционном и дисперсионном анализе и т. д. Ермолаев О.Ю. Математическая статистика для психологов: Учебник [Текст]/ О.Ю. Ермолаев. - М.: Изд-во Флинта Московского психолого-социального института, 2012. - 335с.

По степени вариации можно судить об однородности совокупности, об устойчивости отдельных значений признаков и типичности средней. На их основе разрабатываются показатели тесноты связи между признаками, показатели оценки точности выборочного наблюдения.

Различают вариацию в пространстве и вариацию во времени.

Под вариацией в пространстве понимают колеблемость значений признака у единиц совокупности, представляющих отдельные территории. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени.

Для изучения вариации в рядах распределения проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда.

Самыми простыми признаками вариации являются минимум и максимум - самое наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения (fi). Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты, который может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Выражается формулой:

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным показателям колеблемости относят коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.

Пример нахождения вариационного ряда

Задание. По данной выборке:

  • а) Найти вариационный ряд;
  • б) Построить функцию распределения;

№=42. Элементы выборки:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Решение.

  • а) построение ранжированного вариационного ряда:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) построение дискретного вариационного ряда.

Вычислим число групп в вариационном ряду пользуясь формулой Стерджесса:

Примем число групп равным 7.

Зная число групп, рассчитаем величину интервала:

Для удобства построения таблицы примем число групп равным 8, интервал составит 1.

Рис. 1 Объем продаж магазином товара за определенный промежуток времени

Различные выборочные значения назовемвариантами ряда значений и обозначим: х 1 , х 2 , …. Прежде всего произведем ранжирование вариантов, т.е. расположение их в порядке возрастания или убывания. Для каждого варианта указывается свой вес, т.е. число, которое характеризует вклад данного варианта в общую совокупность. В качестве весов выступают частоты или частости.

Частотой n i варианта х i называется число, показывающее сколько раз встречается данный вариант в рассматриваемой выборочной совокупности.

Частостью или относительной частотой w i варианта х i называется число, равное отношению частоты варианта к сумме частот всех вариантов. Частость показывает, какая часть единиц выборочной совокупности имеет данный вариант.

Последовательность вариантов с соответствующими им весами (частотами или частостями), записанная в порядке возрастания (или убывания), называется вариационным рядом .

Вариационные ряды бывают дискретными и интервальными.

Для дискретного вариационного ряда задаются точечные значения признака, для интервального – значения признака задаются в виде интервалов. Вариационные ряды могут показывать распределение частот или относительных частот (частостей), в зависимости от того, какая величина указывается для каждого варианта – частота или частость.

Дискретный вариационный ряд распределения частот имеет вид:

Частости находятся по формуле , i = 1, 2, …, m .

w 1 + w 2 + … + w m = 1.

Пример 4.1. Для данной совокупности чисел

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

построить дискретные вариационные ряды распределения частот и частостей.

Решение . Объем совокупности равен n = 10. Дискретный ряд распределения частот имеет вид

Аналогичную форму записи имеют интервальные ряды.

Интервальный вариационный ряд распределения частот записывается в виде:

Сумма всех частот равна общему числу наблюдений, т.е. объему совокупности: n = n 1 + n 2 + … + n m .

Интервальный вариационный ряд распределения относительных частот (частостей) имеет вид:

Частость находится по формуле , i = 1, 2, …, m .

Сумма всех частостей равна единице: w 1 + w 2 + … + w m = 1.

Наиболее часто на практике применяются интервальные ряды. Если статистических выборочных данных очень много и их значения отличаются друг от друга на сколь угодно малую величину, то дискретный ряд для этих данных будет достаточно громоздким и неудобным для дальнейшего исследования. В этом случае применяют группировку данных, т.е. промежуток, содержащий все значения признака, разбивают на несколько частичных интервалов и, подсчитав частоту для каждого интервала, получают интервальный ряд. Запишем более подробно схему построения интервального ряда, предположив, что длины частичных интервалов будут одинаковыми.

2.2 Построение интервального ряда

Для построения интервального ряда нужно:

Определить число интервалов;

Определить длину интервалов;

Определить расположение интервалов на оси.

Для определения числа интервалов k существует формула Стерджеса, по которой

,

где n - объем всей совокупности.

Например, если имеется 100 значений признака (вариант), то рекомендуется для построения интервального ряда взять число интервалов равным интервалам.

Однако очень часто на практике число интервалов выбирает сам исследователь, учитывая, что это число не должно быть очень большим, чтобы ряд не был громоздким, но и не очень маленьким, чтобы не потерять некоторых свойств распределения.

Длина интервала h определяется по следующей формуле:

,

где x max и x min - это соответственно самое большое и самое маленькое значения вариантов.

Величину называют размахом ряда.

Для построения самих интервалов поступают по-разному. Один из самых простых способов заключается в следующем. За начало первого интервала принимают величину
. Тогда остальные границы интервалов находятся по формуле . Очевидно, что конец последнего интервала a m+1 должен удовлетворять условию

После того как найдены все границы интервалов, определяют частоты (или частости) этих интервалов. Для решения этой задачи просматривают все варианты и определяют число вариант, попавших в тот или иной интервал. Полное построение интервального ряда рассмотрим на примере.

Пример 4.2. Для следующих статистических данных, записанных в порядке возрастания, построить интервальный ряд с числом интервалов, равным 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Решение. Всего n =50 значений вариантов.

Число интервалов задано в условии задачи, т.е. k =5.

Длина интервалов равна
.

Определим границы интервалов:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Для определения частоты интервалов посчитываем число вариантов, попавших в данный интервал. Например, в первый интервал от 2,5 до 19,5 попадают варианты 11, 12, 12, 14, 14, 15. Их число равно 6, следовательно, частота первого интервала равна n 1 =6. Частость первого интервала равна . Во второй интервал от 19,5 до 36,5 попадают варианты 21, 21, 22, 23, 25, число которых равно 5. Следовательно, частота второго интервала равна n 2 =5, а частость . Найдя аналогичным образом частоты и частости для всех интервалов, получим следующие интервальные ряды.

Интервальный ряд распределения частот имеет вид:

Сумма частот равна 6+5+9+11+8+11=50.

Интервальный ряд распределения частостей имеет вид:

Сумма частостей равна 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

При построении интервальных рядов, в зависимости от конкретных условий рассматриваемой задачи, могут применяться и другие правила, а именно

1. Интервальные вариационные ряды могут состоять из частичных интервалов разной длины. Неравные длины интервалов позволяют выделить свойства статистической совокупности с неравномерным распределением признака. Например, если границы интервалов определяют численность жителей в городах, то целесообразно в данной задаче использовать неравные по длине интервалы. Очевидно, что для небольших городов имеет значение и небольшая разница в числе жителей, а для больших городов разница в десятки и сотни жителей не имеет существенного значения. Интервальные ряды с неравными длинами частичных интервалов исследуются, в основном, в общей теории статистики и их рассмотрение выходит за рамки данного пособия.

2. В математической статистике иногда рассматривают интервальные ряды, для которых левую границу первого интервала полагают равной –∞, а правую границу последнего интервала +∞. Это делается для того, чтобы приблизить статистическое распределение к теоретическому.

3. При построении интервальных рядов может оказаться, что значение какого-то варианта совпадает в точности с границей интервала. Лучше всего в этом случае поступить следующим образом. Если такое совпадение только одно, то считать, что рассматриваемый вариант со своей частотой попал в интервал, находящийся ближе к середине интервального ряда, если таких вариантов несколько, то либо все их отнести к правым от этих вариант интервалам, либо все – к левым.

4. После определения числа интервалов и их длины, расположение интервалов можно производить и по другому способу. Находят среднее арифметическое всех рассматриваемых значений вариантов х ср. и строят первый интервал таким образом, чтобы это среднее выборочное находилось бы внутри какого-то интервала. Таким образом, получаем интервал от х ср. – 0,5h до х ср.. + 0,5h . Затем влево и вправо, прибавляя длину интервала, строим остальные интервалы до тех пор, пока x min и x max не попадут соответственно в первый и последний интервалы.

5. Интервальные ряды при большом числе интервалов удобно записывать вертикально, т.е. интервалы записывать не в первой строке, а в первом столбце, а частоты (или частости) во втором столбце.

Выборочные данные могут рассматриваться как значения некоторой случайной величины Х . Случайная величина имеет свой закон распределения. Из теории вероятностей известно, что закон распределения дискретной случайной величины можно задать в виде ряда распределения, а непрерывной – с помощью функции плотности распределения. Однако существует универсальный закон распределения, который имеет место и для дискретной и для непрерывной случайных величин. Этот закон распределения задается в виде функции распределения F (x ) = P (X <x ). Для выборочных данных можно указать аналог функции распределения – эмпирическую функцию распределения.


Похожая информация.


(определение вариационного ряда; составляющие вариационного ряда; три формы вариационного ряда; целесообразность построения интервального ряда; выводы, которые можно сделать по построенному ряду)

Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются

Вариационные – это ряды, построенные по количественному признаку.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот:

Варианты – это числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные – это прибыль, а отрицательные числа – это убыток.

Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяется числом элементов всей совокупности.

Частости – это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.



Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается

Где k - число вариантов значений признака

Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Дискретный вариационный ряд распределения – это ряд, в котором группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

Интервальный вариационный ряд распределения – это ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения, в том числе и дробные.

Интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины.

Интервальный ряд распределения целесообразно строить, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

По этому ряду уже можно сделать несколько выводов. Например, средний элемент вариационного ряда (медиана) может быть оценкой наиболее вероятного результата измерения. Первый и последний элемент вариационного ряда (т.е. минимальный и максимальный элемент выборки) показывают разброс элементов выборки. Иногда если первый или последний элемент сильно отличаются от остальных элементов выборки, то их исключают из результатов измерений, считая, что эти значения получены в результате какого-то грубого сбоя, например, техники.

Вариация определяет различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период (момент времени). Причиной вариации бывают разные условия существования разных единиц совокупности. Например, даже близнецы в процессе жизни приобретают различия в росте, весе, а также в таких признаках, как уровень образования, доход, количество детей и т.д.

Вариация возникает в результате того, что сами значения признака складываются под суммарным влиянием разнообразных условий, которые разным образом сочетаются в каждом отдельном случае. Таким образом, величина любого варианта объективна.

Вариация характерна всем без исключения явлениям природы и общества, кроме законодательно закрепленных нормативных значений отдельных социальных признаков. Исследования вариации в статистике имеют огромное значение, помогают познать сущность изучаемого явления. Нахождение вариации, выяснение ее причин, выявление влияния отдельных факторов дают важную информацию для внедрения научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака совокупности, но она не раскрывает её строения. Среднее значение не показывает, как располагаются вокруг нее варианты осредненного признака, распределены ли они вблизи средней или отклоняются от нее. Средняя в двух совокупностях может быть одинаковой, но в одном варианте все индивидуальные значения отличаются от нее незначительно, а в другом - эти отличия велики, т.е. в первом случае вариация признака мала, а во втором - велика, это имеет очень важное значение для характеристики значимости средней величины.

Для того, чтобы руководитель организации, управляющий, научный работник могли изучать вариацию и управлять ей, статистикой разработаны специальные методы исследования вариации (система показателей). С их помощью вариация находится, характеризуются ее свойства. К показателям вариации относятся : размах вариации, среднее линейное отклонение, коэффициент вариации.

Вариационный ряд и его формы

Вариационный ряд - это упорядоченное распределение единиц совокупности чаще по возрастающим (реже убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Когда численность единиц совокупности большая, ранжированный ряд становится громоздким, его построение занимает длительное время. В такой ситуации вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Существуют следующие формы вариационного ряда :

  1. Ранжированный ряд представляет собой, перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
  2. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф: конкретных значений варьирующего признака х и числа единиц совокупности с данным значение f - признака частот. Он строится тогда, когда признак принимает наибольшее число значений.
  3. Интервальный ряд .

Размах вариации определяется как абсолютная величина разности между максимальными и минимальными значениями (вариантами) признака:

Размах вариации показывает только крайние отклонения признака и не отражает отдельных отклонений всех вариантов в ряду. Он характеризует пределы изменения варьирующего признака и зависим от колебаний двух крайних вариантов и абсолютно не связан с частотами в вариационном ряду, т. е. с характером распределения, что придает этой величине, случайный характер. Для анализа вариации нужен показатель, который отражает все колебания вариационного признака и даёт общую характеристику. Простейший показатель такого вида — среднее линейное отклонение.



Рассказать друзьям