Характеристика рассеивания. Характеристики рассеяния Дисперсия и ее свойства Неравенство Чебышёва


Основными характеристиками рассеивания, применяемых для оценки вариации величин относительно выборочной средней, являются дисперсия, среднеквадратическое отклонение, коэффициент вариации.

1. Дисперсия (от лат. dispersio - рассеяние ) – среднее арифметическое из квадратов отклонений величин x i от их среднего арифметического.

Дисперсия (D) - мера рассеивания (отклонения от среднего), определяется следующим образом - из каждого варианта вычитают среднюю арифметическую, разность возводят в квадрат и умножают на соответствующую ей частоту. Далее определяют сумму всех произведений и делят её на объём совокупности:

Для сгруппированных данных дисперсию определяют:

Размерность дисперсии не совпадает с единицами измерения варьирующего признака.

При решении практических задач помимо использования формул расчета выборочной дисперсии используется величина, которая называется исправленной дисперсией . Дело в том, что значение выборочной дисперсии дает заниженные значения по отношению к действительной дисперсии, поэтому при малых выборках (n < 30) необходимо применять исправленную дисперсию и среднеквадратическое отклонение :

или

2. Выборочное и исправленное среднеквадратическое отклонение (σ, s) – корень квадратный из дисперсии. Размерность среднеквадратического отклонения в отличие от размерности дисперсии совпадает с единицами измерения экспериментальных данных, поэтому его в основном используют для характеристики рассеивания изучаемого признака.

Приведем расчет дисперсии (табл. 5) для примера 1.

Таблица 5

Промежуточные вычисления расчета дисперсии

№п/п Серединные значения, x i Классовые частоты, n i
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
сумма

Дисперсия для сгруппированных данных примера равна:

Среднеквадратическое отклонение соответственно равно:

Исправленное среднеквадратическое отклонение равно:

Заметим, что формулы для вычисления выборочной и исправленной дисперсий отличаются только знаменателями. При достаточно больших n выборочная и исправленная дисперсии мало отличаются, поэтому на практике исправленной дисперсией пользуются, если n < 30 .

3. Коэффициент вариации (v) – является относительной мерой рассеивания признака, используется как показатель однородности выборочных наблюдений (табл. 6).

Коэффициент вариации - это отношение среднеквадратического отклонения к средней арифметической, выраженное в процентах. Кроме того, коэффициент вариации часто используется при сопоставлении (сравнении) степени варьирования различных признаков, выраженных в различных единицах измерения.

Для определения характера рассеивания безразмерный коэффициент вариации v рассчитывают по формуле:

,

где σ – среднеквадратическое отклонение;

Среднее арифметическое выборочных данных.

Характеристики положения дают усредненное представление о характерных значениях, принимаемых случайными величинами. Информации в этих характеристиках тем больше, чем меньшие отклонения от них могут наблюдаться в реальном эксперименте. Показатели, описывающие возможные отклонения значений случайной величины от «средних», называются характеристиками рассеяния. К ним относятся дисперсия, среднеквадратичное отклонение, срединное отклонение, коэффициент вариации и некоторые другие. 2.1. Дисперсия и ее свойства Важнейшей из них является дисперсия. Дисперсией случайной величины £ (обозначение #[£]) называется математическое ожидание квадрата отклонения случайной величины (от своего среднего Отметим некоторые свойства дисперсии. используя свойства математического ожидания, получаем Отметим, что если случайные величины - независимы, то из свойства 3 математического ожидания следует, что и указанное свойство выглядит так: 6. Если д^(х) - обобщенная плотность распределения случайной величины f, то £>[£] может быть вычислена из соотношения Характеристики рассеяния Дисперсия и ее свойства Неравенство Чебышёва в частности, если £ - непрерывная случайная величина с плотностью ж), то если же £ - дискретная случайная величина с рядом распределения Пример t (дисперсия бернуллиевой случайной величины). Пусть (- беонуллиева случайная величина, . В соответствие с соотношением (4), получаем (М= р) Пример 2 (дисперсия биномиальной случайной величины). Если £ - биномиальная с параметрами (п, р), то, как было отмечено выше, (представима в виде где - независимые одинаково распределенные бернуллиевы с параметром р случайные величины. Поэтому (свойство дисперсии 5) Одновременно доказано комбинаторное тождество Пример 3 (дисперсия равномерной на (и, случайной величины). Пусто Имеем Характеристикой рассеяния, тесно связанной с дисперсией, является среднее ква-дратическое отклонение случайной величины". Обладая тем же качественным наполнением (содержа в себе ту же информацию), что и дисперсия, среднее квадратическое отклонение имеет то преимущество, что измеряется в тех же единицах, что и рассматриваемая случайная величина. Отметим, что из свойств дисперсии с очевидностью следует: если только - независимы. В заключение заметим, что если у случайной величины £ существуют то можно построить случайную величину £, обладающую теми же свойствами, что и £, но имеющую стандартные числовые характеристики: М = 0 и D = 1. Достаточно положить Переход от (к £ - т носит название центрирование случайной величины а переход от- нормирование. Таким образом, соотношение (6) описывает процедуру нормирования и центрирования случайной величины Очевидно, что центрирование) не меняет дисперсии, в то время как нормирование, носящее характер масштабного преобразования, изменяет математическое ожидание в о раз. 2.2. Неравенство Чебышёва Из определения дисперсии (1) ясно, что она призвана качественно описывать рассеяние значений случайной величины относительно математического ожидания. Точный вероятностный смысл этого описания дается неравенством Чебышёва, которое мы здесь рассмотрим. Теорема. Пусть случайная величина £ обладает математическим ожиданием А/(£| = т и дисперсией /?(£) = а2. Тогда каково бы ни было е > О Рассмотрим вспомогательную случайную величину г/, заданную соотношением Заметим, что и потому По теореме о математическом ожидании функции от случайной величины получаем откуда или чем и завершается доказательство. Отметим, что неравенство (7) часто используется в эквивалентной форме получающейся из (7) применением очевидного соотношения Неравенство Чебышёва показывает, что чем меньше дисперсия, тем реже значения случайной величины £ «сильно» (больше чем на е) отклоняются от среднего т. При фиксированной дисперсии вероятности отклонений на величину, большую, чем е,тем меньше, чем больше е. Неравенство (7) универсально. Оно не предъявляет никаких требований к характеру распределения случайной величины f - достаточно существования т и а. В силу своей универсальности оно малоинформативно количественно - для разумных значений е оценки вероятностей крайне фубы. Пример. Для нормальной случайной величины с параметрами (0, 1) имеем Характеристики рассеяния Дисперсия и ее свойства Неравенство Чебышёва в то время как неравенство Чебышёва дает что верно, но тривиально. Для этой же случайной величины при е = 3 точное значение вероятности, а соотношение (8) приводит к оценке которая уже значительно лучше предыдущей. Несмотря на достаточно грубый характер оценок (7)-(8), без дополнительных предположений о характере распределения случайной величины неравенство Чебышёва, как показывает следующий пример, улучшить нельзя - оно точное1*. Пример. Пусть (-дискретная случайная величина, принимающая значения вероятностями соответственно. Легко видеть, что. Положим е = I и найдем значение вероятности Имеем Неравенство (7) в этой ситуации дает оценку которая совпадает с точным значением оцениваемой вероятности. 2.3. Другие характеристики рассеяния Из других характеристик рассеяния, часто используемых в приложениях, отметим коэффициент вариации и срединное отклонение (среднее арифметическое отклонение). Пусть у случайной величины £ существует А/[£) = m и = о2. Коэффициентом вариации случайной величины £ называется величина Из (9) легко усмотреть, что описывает рассеяние случайной величины £ в долях по отношению к среднему. Как абсолютный показатель рассеяния коэффициент вариации не очень удобен, однако для совместно центрированных случайных величин (т.е. имеющих одинаковые математические ожидания) он позволяет эффективно сравнивать диапазоны изменения. Пусть у случайной величины £ существует Срединным отклонением Срединное отклонение (/[£] качественно имеет тот же смысл, что и среднеква-дратическос отклонение - чем больше срединное отклонение, тем больше рассеяние, чем меньше срединное отклонение - тем меньше рассеяние. В том смысле, что существует случайная величина для которой в неравенствах (7)-(8) при некотором е достигается знак равенства. Для конкретных классов распределений связь между этими показателями может быть установлена, однако в общем случае удобных для использования на практике соотношений между U и а нет. Пример 1. Пусть (- нормально распределенная случайная величина. Тогда В этом случае Пример 2. Пусть { = Л[-о, о| - равномерно распределенная случайная величина. Тогда U = а/2. Характеристики рассеяния Дисперсия и ее свойства Неравенство Чебышёва Отметим, что и в этом случае Замеченное свойство U неслучайно -оно имеет место для любых случайных величин (конечно, обладающих дисперсией). Теорема. Если у случайной величины £ существует D£ = а2, то М В неравенстве Коши-Буняковского (свойство 6 математического ожидания) положим Ь Тогда откуда

Министерство образования и науки РФ

Государственное образовательное учреждение высшего профессионального образования

«МАТИ»-Российский государственный технологический университет имени К. Э. Циолковского

Кафедра «Технология производства двигателей летательных аппаратов»

Лабораторный практикум

MATLAB. Занятие 2

СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Составители:

Курицына В.В.

Москва 2011

ВВЕДЕНИЕ..........................................................................................................

ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН...........................................

Характеристика положения центра группирования случайных величин.....

Характеристики рассеяния случайной величины...........................................

Характеристики выборки наблюдений............................................................

Нормальное распределение (распределение Гаусса) ..................................

ПРЕДСТАВЛЕНИЕ ВЫБОРКИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ В ВИДЕ

РЯДА РАСПРЕДЕЛЕНИЙ.................................................................................

ОПРЕДЕЛЕНИЕ СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК В СРЕДЕ

MATLAB ............................................................................................................

Формирование выборки экспериментальных данных.................................

Способы формирования файла выборки..................................................

Вариант 1. Формирование матрицы данных результатов измерений 12

Вариант 2. Моделирование результатов измерений..............................

Построение графиков распределения..........................................................

Вариант 1. Построение графиков распределения..................................

Вариант 2. Построение графиков распределения..................................

ВИЗУАЛЬНОЕ МОДЕЛИРОВАНИЕ.............................................................

Моделирование в Matlab Simulink .................................................................

Начало работы с Simulink ..............................................................................

Создание модели Simulink.............................................................................

Формирование выборки для анализа.........................................................

Расчет статистических характеристик...............................................

Построение гистограммы распределения...............................................

Блок-схема визуальной модели...................................................................

Моделирование случайного процесса..........................................................

Модельный эксперимент............................................................................

Создание массивов со случайными элементами......................................

Модификация источника данных в модели..............................................

Примерный вид блок-схемы модели..........................................................

ВВЕДЕНИЕ

В арсенале средств, которыми должен владеть современный экспериментатор, статистические методы обработки и анализа данных занимают особое место. Это связано с тем, что результат любого, достаточно сложного эксперимента не может быть получен без обработки экспериментальных данных.

Аппарат теории вероятности и математической статистики разработан и применяется для описания закономерностей, присущих массовым случайным событиям. Каждому случайному событию сопоставляется соответствующая случайная величина (в данном случае результат эксперимента).

Для описания случайных величин используются следующие характеристики:

а) числовые характеристики случайной величины (например, математической ожидание, дисперсия, …);

б) закон распределения случайной величины – функция, несущая всю информацию о случайной величине.

Числовые характеристики и параметры закона распределения случайной величины связаны между собой определенной зависимостью. Часто по значению числовых характеристик можно предположить закон распределения случайной величины.

Законом распределения случайной величины обычно называется функция распределения вероятностей принятия случайной величиной того или иного значения. Это функция, которая ставит в соответствие возможным интервальным значениям случайной величины вероятность попадания ее в эти интервалы.

ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН

Характеристика положения центра группирования случайных величин

В качестве числовых характеристик положения центра группирования случайных величин используют математическое ожидание или среднее значение, моду и медиану случайной величины (рис.3.1. ).

Математическое ожидание случайной величины Y обозначают через М Y или a и определяют по формуле:

a = MY = ∫ Yϕ (Y ) dY .

Математическое ожидание указывает на положение центра группирования случайных величин, или положение центра масс площади под кривой. Математическое ожидание является числовой характеристикой случайной величины, то есть является одним из параметров функции распределения.

ϕ (Y ϕ (Y)max

0 MoY

MеY

Рис. 3.1. Характеристики группирования случайной величины X

Модой случайной величины Y является такое значение Мo Y , в котором плотность вероятности имеет максимальное значение.

Медианой случайной Y служит значение Ме Y , которое соответствует условию:

P (Y < МеY ) = P (Y > MeY ) = 0,5 .

Геометрически медиана представляет абсциссу точек прямой, которая делит площадь, ограниченную кривой плотности вероятности пополам.

Характеристики рассеяния случайной величины

Одной из основных характеристик рассеяния случайной величины Y около центра распределения служит дисперсия , которая обозначается D(Y) или σ 2 и определяется по формуле:

D(Y ) = σ 2 = ∫ (Y − a) 2 ϕ (Y ) dY .

Дисперсия имеет размерность квадрата случайной величины, что не всегда удобно. Часто вместо дисперсии за меру рассеивания случайной величины используют положительное значение квадратного корня из дисперсии, которое называется средним квадратичным отклонением или стандартным отклонением :

σ = D (Y ) = σ 2 .

Как и дисперсия, среднеквадратичное отклонение характеризует разброс величины вокруг математического ожидания.

В практике широко применяют также характеристику рассеивания, называемую коэффициентом вариации ν , который представляет отношение среднего квадратичного отклонения к математическому ожиданию:

ν = σ a 100% .

Коэффициент вариации показывает, насколько велико рассеяние по сравнению со средним значением случайной величины.

Характеристики выборки наблюдений

Среднее значение наблюдаемого признака можно оценить по формуле

Y = 1 ∑ n Y i ,

n i = 1

где Yi – значение признака в i -м наблюдении (опыте), i=1...n. ; n – количество наблюдений.

Выборочное среднеквадратичное отклонение определяется по формуле:

∑ (Yi − Y ) 2 .

n − 1 i = 1

ν = Y S .

Зная коэффициент вариации ν , можно определить показатель точности Н по формуле:

H = ν n .

Чем точнее проведено исследование, тем меньше будет величина показателя

В зависимости от природы изучаемого явления показатель точности исследования считается достаточным, если он не превышает 3÷5%.

Не редки случаи, когда в результаты эксперимента вкрадывается грубая погрешность . Существует несколько способов оценки грубых погрешностей. Наиболее простой основан на вычислении максимального относительного отклонения U . Для этого результаты измерения располагают в ряд монотонно возрастающих значений. Проверке на грубую погрешность подлежит наименьший Y min или наибольший Y max член ряда. Расчет проводят по формулам:

− Y min

Y max − Y

Значение U сравнивают с табличным значением для данной доверительной вероятности U α . Если U ≤ U α , то в данном наблюдении нет грубой погрешности. В противном случае результат наблюдения отсеивают и

производят перерасчет Y и S . Затем повторяют процедуру оценки и исключения грубых погрешностей до тех пор, пока не будет выполняться неравенство U ≤ U α для крайних членов ряда.

Во многих случаях результаты статистических наблюдений могут быть описаны теоретическими законами распределения . При интерпретации данных, полученных экспериментальным путем возникает задача – определить такой теоретический закон распределения случайной величины, который наилучшим образом соответствует результатам наблюдений. Более конкретно эта задача сводится к проверке гипотезы о принадлежности случайной выборки к некоторому закону распределения.

Разные по природе анализируемые процессы обуславливают области применения различных законов распределения. Так результат технологического эксперимента при одних и тех же условиях обработки подчиняется и результат эксперимента по бросанию монеты с орлом и решкой подчиняются совершенно разным законам. Законы распределения случайной величины характеристик надежности, отказов так же имеют особенности.

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки ); характеристики рассеяния (ва­риации, или колеблемости ) и характеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение ), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Характеристики положения

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:

где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.

Для сгруппированных данных:

где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.

Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяетсяпо формуле:

где - нижняя граница модального интервала, - ширина интервала группи­ровки, - частота модального интервала, - частота интервала, предшествую­щего модальному, - частота интервала, последующего за модаль­ным.

Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными .

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

Медиана

Определение . Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где - нижняя граница медианного интервала; ширина интервала группи­ровки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.

Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/ 2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.

Характеристики рассеяния результатов измерений

Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .

Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R =X max - X min .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.

Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

s 2 = , (1)

где Х i – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле

,

где х i – среднее значение i интервала группировки, n i – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

для сгруппированных данных:

.

Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

Как ни важны средние характеристики, но не менее важной характеристикой массива числовых данных является поведение остальных членов массива по отношению к среднему показателю, на сколько они отличаются от средних показателей, как много членов массива значительно отличаются от среднего. На тренировках по стрельбе говорят о кучности результатов, в статистике исследуют характеристики рассеяния (разброса).

Отличие какого-либо значения х, от среднего значения х называют отклонением и вычисляют как разность х, - х. При этом отклонение может принимать как положительные значения, если число больше среднего, так и отрицательные значения, если число меньше среднего. Однако в статистике часто важно иметь возможность оперировать одним числом, характеризующим «кучность» всех числовых элементов массива данных. Любое суммирование всех отклонений членов массива приведет к нулю, так как положительные и отрицательные отклонения взаимно уничтожатся. Чтобы избежать обнуления, используют для характеристики рассеяния квадраты разностей, точнее, среднее арифметическое квадратов отклонений. Такую характеристику рассеяния называют выборочная дисперсия.

Чем больше дисперсия, тем больше рассеяние значений случайной величины. Для вычисления дисперсии используют приближенное значение выборочного среднего х с запасом на один разряд по отношению ко всем членам массива данных. В противном случае при суммировании большого количества приближенных значений будет накапливаться существенная ошибка. В связи с размерностью числовых значений следует отметить один недостаток такого показателя рассеяния, как выборочная дисперсия: единица измерения дисперсии D является квадратом единицы измерения значений х, характеристикой которых дисперсия является. Чтобы избавиться от этого недостатка, в статистике введена такая характеристика рассеяния, как выборочное среднее квадратичное отклонение , которое обозначается символом а (читается «сигма») и вычисляется по формуле

В норме более половины членов массива данных отличаются от среднего показателя меньше, чем на величину среднего квадратичного отклонения, т.е. принадлежат отрезку - а; х + а]. Иначе говорят: средний показатель с учетом разброса данных равен х ± а.

Введение еще одной характеристики рассеяния связано с размерностью членов массива данных. Все числовые характеристики в статистике вводятся с целью сравнения результатов исследования разных числовых массивов, характеризующих разные случайные величины. Однако сравнивать средние квадратичные отклонения от разных средних величин разных массивов данных не показательно, особенно если еще и размерность этих величин отличается. Например, если сравнивается длина и вес каких- либо объектов или рассеяния при изготовлении микро- и макроизделий. В связи с вышеизложенными соображениями вводится характеристика относительного рассеяния, которая называется коэффициентом вариации и вычисляется по формуле

Для подсчета числовых характеристик рассеяния значений случайной величины удобно использовать таблицу (табл. 6.9).

Таблица 6.9

Подсчет числовых характеристик рассеяния значений случайной величины

Xj - X

(Xj-X) 2 /

В процессе заполнения этой таблицы находится выборочное среднее х, которое в дальнейшем будет использоваться в двух видах. Как итоговая средняя характеристика (например, в третьем столбце таблицы) выборочное среднее х должно быть округлено до разряда, соответствующего наименьшему разряду какого-либо члена массива числовых данных х г Однако этот показатель используется в таблице при дальнейших вычислениях, и в этой ситуации, а именно при вычислениях в четвертом столбце таблицы, выборочное среднее х должно быть округлено с запасом на один разряд по отношению к наименьшему разряду какого-либо члена массива числовых данных х { .

Итогом вычислений при помощи таблицы типа табл. 6.9 будет получение значения выборочной дисперсии, а для записи ответа надо на основе значения выборочной дисперсии посчитать значение среднего квадратичного отклонения а.

В ответе указывается: а) средний результат с учетом разброса данных в виде х±о ; б) характеристика стабильности данных V. В ответе следует оценить качество коэффициента вариации: плохой или хороший.

Допустимым коэффициентом вариации как показателем однородности или стабильности результатов в спортивных исследованиях считается 10-15%. Коэффициент вариации V = 20% в любых исследованиях считается весьма большим показателем. Если объем выборки п > 25, то V > 32% - очень плохой показатель.

Например, для дискретного вариационного ряда 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 табл. 6.9 будет заполнена следующим образом (табл. 6.10).

Таблица 6.10

Пример подсчета числовых характеристик рассеяния значений

*1

fi

1

Л п 25 = 2,92 = 2,9

D _S_47,6_ п 25

Ответ : а) средняя характеристика с учетом разброса данных равна х ± а = = 3 ± 1,4; б) стабильность полученных измерений находится на низком уровне, так как коэффициент вариации V = 48% > 32%.

Аналог табл. 6.9 может быть использован и для вычисления характеристик рассеяния интервального вариационного ряда. При этом варианты х г будут заменены представителями промежутков x v ja абсолютные частоты вариант f { - на абсолютные частоты промежутков f v

На основании вышеизложенного можно сделать следующие выводы.

Выводы математической статистики правдоподобны, если обрабатывается информация о массовых явлениях.

Обычно исследуется выборка из генеральной совокупности объектов, которая должна быть репрезентативна.

Опытные данные, полученные в результате исследования какого-либо свойства объектов выборки, представляют собой значение случайной величины, поскольку исследователь заранее не может предсказать, какое именно число будет соответствовать определенному объекту.

Для выбора того или иного алгоритма описания и первичной обработки опытных данных важно уметь определять тип случайной величины: дискретная, непрерывная или смешанная.

Дискретные случайные величины описываются дискретным вариационным рядом и его графической формой - полигоном частот.

Смешанные и непрерывные случайные величины описываются интервальным вариационным рядом и его графической формой - гистограммой.

При сравнении нескольких выборок по уровню сформированное™ некоторого свойства используют средние числовые характеристики и числовые характеристики рассеяния случайной величины по отношению к средним.

При вычислении средней характеристики важно правильно выбрать вид средней характеристики, адекватный области ее применения. Структурные средние значения мода и медиана характеризуют структуру расположения вариант в упорядоченном массиве опытных данных. Количественное среднее значение дает возможность судить о среднем размере вариант (выборочная средняя).

Для вычисления числовых характеристик рассеяния - выборочной дисперсии, среднего квадратичного отклонения и коэффициента вариации - эффективен табличный способ.







2024 © psynadin.ru.