Метод моментов позволяет определить. Смотреть что такое "Метод моментов" в других словарях. Общий индекс цен


Вариационные ряды распределения состоят их двух элементов вариантов и частот.

Вариантами называются числовые значения колличественного признака в ряду распределения, они могут быть положительными и отрицательными, абсолютными и относительными. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.

Ряды распр-я могут быть образованы по качественному(атрибутивному) и колич-му пр-ку. В первом случае они наз. атрибутивными,а во втором- вариационными.

Вариационные ряды распр-ия по сп-бу постр-ия бывают дискретные и интервальные:

Дискр. вариац. ряд распр-я - группы сост-ны по признаку, изменяющемуся дискретно и приним-му только целые значения. Интервальный вариац. ряд распр-ия - группировачный признак, сост-ий групп-ки, может принимать в опред-ом интервале любые знач-ия. Число ед-ц частоты, приходящиеся на ед-цу инт-ла наз. плотностью распред-я . Ряд накопл-ых частот (кумулятивный)-показ-т число случаев ниже или выше опред-го уровня. Графич изображения ряда распред.: линейные, плоскостные диаграммы, гистограммы, куммулятивная кривая (изображ-ет ряд накопл-х частот)

9. Средняя арифметическая взвешенная.

При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной, которая имеет вид: X средн = (EXi*fi)/ Efi

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам.

Расчет средней по способу моментов. Основан на свойствах средней арифметической. В качестве условного ноля – X0 выбирают середину одного из центральных интервалов, обладающего наибольшей частотой.Этот способ используется только в рядах с равными интервалами.

10. Средняя гармоническая простая и взвеш.

Средняя гармоническая. Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1. Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:

К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:

В статист практике чаще исп гармонич взвеш , формула кот имеет вид:

Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.

Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров. Допустим, необходимо узнать среднюю цену реализованных товаров: Вид товара Цена за единицу, руб.Сумма реализаций, руб.

Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

11. Упрощенный расчет средней арифм. (ср. ар.) (способ моментов).

Пользуясь св-ми ср. ар., ее можно рассчитать след. образом: 1) вычесть из всех вариант постоянное число (лучше значение серединной варианты); 2) разделить варианты на постоянное число – на величину интервала; 3) частоты выразить в %. Вычисление ср. ар. первыми двумя способами называется способом отсчета от условного начала (способом моментов). Этот способ применяется в рядах с разными интервалами. Ср. ар. в этом случае опред. по ф-ле:

Где m – момент первого порядка; х 0 – начало отсчета; К – величина интервала.

12. Мода и медиана.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина. Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10) : 2= 8,5. То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле Nme=(n+1)/2, где n - число единиц в совокупности. Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений. Численное значение медианы обычно определяют по формуле----- где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала.

Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой. Чтобы найти конкретное значение моды, необходимо использовать формулу

где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

13. Свойства средней ариф. (ср. ар.)

1.Если из всех вариантов ряда (-) или ко всем вариантам (+) постоянное число, то ср. ар. соответственно уменьшится или увеличится на это число.
.2.Если все варианты ряда умножить или разделить на постоянное число, то ср. ар. соответственно увеличится или уменьшится в это число раз.
3.Если все частоты увеличить или уменьшить в постоянное число раз, то средняя от этого не изменится.
.

4.Сумма отклонений всех вариантов ряда от ср. ар. = 0. (Нулевое свойство средней). . 5.Σf i =Σfix i . Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты.

6
.Сумма квадратов отклонений всех вариантов ряда от ср. ар.

Данное св-во положено в основу метода наименьших квадратов, кот. широко применяется в исследовании стат. взаимосвязей.

14. Виды дисперсий. Правило их сложения .

Различают три вида дисперсий: общая; средняя внутригрупповая; межгрупповая. Общая дисперсия ( 2 о ) характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле  2 о =  (X – Xо средн) 2 *f / f, где Xо средн - общая средняя арифметическая всей исследуемой совокупности. Средняя внутригрупп дисперс ( 2 средн ) свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам ( 2 i ), затем рассчитывается средняя внутригрупповая дисперсия ( 2 i cредн): где ni - число единиц в группе. Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле

где - средняя величина по отдельной группе. Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.

15 . Виды средних. Их исчисление .

16. Показатели вариации, применяемые в статистике.

Вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления. Для измерения вариации в статистике применяют несколько способов. Наиболее простым явл расчет показателя размаха вариации Н как разницы между Xmax и Xmin: H=Xmax - Xmin. Но размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается. Среднее линейное отклонение d - среднее арифметическое значение абсолютных отклонений признака от его среднего уровня: d =  (Xi – X средн) / n. При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной. В статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии: δ =  (Xi – X средн) 2 / n. Показатель s, равный √δ 2 , называется средним квадратическим отклонением. Величина Mx = √(δ 2 /n)-средняя ошибка выборки и явля хар-кой отклонения выборочного среднего значения призн от его истинной средней величины. Показатель средней ошибки использ при оценке достоверности результатов выборочн наблюд. Коэфф осцилляции отражает относит колеблемость крайних значений признака вокруг средней: Ko = (R/X средн)*100%. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины Kd = (d средн/ X средн)*100%. Коэффициент вариации: V = (δ/X средн)*100%

17. Простейшие приёмы обработки рядов динамики.

Простейшими видами обработки рядов динамики являются: укрупнение интервалов, метод скользящей средней, аналитическое выравнивание, экстраполяция и интерполяция.

Укрупнение интервалов. Ряд динамики разделяют на достаточно большое число равных интервалов. Если средн уровни по интервалам не позволяют увидеть тенденцию разв, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (уменьшая количество интервалов). Скользящая средняя. В этом методе исходные уровни ряда заменяются средними величинами, которые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Для того чтобы создать модель, выражающую основную тенденцию изменения уровней динамического ряда во вре­мени, используется аналитическое выравнивание ряда динамики. Простейшими моделями, выражаю­щими тенденцию развития, являются: линейная функция прямой, показательная функция, парабола, парабола n-порядка, гипербола, экспонента. Иногда возникает необходимость предвидеть будущий уровень ряда динамики. В таких случаях прибегают к приему обработки рядов динамики, называемому экстраполяцией : y n +1 = y n + ∆y n +∆∆y n , где y n +1 - неизвестный уровень ряда, y n - последний известный уровень ряда, ∆y n - цепной абсолютный прирост последнего уровня ряда (∆y n = y n - y n -1), ∆∆y n - изменение прироста последнего уровня ряда. Наряду с экстраполяцией иногда применяется такой прием обработки рядов динамики, как интерполяция - искусственное нахождение отсутствующих членов внутри динамического ряда. Неизвестный уровень ряда находится по формуле: y i = (y i +1 + y i -1) / 2. Где: y i - неизвестный уровень ряда, y i +1 - последующий за неизвестным уровень ряда, y i -1 - предыдущий уровень ряда.

В процессе вычисления средней арифметической и использования ее в анализе социально-экономических процессов может оказаться полезным знание ряда ее математических свойств, которые мы приведем без развернутых доказательств.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2. Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.

Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);



d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.

«Способ моментов» применяется в рядах с равными интервалами на основе свойств средней арифметической. Средняя арифметическая исчисляется по формуле

где i – размер интервала;

m 1 – момент первого порядка (средняя арифметическая из новых упрощенных вариант
;
– новые упрощенные варианты;f – частота);

А – постоянное число (лучше всего взять его равным варианте, у которой наибольшая частота).

Определим среднее значение признака «способом моментов» на следующем примере.

Пример 5 . Имеются следующие данные о распределении магазинов облпотребсоюза по торговой площади (табл. 14).

Таблица 14

Следует определить среднюю площадь магазинов, применив «способ моментов».

Решение

Данные распределения магазинов по торговой площади представлены в виде интервального ряда распределения с равными интервалами (i = 20 м 2), следовательно, расчет средней площади магазина можно провести по формуле
, применив «способ моментов».

Первый и последний интервалы даны открытыми, т. е. не имеют границ нижней и верхней соответственно. Для определения среднего значения в них границы интервалов следует закрыть. Для первой группы с размером площади до 40 м 2 условно считаем, что интервал также равен 20 м 2 , затем вычитаем 20 м 2 из 40 м 2 и находим условную нижнюю границу первого интервала (20 – 40). Условную верхнюю границу последнего интервала определяем аналогично (100 – 120).

Расчеты следует проводить в табл. 15.

Таблица 15

Группировка мага- зинов по торговой площади, м 2 (х )

Удельный вес магазинов, % (f )

Середина интервала (х )

х А

Наибольшая частота f равна 40, следовательно, в качестве постоянной величины А принимаем 70.

Определяем момент первого порядка:
.

Среднее значение признака равно:

+ 70 = = 68 м 2 .

Следовательно, средняя площадь магазина составляет 68 м 2 .

5.3. Структурные средние

В качестве структурных средних чаще всего используют показатели моды и медианы. Мода (Мо ) – наиболее часто повторяющееся значение признака. Медиана (Ме ) – величина признака, которая делит упорядоченный ряд на две равные по численности части.

Если расчет моды и медианы проводится в дискретном ряду, то он опирается на их понятия. В интервальном ряду распределения для расчета моды и медианы применяют следующие формулы.

Мода рассчитывается по формуле

где х Мо – нижнее значение модального интервала;

i Мо – размер модального интервала;

f Мо – частота модального интервала;

f Мо –1 – частота, предшествующая модальной частоте;

f Мо +1 – частота, последующая за модальной частотой.

Модальному интервалу соответствует наибольшая (модальная) частота. Медиана рассчитывается по формуле

,

где х Ме – нижнее значение медианного интервала;

i Ме – размер медианного интервала;

f – сумма частот;

S Ме –1 – сумма частот, предшествующих медианной частоте;

f Ме – медианная частота.

Медианному интервалу соответствует медианная частота. Таким интервалом будет интервал, сумма накопленных частот которого равна или превышает половину суммы всех частот.

Рассмотрим определение моды и медианы на следующих примерах.

Пример 6 . В результате статистического обследования области получены следующие данные по распределению семей по числу детей (табл. 16).

Таблица 16

Следует определить моду и медиану.

Решение

В дискретных рядах модой является варианта с наибольшей частотой. Наибольшая частота – 34, следовательно мода равна 2.

Для вычисления медианы определим сумму частот ряда (f = 100), затем рассчитаем полусумму
.

Так как сумма накопленных частот 5 + 32 + 34 = 71 превышает полусумму (71 > 50), то варианта, имеющая значение 2 и соответствующая этой накопленной сумме частот, и есть медиана.

Пример 7 . В результате статистического обследования получены следующие данные распределения продавцов магазинов облпотребсоюза по возрасту (табл. 17).

Таблица 17

Необходимо определить моду и медиану.

Решение

В интервальных рядах мода и медиана определяются по вышеприведенным формулам.

Сначала определим модальный интервал, он соответствует наибольшей частоте. Так как наибольшая частота равна 35 и является модальной, то интервал 30–40 является модальным интервалом. Затем подставим данные в следующую формулу:

Определим медианный интервал. Полусумма частот равна 50
. Накапливая частоты, определим интересующий интервал. Так как сумма накопленных частот 6 + 24 + 35 = 65 превышает полусумму (65 > 50), значит 35 является медианной частотой, а интервал 30–40 является медианным интервалом.

Затем подставим данные в формулу

Таким образом, мода равна 35,5 лет (больше всего продавцов в возрасте 35,5 лет), медиана – 35,7 лет (50 % продавцов достигли возраста 35,7 лет).

(называемых моментами или моментными функциями ) , интегрируемых по мере , выполнены условия на моменты

Пусть - выборка случайной величины X. Предполагается, что соотношения аналогичные условиям на моменты выполнены и для выборки, а именно вместо математического ожидания в условиях на моменты необходимо использовать выборочные средние:

причем в данном представлении (когда справа от равенства - ноль) достаточно использовать просто суммы вместо средних.

Оценки, получаемые из решения этой системы уравнений (выборочных условий на моменты), называются оценками метода моментов . Название метода связано с тем, что чаще всего в качестве функций выступают функции степенного вида, математические ожидания от которых в теории вероятностей и математической статистике принято называть моментами.

Если моментные функции непрерывны, то оценки метода моментов состоятельны .

Частные случаи

Некоторые классические методы оценки регрессионных моделей можно представить как частные случаи метода моментов. Например, если линейная регрессионная модель удовлетворяет условию , то условия на моменты выглядят следующим образом:

Следовательно, в этом случае оценка метода моментов будет совпадать с оценкой метода наименьших квадратов

Таким образом, МНК является частным случаем метода моментов, когда выполняется условие ортогональности регрессоров и случайных ошибок

Рассмотрим другой случай, когда имеются некоторые переменные z, ортогональные случайным ошибкам линейной регрессионной модели, то есть . Тогда имеем выборочный аналог этого условия:

Следовательно оценка метода моментов будет совпадать с оценкой метода инструментальных переменных : .

В некоторых случаях, редких при больших объемах данных и более частых при малом их количестве, оценки, даваемые методом моментов могут оказаться вне допустимой области. Такая проблема никогда не возникает в методе максимального правдоподобия. Также, оценки по методу моментов не обязательно оказываются достаточной статистикой , то есть, они иногда извлекают из данных не всю имеющуюся в них информацию.

См. также


Wikimedia Foundation . 2010 .

Смотреть что такое "Метод моментов" в других словарях:

    метод моментов - momentų metodas statusas T sritis fizika atitikmenys: angl. method of moments; moments method vok. Momentenmethode, f rus. метод моментов, m pranc. méthode de moments, f … Fizikos terminų žodynas

    В математической статистике это способ построения оценок, основанный на уравнивании теоретических и выборочных моментов. (Пирсон 1894г.) Содержание 1 Определение 2 Замечания … Википедия

    - (ОММ, GMM Generalized Method of Moments) метод, применяемый в математической статистике и эконометрике для оценки неизвестных параметров распределений и эконометрических моделей, являющийся обобщением классического метода моментов. Метод был… … Википедия

    - (ИП, IV Instrumental Variables) метод оценки параметров регрессионных моделей, основанный на использовании дополнительных, не участвующих в модели, так называемых инструментальных переменных. Метод применяется в случае, когда факторы… … Википедия

    Или метод наибольшего правдоподобия (ММП, ML, MLE Maximum Likelihood Estimation) в математической статистике это метод оценивания неизвестного параметра путём максимизации функции правдоподобия. Основан на предположении о том, что… … Википедия

    метод распределения моментов - Метод расчёта сложных статически неопределимых рам, при котором первоначально неуравновешенные моменты в узлах уравновешиваются по методу последовательных приближений с помощью коэффициентов распределения моментов [Терминологический словарь по… … Справочник технического переводчика

    Метод определения распределения вероятностей по его моментам. В теоретич. отношении М. м. основан на единственности решения моментов проблемы:если нек рые постоянные, то при каких условиях существует единственное распределение такое, что суть… … Математическая энциклопедия

    Метод расчёта сложных статически неопределимых рам, при котором первоначально неуравновешенные моменты в узлах уравновешиваются по методу последовательных приближений с помощью коэффициентов распределения моментов (Болгарский язык; Български)… … Строительный словарь

    - (от греч. methodos путь, способ исследования, обучения, изложения) совокупность приемов и операций познания и практической деятельности; способ достижения определенных результатов в познании и практике. Применение того или иного М. определяется… … Философская энциклопедия

    - (лат. associatio соединение, присоединение) исследовательский, диагностический и терапевтический прием психоанализа. Основан на использовании феномена ассоциативности мышления для познания глубинных (преимущественно бессознательных) психических… … Новейший философский словарь

Книги

  • Электродинамическое моделирование антенных и СВЧ структур с использованием FEKO , Курушин Александр Александрович, Банков Сергей Евгеньевич, Грибанов Александр Николаевич. Данная книга представляет собой систематическое описание одной из самых мощных современных программ электродинамического моделирования - FEKO. Программа FEKO имеет мощную систему черчения…

При исследовании случайной величины Х по результатам её испытаний часто требуется найти закон её распределения. Тип распределения можно угадать по виду гистограммы или полигона. Будем называть выбранное нами распределение теоретическим . Каждое теоретическое распределение содержит один или более параметров a 1 , a 2 , … , a S , которым должны быть присвоены некоторые значения. Например, экспоненциальное распределение с плотностью вероятностей f(x) = lexp(-lx) содержит один параметр l , а нормальное распределение с плотностью

содержит два параметра m и s . Параметры теоретического распределения нужно выбирать, очевидно, так, чтобы полученное распределение как можно лучше согласовывалось с опытными данными, то есть с выборкой. Другими словами, теория должна как можно точнее описывать эксперимент. Одним из способов выбора параметров теоретического распределения является метод моментов : параметры a 1 , a 2 , … ,a k выбираются так, чтобы k первых моментов теоретического распределения совпадали с их выборочными оценками.

Рассмотренные нами в начале параграфа распределения содержат один или два параметра. Первыми двумя моментами являются математическое ожидание и дисперсия. Поэтому метод моментов в нашем случае сводится к такому выбору одного или двух параметров теоретического распределения, чтобы выполнялось первое или или равенства:

m x = ; = , (1.24)

где и – оценки математического ожидания и дисперсии по выборке.

Например, в случае экспоненциального распределения имеется только один параметр l , при этом m x = и из первого равенства (1.24) получаем l = . В случае же нормального распределения параметров два, при этом m x = m и , поэтому из обоих равенств (1.24) получаем два параметра: и .

Отметим, что метод моментов является лишь одним из возможных методов определения параметров теоретического распределения. Для некоторых типов распределений он может дать плохие результаты. Рассмотрим, например, равномерное распределение с плотностью , x Î . Его параметры a и b связаны с m x и равенствами и . Метод моментов приводит к системе уравнений:

Может случиться, что найденная из этой системы нижняя граница распределения a , окажется больше некоторых значений из выборки, или же верхняя граница b окажется меньше некоторых выборочных значений. Теоретическое распределение с такими параметрами a и b следует сразу же отвергнуть как противоречащее условию, что все значения Х должны принадлежать отрезку .

В случае равномерного распределения следует выбирать значения:

; , (1.25)

которые не приводят к описанным выше противоречиям. Если имеется группированная выборка, то а – левая граница первого разряда, b правая граница последнего разряда.

Аналогичным образом можно определить некоторые из параметров других ограниченных распределений. Рассмотрим, например, смещённое экспоненциальное распределение с плотностью:

(1.26)

сосредоточенное на интервале (а, ¥) . Параметр сдвига а определяется из первого соотношения (1.25), а для определения l используем метод моментов, приравнивая математические ожидания: , откуда .

Критерии согласия.

Относительно имеющейся выборки S могут быть высказаны какие–то предположения или гипотезы . Например, мы можем выдвинуть гипотезу о том, что исследуемая случайная величина Х имеет нормальное распределение. Методы проверки гипотез в математической статистике называют критериями .

В общем случае проверка гипотезы производится следующим образом. Пусть относительно выборки S выдвинута гипотеза Н 0 . Критерием является некоторая функция U = U (S , H 0) . Вся область значений D критерия U делится на две области D 0 и D 1 . Если вычисленное значение критерия принадлежит области D 0 , то гипотеза H 0 принимается, в противном случае Н 0 отвергается. Область D 0 называется областью допустимых значений или областью принятия гипотезы , область D 1 называется областью отклонения гипотезы или критической областью .


Поясним это следующим примером. Пусть выдвинута гипотеза Н 0 , что вероятность события А равна 0,6 . В серии же из 100 опытов событие произошло m раз. В качестве критерия примем функцию U = | m/100–0,6| , то есть отклонение относительной частоты события А в серии из 100 испытаний от предлагаемой вероятности 0,6 . Множество значений D критерия есть отрезок . Естественно принимать гипотезу Н 0 , если m/100 не слишком отличается от 0,6 и отвергать, если разница велика, например, превышает 0,2 . Таким образом, Н 0 принимается, если значение U = |m/100–0,6| £ 0,2 , и отвергается, если U > 0,2 . Для этого примера области D 0 и D 1 показаны на рис.1.8.

Рис.1.8. Допустимая и критическая области принятия решения.

Выборка S является случайной, поэтому и U(S , H 0) является случайной величиной. Следовательно, принятие или отклонение гипотезы – случайные события и при проверке гипотез возможны следующие ошибки.

1. Гипотеза верна, но отвергается (ошибка первого рода ).

2. Гипотеза неверна, но принимается (ошибка второго рода ).

Вероятность b ошибки первого рода называют уровнем значимости критерия. Таким образом, уровень значимости есть вероятность отвергнуть истинную гипотезу.

Если - вероятность ошибки второго рода, то называется мощностью критерия . Это вероятность отвержения неверной гипотезы.

Вероятности обеих ошибок желательно минимизировать, но оказывается, что попытка уменьшить вероятность одной ошибки приводит к увеличению вероятности другой. Поэтому вероятность одной из ошибок задаётся, а вероятность второй ошибки стараются сделать минимальной.

Чаще всего для проверки гипотез о законах распределения применяется критерий согласия χ 2 (хи-квадрат), предложенный К.Пирсоном. Рассмотрим этот критерий.

Пусть имеется группированная выборка S и выдвинута гипотеза H 0 , что случайная величина Х имеет функцию распределения F(x) . Если бы гипотеза Н 0 была верна, то вероятность попадания значения Х в i –ый частичный интервал была бы равна

P i = F(a i +1) – F(a i) , (1.27)

а математическое ожидание числа попаданий Х в этот полуинтервал, то есть ожидаемая или теоретическая частота была бы равна

n i = nР i , (1.28)

где n = m 1 + m 2 + … + m k . Критерий χ 2 оценивает меру расхождения теоретическихnP i и статистических (или выборочных ) частот m i :

χ 2 = . (1.29)

Чем больше отличаются m i от nP i , тем больше значение χ 2

К.Пирсон доказал, что при истинности H 0 распределение случайной величины (1.29) при n®¥ неограниченно приближается к так называемому c 2 – распределению , независимо от вида распределения F(x) . Это приближение к c 2 – распределению можно считать удовлетворительным, если все частоты m i достаточно велики. Будем поэтому предполагать, что все m i ≥ 6 .

Следует отметить, что между теоретическими частотами n i = nP i и статистическими частотами m i имеются некоторые связи. Одна связь имеется всегда:

n 1 + n 2 + … + n k = m 1 + m 2 + … + m k = n . (1.30)

Другие связи появляются при оценке параметров теоретического распределения по выборке. Если, например, приравнены теоретическое и выборочное среднее, то имеется одна дополнительная связь. Если приравнены ещё и дисперсии, то дополнительных связей будет две. Эти связи приводят к зависимости слагаемых в выражении (1.29) между собой.

Наличие связей учитывается определением числа независимых слагаемых в выражении (1.29), называемом числом степеней свободы , которое определяется по формуле:

r = k – 1 – s , (1.31)

где k – число частичных интервалов группированной выборки, s – число дополнительных связей (кроме связи (1.30)) между теоретическим распределением и выборкой. Число s равно количеству параметров теоретического распределения, определённых именно по выборке. В это число не входят параметры, определённые по каким – либо соображениям независимо от выборки. Например, может быть известно заранее, что X имеет нулевое математическое ожидание. Тогда при гипотезе о нормальном распределении будет наложена только одна дополнительная связь – приравниваются теоретическая и выборочная дисперсии. Дополнительных связей может и вообще не быть (s = 0) , если, к примеру, без предварительного анализа выборки (или даже до её получения) выдвинуть гипотезу о теоретическом распределении с фиксированными значениями входящих в него параметров.

Распределение вероятностей типа c 2 полностью определяется числом степеней свободы r , в зависимости от которого составляются таблицы этого распределения, и F r (x) – функция распределения случайной величины c 2 с r степенями свободы.

Пусть число степеней свободы r определено. Допустим, что c 2 b удовлетворяет равенству: F r () = 1 – b . Это означает, что:

P(c 2 > ) = b , (1.32)

то есть вычисленное по формуле (1.29) значение c 2 (в случае истинности гипотезы Н 0 ) превосходит значение с вероятностью b .

Таким образом, если гипотезу Н 0 принимать в случае c 2 £ и отвергать при c 2 > , то верная гипотеза Н 0 будет отвергаться с вероятностью b , то есть b является уровнем значимости сформулированного критерия. Критические значения даны в приложении 2в зависимости от уровня значимости b и числа степеней свободы r .

Итак, применение критерия c 2 сводится к следующему. Выбирается (или задаётся) уровень значимости b . По группированной выборке с частотами m i не менее шести вычисляется значение c 2 по формуле (1.29). По найденному числу степеней свободы r и заданному b находится критическое значение из таблицы в приложении 2. Применяется решающее правило:

c 2 £ ® H 0 принимается,

c 2 > ® H 0 отвергается.

Если в имеющейся группированной выборке встречаются частоты, которые меньше шести, то следует объединить некоторые соседние интервалы, чтобы все частоты m i были не менее шести.

Если некоторая гипотеза о теоретическом распределении F(x) в результате применения критерия была принята, F(x) может использоваться в дальнейшем для решения различных задач о случайной величине Х (но до тех пор, пока не будут получены экспериментальные данные, которым гипотеза Н 0 противоречит). Если же Н 0 оказалась отвергнутой, то следует подобрать и проверить гипотезу о другом теоретическом распределении, которая выглядит достаточно правдоподобно на фоне имеющихся экспериментальныхданных.

Замечание . Если гипотеза H 0 оказалось принятой , то это еще не значит, что она верна , так как имеется некоторая вероятность ошибки второго рода. Гипотеза H 0 принята не потому, что она верна (так это или не так, нам неизвестно), а потому, что она выглядит правдоподобной при имеющейся выборке S. Аналогично, если гипотеза H 0 отвергнута , то не следует категорически утверждать, что она ложна , так как возможна ошибка первого рода (отвергнуть верную гипотезу). Уровень значимости β и есть вероятность такой ошибки. Мы отвергаем гипотезу потому, что она выглядит неправдоподобной при имеющихся наблюдениях, т.е. выборке S. Напомним, что ошибки в проверке гипотез проистекают из-за случайности значений выборки, что связано с тем, что эти значения – результаты испытаний случайной величины.

Следует отметить, что определяемое по данному уровню значимости критическое значение содержит некоторую погрешность, так как распределении величины (1.29) несколько отличается от распределения c 2 . Это отличие вызвано конечностью объёма выборки и способом выбора значений параметров теоретического распределения. Более корректным в данной ситуации является метод минимума c 2 , состоящий в том, что параметры теоретического распределения выбираются так, чтобы величина (1.29) приняла минимально возможное значение. Однако этот метод трудно реализуем и поэтому применяется редко.


Похожая информация.