Параметрические методы оценивания. Параметрические и непараметрические методы статистики

При решении вопросов построения моделей систем особую актуальность имеет задача формирования исходной информации о параметрах элементов, входящих в состав системы. От точности и достоверности исходной информации зависит точность оценок анализируемых характеристик систем, точность расчетов по оптимизации стратегий функционирования и правил их обслуживания, решение проблем, связанных с прогнозированием поведения системы в будущем, и другие вопросы. При формировании исходной информации о параметрах элементов, как правило, за основу берется информация, получаемая в ходе проведения обследования систем и изучения опыта ее эксплуатации. Иными словами за основу берется информация о поведении комплектующих элементов системы в процессе ее функционирования.

Анализ исходных показателей элементов, узлов, составных частей, который производят на этапах эксплуатации, испытаний, конструкторских разработок, выполняется в целях разрешения следующих вопросов:

определения фактических значений исследуемых характеристик комплектующих элементов в условиях их реальной эксплуатации;

выявления взаимосвязи изучаемых характеристик элементов и условий их эксплуатации, анализа влияния на исследуемые показатели внешних воздействий;

прогнозирования поведения вновь создаваемого оборудования.

Таким образом, для решения указанных задач, в первую очередь,

необходимо организовать контроль за поведением оборудования в реальных условиях его эксплуатации. В дальнейшем информация, получаемая в процессе эксплуатации объектов, используется для построения моделей систем, в отношении которых проводится анализ.

При проведении экспериментальных исследований большую роль играет информация, полученная в результате наблюдений за объектами, поведение которых имеет вероятностную природу. Изучение таких систем осуществляется по результатам реализации выходных параметров, являющихся случайными величинами. Наиболее общей характеристикой, описывающей поведение одномерной случайной величины, является ее плотность распределения / (0- Зная плотность распределения случайной величины, можно однозначно определить такие характеристики, как вероятность реализации некоторого события, интенсивность наступления события, среднее время между реализациями событий и пр. Приведем формулы, позволяющие оценить соответствующие показатели.

Вероятность реализации события за время t определяется по формуле

Q{t) = F(t)=\f(t)dt.

На практике часто находит применение величина, определяемая через функцию распределения следующим образом:

Например, в теории надежности так определяется вероятность безотказной работы.

Среднее время между реализациями событий определяется из соотношения

T a =]tf(f)dt=]p(t)dt.

Интенсивность наступления события можно определить по формуле

" _ /(f) _ ClF j t ) I _ dP (t) 1 P(t)dt P{t) dt Pit)"

Таким образом, зная плотность или функцию распределения случайной величины, можно перейти к определению характеристик сложной системы. На практике функция распределения бывает неизвестна. Ее приходится восстанавливать по статистическим данным реализации случайной величины. Поскольку статистика о результатах наблюдений всегда присутствует в ограниченном виде, восстановление функции распределения возможно с некоторой долей достоверности. Следовательно, если функция распределения оценена с определенной ошибкой,

урЫа

f (х - т ) 2 ^ 2а 2

" (х-т ) 2 ^ 2 а 2

Вычислим частные производные:

d P N (t,m, o ) _ 1

d m

d P N (t, т, О ) _ д а 2

г г \ т

2 о 2

\ /-J

то и вычисление характеристик системы будет также осуществляться с ошибкой.

Точность оценивания показателей сложных систем характеризуется величиной дисперсии. Пусть необходимо произвести оценивание некоторого показателя R(t). Покажем, как определяется дисперсия в его оценке. Будем считать, что показатель R(t ) определяется через функцию распределения. Пусть функция распределения зависит от двух параметров аир. Примерами двухпараметрических функций являются нормальное распределение, усеченное нормальное, логарифмически нормальное, гамма-распределение, распределение Вейбулла и ряд других. Итак, пусть F(t) = F(t, а, р). Соответственно оцениваемый показатель сложной системы можно представить как функционал от F(t) = F(t, а, р):

K(r) = K = K(f,a,p).

Разложим оценку R ( t) в ряд Тейлора в точке а, р и ограничимся тремя членами:

i(0 = K(0+^®(a-a)+^®(p-p).

К обеим частям данного выражения применим операцию вычисления дисперсии

(t- m ) 2

-т ехр

Нормальное распределение

Плотность нормального закона распределения имеет вид

P n (t, m , о) = 1 -7=- J ехр

F n (t , т, о) = -у=- J ехр

(t-m )

2о 2

Среднее время между реализациями событий определяется по форму

(t- m) 2 2 a 2

где cov(a, Р) - ковариация между параметрами аир. Таким образом, для оценки дисперсии некоторого показателя необходимо определить частные производные данного показателя по параметрам закона распределения и дисперсии в оценке параметров закона распределения.

Рассмотрим вопросы определения частных производных для показателей, введенных выше для конкретных законов" распределения. Определение дисперсии оценок параметров законов распределения будет описано далее.

В качестве примера рассмотрим определение частных производных оцениваемого показателя по параметрам закона распределения для нормального закона.

Ґ ( t-m) 2 ^

2 с 2

Соответственно частные производные определяются как

d T N (m, a ) 1 7

-- - = - f=~ ехр

d m V2nab

d T N (m , o ) I

i t = Ф

f 2 ~\ m

2 0

\ /

И, наконец, для интенсивности наступления события имеем

X(t, т,о) = -

Одностороннее усеченное нормальное распределение

Плотность распределения усеченного нормального закона с односторонним усечением слева в точке 0 имеет вид

/ (t-m ) 2 ^ 2 а 2

\ І2 по

(X - т) 2 2а 2

\І2по{

Выражения для частных производных имеют вид

dX N (t, m,a ) _ f N (t, m,a )" m (l -F N (t, m,o))-f N (t, m,o )[ l-F N (t, m,o )]" m m

d m

с = -

(*-Ю 2 2 Ъ

о yj2nb

, ., t-m I (t-m ) 2
f H (fW O ra =Ir=-T ex PV

Ґ , ч2 4 V
( t-m) 2

( 2 M т

2 а 2
\

2с7
\ / J

" a2

da 2

2

[( t-m ) 2 - a 2 ] 2л/2лст 3

(t-m )

d x

P (Щ ,Ь) = \- {

(t -m) 2 a 2

m 2O 2

\ =

(t - m) exp

m exp

2 \І 2 по 3

Введем обозначения:
R = J ехр

J

Таким образом, представлены формулы для определения соответствующих производных показателей по параметрам закона распределения для нормального закона. Обобщением нормального закона распределения является усеченное нормальное распределение. Рассмотрим применение одностороннего усеченного нормального распределения в задачах оценивания показателей сложных систем. В ряде задач системного анализа случайные параметры положительно определены. Примером могут служить задачи теории надежности, в которых случайные параметры имеют область определения от 0 до например, наработка до отказа - величина положительно определенная. В этом случае нормальный закон распределения применять для описания данных случайных величин неправомерно. В таких ситуациях применяют усеченное слева нормальное распределение. Рассмотрим данный случай применительно к оцениванию показателей надежности.

(х-ц) 2 2 Ь

( х - У-У

dx ; Q = j exp

Соответствующие производные имеют вид

Ґ 2\ .Hl
2 Ъ

r," H

d b (Q-Rf
где соответствующие составляющие определяются по формулам

Среднее время между реализациями событий определяется по формуле

2 Ь 2

/ . .і \ (*-Ю

S / ч’ ^

л/тс л/тс фГ Г-М-

(Q-W b =^ exp

I^lb I- J l b Jb

Обозначим числитель через L.
Соответствующие производные вычисляются по формулам

Логарифмически-нормальное распределение
Логарифмически-нормальному закону распределения подчиняется случайная величина t, логарифм которой распределен по нормальному закону. Плотность распределения логарифмически-нормального закона имеет вид

КМЬ) _ i;q-% l Jf _ urz _______

"-!Li S )

/ 2 N .й! 2fc

ЩАМ KQ-Ul.
-^ , А,-ех Р

Функция распределения имеет вид

2 Ь 2

Наконец, интенсивность наступления событий равна

(*-10 2 В

2 Ь

где В = Ъ 1 .
Запишем формулы для определения показателей надежности

(х -M-) 2 2 Ъ

(x -\i .? 2 Ъ

dx -j exp о

Я„(*,И,Д) = I - Jexp

Введем обозначение

Соответствующие производные имеют вид

(*-Ю

M = ехр

2 \

( (I n f -H ) 2 В

Р лн (; , Н.Д ) _ 1 Эн - J l nB
P„Jt,\i,B) 1пг-н

Определим производные интенсивности по параметрам
dk yM (t,№) _ M^jQ-R )- (Q -RY 11 M ЭЦ (Q-R) 2 :

э в

( (г-н) м 2 Ь

Для определения средней наработки до отказа используют формулу

(г-ю 2

M 11 =-т^ехр

; (б-Л)"= ехр

и последнее выражение
Производные равны

дТ ля Ц , р , В ) 1 (в ,

Запишем выражение для вероятности безотказной работы

Выражение для определения интенсивности отказов имеет вид \J t, \i , B) = -

P B (t,a,b) = exp\

K a J

Вычислим производные данного выражения по параметрам распределения:

<У2дВ I 2 В

Э P^(t,a,b) _ b да а
d P B (t, a , b ) _

Частные производные определяются из выражений
Э КЛ^В) _
^ 2

L tjbw в ехр|

(lnf - |X ) 2 2 В

где (/ лн (0)

7 B(a ^) = J ex P

(Inf-(X ) 2 2 В

Э T B (a,b)_~ r b(t

* (t" In

\d f , Э7в(а ^ э ь

дК»ЩВ) (0 ) " й (I - (0 )- /л. „ (I - F n J t))"
ЭВ 2

* п

Интенсивность отказа равна

(^ b -" , а
Производные по параметрам имеют вид

it, а, Ь )

(1 - F „„) = - I n Vii exp

_ (I n f - (X ) 2 В

Э^а, b ) Ь 2

Э Х в іа,Ь )_Ґ" Ь

да ~ а 2

д Ь а ь а

а ,

Распределение Вейбулла
Плотность распределения Вейбулла имеет вид
f B (t,a,b) = -(-

Гамма-распределение
Плотность гамма-распределения записывается следующим обра

F B (t,a,b) = 1-ехр

Соответственно функция распределения имеет вид
х, а *
F r (t, X,а) = f х а ~ " exn (-Xx ) dx.
Вероятность безотказной работы вычисляется по формуле
P v (t , X , a) = I fехр(-Xx)dx.
Производные по параметрам равны
і і OcX a4 Jx a4 exp (-Xx) Jx-X a Jx a exp( -Xx)dx
Э Х г (г,а,Х ) _ (f r ( ‘Xa)) K - / r (f ,X, a ); Эа 2

J ехр(-Хх)(а - Xx)dx \

[!-,F r (ZAa)];=-

дР г (t, X , а) _ X 1

Па) і
дР ^да ’ а) = ~ Г^а) I * а ~" ex P(-^t r (a)(ta ^ - 111 0 - Г"(а)]Жс, где Г(а) = J X a t a ~ " ехр(- Xt)dt =J Z a " 1 ехр(-г)<&; Г(а) = J г“"’ exp(-z) In z 4 z ■
Средняя наработка до отказа определяется по формуле
Г г (о,Х)= J^- e xp (-Xt)d i =~.
оГ(а)X
Соответствующие производные равны
дТ г (а,Х ) а дГ г ( а ,Х) _ 1 ЭХ. X 2 ’ да ~Х"
Интенсивность отказов записывается
X a t a -" е хр (- Xt )
X r (t, а ,Х ) =
(f r (t , X ,a )) a = ^-y-^-[(X a InXf a "exp(- Xt)+X a t a 1 Infexp(-Xt))-
X 1 V a " 1 exp(-Xf)r„ (a)];
Г а ((X)X a Jjr a " 1 exp (-Xx) Jx-
t t X а In Xj X а ’ 1 exp (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx
Таким образом, получены выражения, позволяющие решать вопросы оценки точности в определении показателей сложных систем. Рассмотрены наиболее часто используемые в системном анализе законы распределения. Получены формулы для определения основных показателей систем и вычислены первые частные производные показателей по параметрам соответствующих законов распределения. Следующим вопросом, который требует решения, является вопрос оценивания параметров выбранного закона распределения. Рассмотрим, как решается данная задача.

Производные по параметрам определяются в виде
d X r ( t,a , X) _ (f r (t X а) ) \ -/ r (t , X,a) 2
где a ^ g " 1 «pW-X-r-exp(-Xr)
Критерий t-Стьюдента для независимых и
зависимых выборок.
Критерий F-Фишера.
Критерий U-Манна-Уитни.
Критерий T-Вилкоксона и др.
Статистические критерии – это
ПРАВИЛО, обеспечивающее принятие
истинной и отклонение ложной гипотезы с
высокой вероятностью.
Статистические критерии – это МЕТОД
расчета определенного числа.
Статистические критерии – это ЧИСЛО.
Параметрические критерии – это
критерии, включающие в формулу расчета
параметры распределения (среднее и
дисперсии).
Непараметрические критерии – это
критерии, не включающие в формулу
расчета параметров распределения и
основанные на оперировании частотами
или рангами.

Позволяют прямо оценить различия в средних,
полученных в двух выборках (t-критерий
Стьюдента)
Позволяют прямо оценить различия в дисперсиях
(критерий F-Фишера)
Позволяют выявить тенденции изменения признака
при переходе от условия к условию (дисперсионный
однофакторный анализ)
Позволяют оценить взаимодействие двух и более
факторов и их влияние на изменение признака
(двухфакторный дисперсионный анализ)
Возможности и ограничения параметрических критериев
Экспериментальные данные должны отвечать двум, а
иногда трем, условиям:
а) значения признака измерены по интервальной
шкале;
б) распределение признака является нормальным;
в) в дисперсионном анализе должно соблюдаться
требование равенства дисперсий в ячейке комплекса.
Если перечисленные условия выполняются, то
параметрические критерии оказываются более
мощными, чем непараметрические.

Позволяют оценить лишь средние тенденции, например,
ответить на вопрос, чаще ли в выборке А встречаются
более высокие, а в выборке Б – более низкие значения
признака (критерии Розенбаума, Манна-Уитни,
угловое преобразование Фишера и др.).
Позволяют оценить лишь различия в диапазонах
вариативности признака (критерий угловое
преобразование Фишера).
Позволяют выявить тенденции изменения признака при
переходе от условия к условию при любом
распределении признака (критерии тенденций
Пейджа, Джонкира).
Возможности и ограничения непараметрических критериев
Отсутствует возможность оценить взаимодействие
двух и более факторов.
Экспериментальные данные могут НЕ ОТВЕЧАТЬ
ни одному из условий параметрической статистики:
а) значения признака могут быть представлены в
любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и
совпадение его с каким-либо теоретическим законом
распределения необязательно и не нуждается в
проверке;
в) требование равенства дисперсий отсутствует.

Статистический критерий имеет эмпирическое и
критическое значение.
Эмпирическое значение критерия – это число, полученное
по правилу расчета критерия.
Критическое значение критерия – это число, которое
определено для данного критерия при заданных переменных
(например, количества человек в выборке), выделяющее
зону значимости и незначимости для признака. См.
Таблицы критических значений критерия.
По соотношению эмпирического и критического значений
критерия выявляется уровень статистической значимости и
делается вывод о том, подтверждается или опровергается
нулевая гипотеза.
Правило принятия статистического вывода
1) на основе полученных экспериментальных
данных вычислить эмпирическое значение
критерия Кэмп
2) по соответствующим критерию таблицам
найти критические значения К1кр и К2кр, которые
отвечают уровням значимости в 5% и 1%
3) записать критическое значение в виде:
К1кр для p ≤ 0 05 и К2кр для p ≤ 0 01
10. 4) расположить эмпирическое значение критерия Кэмп и критические значения К1кр и К2кр на оси значимости (ось абсцисс Ох
декартовой системы координат, на
которой выделено три зоны: левая (незначимости),
средняя (неопределенности, р ≤ 0,05), правая
(значимости, р ≤ 0,01)
11. Правило принятия статистического вывода
5) сформулировать принятие решения:
если Кэмп находится в зоне незначимости, то
принимается гипотеза Н0 об отсутствии различий;
если Кэмп находится в зоне неопределенности, то
есть вероятность принятия ложного решения
(необходимо увеличить выборку или воспользоваться
другим критерием);
если Кэмп находится в зоне значимости, то гипотеза
об отсутствии различий Н0 отклоняется и
принимается гипотеза Н1 о наличии различий
12. Правило признания значимости различий
В большинстве случаев для признания различий
значимыми ЭМПИРИЧЕСКОЕ (полученное)
ЗНАЧЕНИЕ КРИТЕРИЯ должно ПРЕВЫШАТЬ
КРИТИЧЕСКОЕ (табличное) в соответствии с
числом степеней свободы для двух независимых
выборок df = (n1 + n2) – 2, для двух зависимых
выборок df = (n1 + n2) – 1 или объемом выборки
(n).
Исключение: критерий U-Манна-Уитни, критерий
G-знаков, критерий T-Вилкоксона, в которых нужно
придерживаться противоположного правила.
13. Зависимые и независимые выборки
Зависимые выборки – это те выборки, в
которых каждому респонденту одной выборки
поставлен в соответствие по определенному
признаку респондент другой выборки.
Независимые выборки – это те выборки, в
которых вероятность отбора любого
респондента одной выборки не зависит от
отбора любого из респондентов другой
выборки.
14. Выбор критерия для сравнения двух выборок
Соответствие
распределений
нормальному закону
(параметрический)
Несоответствие
распределения(й)
нормальному закону
(непараметрический)
Независимые
выборки
t – критерий
Стьюдента
для
независимых
выборок
U-критерий
Манна-Уитни;
Зависимые
выборки
t – критерий
Стьюдента для
зависимых
выборок
Критерий
серий
Критерий знаков
Т-критерий
Вилкоксона;
15. Критерий t-Стьюдента для независимых выборок

генеральных совокупностей из которых извлечены
независимые выборки, отличаются друг от друга.
Исходные предположения:
1.
Одна выборка извлекается из одной генеральной
совокупности, другая – из другой (значения
измеренных признаков гипотетически не должны
коррелировать между собой).
2.
В обеих выборках распределение приблизительно
соответствует нормальному закону.
3.
Дисперсии признаков в двух выборках примерно
одинаковы.
16. Критерий t-Стьюдента для независимых выборок
Структура исходных данных: изучаемый
признак(и) измерен у респондентов, каждый
из которых принадлежит к одной из
сравниваемых выборок.
Ограничения:
1. Распределения существенно не отличаются
от нормального закона в обеих выборках.
2. При разной численности выборок дисперсии
статистически достоверно не различаются
(проверяется по критерию F-Фишера или по
критерию Ливена).
17. Формула для подсчетов
где,
– среднее значение первой выборки
– среднее значение второй выборки
– стандартное отклонение по первой выборке
– стандартное отклонение по второй выборке
18. Критерий t-Стьюдента для зависимых выборок
Проверяет гипотезу о том, что средние значения двух
генеральных совокупностей, их которых извлечены
сравниваемые зависимые выборки, отличаются друг от
друга.
Исходные предположения:
1.
Каждому представителю одной выборки поставлен в
соответствие представитель другой выборки.
2.
Данные двух выборок положительно коррелируют.
3.
Распределение в обеих выборках соответствует
нормальному закону.
Структура исходных данных: имеется по два значения
изучаемого признака(ов).
19. Критерий F-Фишера
Применяется для проверки гипотезы о равенстве
дисперсий двух выборок. Его относят к критериям
рассеяния.
*Имеет смысл перед использованием критерия t-Стьюдента
предварительно проверить гипотезу о равенстве дисперсий.
Если она верна, то для сравнения средних можно
воспользоваться критерием t-Стьюдента (гипотезы о равенстве
средних значений в двух выборках).
Критерий Фишера основан на дополнительных
предположениях о независимости и нормальности
выборок данных. Перед его применением
рекомендуется выполнить проверку нормальности
распределения признака.
20. Критерий F-Фишера
В регрессионном анализе критерий Фишера
позволяет оценивать значимость линейных
регрессионных моделей.
В частности, он используется в шаговой
регрессии для проверки целесообразности
включения или исключения независимых
переменных (признаков) в регрессионную модель.
В дисперсионном анализе критерий Фишера
позволяет оценивать значимость факторов и их
взаимодействия.
21. U-критерий Манна-Уитни для независимых выборок
Показывает насколько совпадают (пересекаются) два ряда
значений измеренного признака (ов).
Условия для применения:
1.
Распределение хотя бы в одной выборке отличается от
нормального вида.
2.
Небольшой объем выборки (больше 100 человек –
используют параметрические критерии, меньше 10
человек – непараметрические, но результаты
считаются предварительными).
3.
Нет гомогенности дисперсий при сравнении средних
значений.
22. Т-критерий Вилкоксона для зависимых выборок
В основе лежит упорядочивание величин
разностей (сдвигов) значений признака в
каждой паре его измерений.
Идея критерия заключается в подсчете
вероятности получения минимальной из
положительных и отрицательных
разностей при условии, что распределение
положительных или отрицательных
разностей равновероятно и равно
23. Н-критерий Крускала-Уоллиса для 3 и более независимых выборок
Применяется для оценки различий по степени
выраженности анализируемого признака
одновременно между тремя, четырьмя и
более выборками.
Позволяет выявить степень изменения
признака в выборках, не указывая на
направление этих изменений.
24. Н-критерий Крускала-Уоллиса
Условия для применения:
1. Измерение должно быть проведено в шкале
порядка, интервалов или отношений.
2. Выборки должны быть независимыми.
3. Допускается разное число респондентов в
сопоставляемых выборках.
4. При сопоставлении трех выборок допускается,
чтобы в одной из них было n=3, а в двух других
n=2. Но в этом случае различия могут быть
зафиксированы только на уровне средней
значимости.
25. Критерий Фишера φ* (фи) (Угловое преобразование Фишера)
Критерий φ (фи) предназначен для
сопоставления двух рядов выборочных
значений по частоте встречаемости какоголибо признака.
Этот критерий можно применять на любых
выборках – зависимых и независимых. А
также можно оценивать частоту
встречаемости признака и количественной,
и качественной переменной.
26. Критерий Фишера φ*
Условия для применения:
1. Измерение может быть проведено в любой
шкале.
2. Характеристики выборок могут быть любыми.
3. Нижняя граница – в одной из выборок может
быть только 2 наблюдения, при этом во второй
должно быть не менее 30 наблюдений. Верхняя
граница не определена.
4. При малых объемах выборок, нижние границы
выборок должны содержать не менее 5
наблюдений каждая.
27. Классификация задач и методов их решения
Задачи
Условия
Методы
1. Выявление
а) 2 выборки
Q - критерий Розенбаума;
различий в уровне испытуемых
U - критерий Манна-Уитни;
исследуемого
φ* - критерий (угловое
признака
преобразование Фишера)
б) 3 и более выбоS - критерий тенденций Джонкира;
рок испытуемых
Н - критерий Крускала-Уоллиса.
2. Оценка сдвига а) 2 замера на одной
Т - критерий Вилкоксона;
значений
и той же выборке
G - критерий знаков;
исследуемого
испытуемых
φ* - критерий (угловое
признака
преобразование Фишера).
б) 3 и более замеров
χл2 - критерий Фридмана;
на одной и той же
L - критерий тенденций Пейджа.
выборке испытуемых
28. Классификация задач и методов их решения
Задачи
3. Выявление
различий в
распределении
4.Выявление
степени
согласованности
изменений
Условия
Методы
а) при сопоставлении
эмпирического
признака распределе
ния с теоретическим
χ2 - критерий Пирсона;

m - биномиальный критерий
б) при сопоставлении
двух эмпирических
распределений
χ2 - критерий Пирсона;
λ - критерий КолмогороваСмирнова;
φ* - критерий (угловое
преобразование Фишера).
rs - коэффициент ранговой
корреляции Спирмена.
rs - коэффициент ранговой
корреляции Спирмена
а) двух признаков
б) двух иерархий или
профилей
29. Классификация задач и методов их решения
Задачи
Условия
5. Анализ
а) под влиянием
изменений
одного фактора
признака под
влиянием
контролируемых
условий
б) под влиянием
двух факторов
одновременно
Методы
S - критерий тенденций
Джонкира;
L - критерий тенденций Пейджа;
однофакторный дисперсионный
анализ Фишера.
Двухфакторный дисперсионный
анализ Фишера.
В современных исследованиях по проблемам педагогики широко используются методы математической обработки данных. К методам обработки количественных данных относятся статистические приемы подведения итогов исследования, выявления определенных связей между ними, проверки достоверности выдвинутой гипотезы.

Математическая обработка результатов исследования обеспечивает их доказательность, репрезентативность. В сочетании с качественными показателями количественная обработка данных значительно повышает объективность исследования. Статистическая обработка результатов, регистрирующая изучение отдельных явлений позволяет сделать обобщения и выводы относительно всей совокупности изучаемых явлений. Важной особенностью использования статистических методов в педагогических исследованиях состоит в том, что это позволяет применять количественное изучение даже там, где невозможно определить сами свойства изучаемых объектов. Например, невозможно прямо измерить уровень развития нравственных качеств обучаемых, степень эффективности конкретного метода обучения и пр. Но, регистрируя соответствующие события, поступки, проявления, можно получить определенные качественные характеристики всех этих признаков, определить возможные закономерности их проявления, подтвердить правильность высказанных гипотез.

В статистике проверка гипотез осуществляется с помощью критериев статической оценки различий. Статистический критерий – это решающее правило, обеспечивающее надежное поведение, т.е. принятие истинной и отклонение ложной гипотезы с высокой вероятностью (Г.В.Суходольский). Статистические критерии обозначают также метод расчета определенного числа и само это число.

Статистические критерии, применяемые в педагогике, делятся на параметрические и непараметрические. К параметрическим относятся критерии, включающие в формулу расчета параметры распределения, т.е. среднее и дисперсии (критерии Стьюдента, Фишера, Хи-квадрат). К непараметрическим относят критерии, основанные на оперировании частотами или рангами и не включающие в формулу расчета параметров распределения (критерии знаков, Колмогорова-Смирнова, Уилкоксона, Манна-Уитни). Обе группы критериев имеют свои преимущества и недостатки. Сравнительная характеристика возможностей и ограничений параметрических и непараметрических критериев дана в следующей таблице.

Параметрические критерии Непараметрические критерии
Позволяют прямо оценить различия в средних, полученных в двух выборках (критерий Стьюдента) Позволяют оценить лишь средние тенденции (напр., ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б – более низкие значения признака (критерии Q,U и др.)
Позволяют прямо оценить различия в дисперсиях (критерий Фишера) Позволяют оценить лишь различия в диапазонах вариативности признака
Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S)
Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ) Эта возможность отсутствует
Экспериментальные данные должны отвечать двум, а иногда трем условиям: а) значения признака измерены по интервальной шкале; б)распределение признака является нормальным; в)в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса Экспериментальные данные могут не отвечать ни одному из условий: а) значения признака могут быть представлены в любой шкале, начиная от шкалы наименований; б)распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в)требование равенства дисперсий отсутствует
При выполнении указанных условий параметрические критерии являются более мощными по сравнению с непараметрическими критериями При несоблюдении указанных условий непараметрические критерии более надежны, т.к. они менее чувствительны к «засорениям»
Математические расчеты довольно сложны Математические расчеты большей частью просты и занимают мало времени
Параметрические методы

Критерий Стьюдента

Для сравнения выборочных средних величин, принадлежащих к двум совокупностям данных, и для решения вопроса о том, отличаются ли средние значения статистически достоверно друг от друга в психолого-педагогических экспериментах часто используют t -критерий Стьюдента, расчетное значение которого определяется по формуле:

,

где ‑ среднее выборочное значение переменной по одной выборке данных; ‑среднее выборочное значение по другой выборке данных; m 1 и m 2 ‑ интегрированные показатели отклонений частных значений из двух выборок от соответствующих их средних величин.

Если t расч больше или равно табличному, то делают вывод о том, что сравниваемые средние значения из двух выборок действительно статистически достоверно различаются с вероятностью допустимой ошибки.

Такая методика применяется тогда, когда необходимо установить, удался или не удался эксперимент, оказал или не оказал он влияние на уровень того качества, для изменения которого он предназначался.

Если t расчетное меньше t табличного, то в этом случае нет убедительных оснований для того, что эксперимент удался, даже если сами средние величины в начале и в конце эксперимента по своим абсолютным значениям различны.

Критерий φ*- угловое преобразование Фишера

Данный метод описан во многих руководствах (Плохинский Н.А., 1970; Гублер Е.В., 1978; Ивантер Э.В., Коросов А.В., 1992 и др.) Настоящее описание опирается на тот вариант метода, который был разработан и изложен Е.В. Гублером.

Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта. Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий исследователя эффект.

Суть углового преобразования Фишера состоит в переводе процентных долей в величины центрального угла, который измеряется в радианах. Большей процентной доле будет соответствовать больший угол φ, а меньшей доле - меньший угол, но соотношения здесь не линейные:

φ = 2·arcsin(),

где - процентная доля, выраженная в долях единицы.

При увеличении расхождения между углами φ 1 и φ 2 и увеличения численности выборок значение критерия возрастает. Чем больше величина φ*, тем более вероятно, что различия достоверны.

Рассмотренная выше общая стратегия оценки статистических гипотез в первую очередь определяет применение так называемых параметрических методов математической статистики.

Параметрические методы основаны на некоторых, как правило, вполне вероятных предположениях о характере распределения случайной величины. Обычно параметрические методы, используемые в анализе экспериментальных данных, основаны на предположении нормальности распределения этих данных. Следствием такого предположения является необходимость оценки исследуемых параметров распределения. Так, в случае рассматриваемого далее t -теста Стьюдента такими оцениваемыми параметрами являются математическое ожидание и дисперсия. В ряде случаев делаются дополнительные предположения по поводу того, как параметры, характеризующие распределение случайной величины в разных выборках, соотносятся между собой. Так, в тесте Стьюдента, который часто используют для сравнения средних значений (математического ожидания) двух рядов данных на предмет их однородности или неоднородности, дополнительно делается предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях, из которых эти данные были извлечены.

Достоинством методов параметрического анализа данных является тот факт, что они обладают достаточно высокой мощностью. Под мощностью теста имеют в виду его способность избегать ошибки второго рода, или β-ошибки. Чем меньше оказывается β-ошибка, тем выше мощность теста. Иными словами, мощность теста = 1 – β.

Высокая мощность параметрических тестов, или критериев, обусловлена тем, что данные методы требуют, чтобы имеющиеся данные были описаны в метрической шкале . Как известно, к метрическим шкалам относят интервальную шкалу и шкалу отношений, которую иногда еще называют абсолютной шкалой. Интервальная шкала позволяет исследователю выяснить не только отношения равенства или неравенства элементов выборки (как это позволяет сделать шкала наименований ) и не только отношения порядка (как это позволяет сделать шкала порядка ), но также и оценивать эквивалентность интервалов. Абсолютная шкала вдобавок к этому позволяет оценивать эквивалентность отношений между элементами множества, полученными в ходе измерения. Именно поэтому метрические шкалы относят к сильным измерительным шкалам. Благодаря этой силе параметрические методы позволяют более точно выразить различия в распределении случайной величины при условии истинности пулевых или альтернативных гипотез.

Следует также отметить, что в целом параметрические методы статистики более разработаны в теории математической статистики и поэтому применяются значительно шире. Практически любой экспериментальный результат может быть оценен с помощью какого-либо из этих методов. Именно такие методы и рассматриваются преимущественно в учебниках и руководствах по статистическому анализу данных.

В то же время трудности, связанные с использованием методов параметрического анализа в статистике, состоят в том, что в ряде случаев априорные предположения о характере распределения исследуемых случайных величин могут оказаться неверными. И эти случаи весьма характерны именно для психологических исследований в тех или иных ситуациях.

Так, если сравнивать две выборки с помощью t -теста Стьюдента, можно обнаружить, что распределение наших данных отличается от нормального, а дисперсии в двух выборках значительно разнятся. В этом случае использование параметрического теста Стьюдента может до некоторой степени исказить выводы, которые хочет сделать исследователь. Такая опасность увеличивается, если значения вычисленной статистики оказываются близкими к граничным значениям квантилей, которые используются для принятия или отвержения гипотез. В большинстве случаев, однако, как, например, в случае использования t -теста, некоторые отклонения от теоретически заданных предположений оказываются некритичными для надежного статистического вывода. В других случаях такие отклонения могут создавать серьезную угрозу такому выводу. Тогда исследователи могут разрабатывать специальные процедуры, которые могут скорректировать процедуру принятия решения по поводу истинности статистических гипотез. Назначение этих процедур состоит в том, чтобы обойти или смягчить слишком жесткие требования параметрических моделей используемой статистики.

Один из вариантов таких действий исследователя, когда он обнаруживает, что полученные им данные по своим параметрам отличаются от того, что задано в структурной модели используемого параметрического теста, может состоять в том, чтобы попытаться преобразовать эти данные к нужному виду. Например, как отмечалось в гл. 1, измеряя время реакции, можно избежать высокого значения асимметрии его распределения, если использовать для анализа логарифмы получаемых значений, а не сами значения времени реакции.

Другой вариант действий состоит в отказе от использования каких-либо априорно заданных предположений о характере распределения случайной величины в генеральной совокупности. А это означает отказ от параметрических методов математической статистики в пользу непараметрических.

Непараметрическими называют методы математической статистики, при которых не выдвигаются какие-либо априорные предположения о характере распределения исследуемых данных и не предполагается каких-либо допущений о соотношении параметров распределения анализируемых величин. В этом заключается главное достоинство этих методов.

В полной мере преимущество непараметрической статистики раскрывается тогда, когда результаты, полученные в эксперименте, оказываются представленными в более слабой неметрической шкале , представляя собой результаты ранжирования. Такая шкала называется шкалой порядка. Конечно, в ряде случаев исследователь может преобразовать эти данные к более сильной интервальной шкале, используя процедуры нормализации данных, но, как правило, оптимальным вариантом в этой ситуации является применение именно непараметрических тестов, специально созданных для статистического анализа.

Как правило, тесты непараметрической статистики предполагают оценивание имеющихся соотношений ранговых сумм в двух или более выборках, и на основании этого формулируется вывод о соотношении этих выборок. Примерами таких тестов являются критерий знаков, критерий знаковых рангов Уилкоксона, а также U-критерий Манна – Уитни, которые используются в качестве аналога параметрического t -теста Стьюдента.

В то же время, если результаты измерения оказываются представленными в более сильной шкале, использование непараметрической статистики означает отказ от части информации, содержащейся в данных. Следствием этого является опасность возрастания ошибки второго рода, свойственной этим методам.

Таким образом, методы непараметрической статистики оказываются более консервативными по сравнению с методами параметрической статистики. Их использование грозит в большей мере ошибкой второго рода, т.е. ситуацией, когда исследователь, например, не может обнаружить отличия двух выборок, когда такие отличия на самом деле имеют место. Иными словами, такие методы оказываются менее мощными по сравнению с параметрическими методами. Поэтому использование параметрической статистики в анализе экспериментальных данных, отличающихся от простого ранжирования, как правило, является предпочтительным.

Параметрические методы оценивания
Применение параметрических методов предполагает априорное знание теоретического закона распределения исследуемой величины или его определение по эмпирическим данным, что обусловливает необходимость проверки согласованности ЭД и выбранного теоретического закона. Параметрическая оценка по цензурированным выборкам основывается на традиционных методах математической статистики (максимального правдоподобия, моментов, квантилей), методах линейных оценок и ряде других.

Обработка многократно цензурированных выборок методом максимального правдоподобия допускается при следующих условиях:

6 < N <10, 10 < = N <20, 20 < = N <50, 50 < = N <100, r /N > = 0,5; r / N > = 0,3; r / N > = 0,2; r / N >= 0,1.
Когда эти ограничения не выполняются, можно вычислять только нижнюю доверительную границу параметров распределения.

Оценки, получаемые по методу максимального правдоподобия, при относительно нежестких ограничениях асимптотически эффективны, не смещены и распределены асимптотически нормально. Если непрерывная переменная с функцией плотности f (x , t ) цензурирована в точках а и b (a <b ), то функция плотности распределения при цензурировании определяется как

Функция правдоподобия при N наблюдениях

.

Если переменная дважды цензурирована в фиксированных точках a и b , так, что не наблюдаются k 1 наименьших и k 2 наибольших элементов выборки, то функция правдоподобия

где k 1 и k 2 являются случайными величинами.

При цензурировании с постоянными величинами k =r 1 и k 2=r 2 функция правдоподобия равна

где v1=x r 1+1, v2 =x N - r 2

Решение уравнения правдоподобия при различных схемах цензурирования является достаточно сложной задачей. В явном виде такие решения можно получить только для однопараметрических законов распределения. Известны уравнения для нахождения параметров типовых законов распределения показателей надежности по цензурированным слева выборкам.

Экспоненциальное распределение . Точечные оценки параметра распределения l при различных планах наблюдения:

где Ф(х ) – функция нормального распределения, f (x ) – функция плотности нормального распределения.

Система уравнений (8.7) допускает только численное решение. При таком решении уравнений в качестве начальных приближений неизвестных параметров обычно берут оценки математического ожидания и среднеквадратического отклонения, вычисленные по объединенной выборке.

Логарифмически нормальное распределение . Оценки параметров вычисляют по формулам для нормального закона распределения с заменой значений наработок их натуральными логарифмами.

Р аспределение Вейбулла . Оценки параметров d и b для плана [NUz ] вычисляются на основе системы уравнений

где t m = t r для плана [NUr ], t m = Т для плана [ NUT ].

Системы уравнений (8.8) – (8.9) не имеют аналитического решения и требуют применения численных методов: вначале находится корень первого уравнения (оценка параметра b), затем прямой подстановкой значение оценки параметра d. Для двухпараметрического распределения Вейбулла большие (b>4) или малые (b<0,5) значения параметра свидетельствуют о том, что ЭД не подчиняются этому закону или отношение r /N мало. В таких случаях следует применить непараметрические методы оценивания или перейти к трехпараметрическому закону распределения Вейбулла.

Трудности применения метода максимального правдоподобия обусловливают разработку других методов. Метод моментов обычно приводит к простым вычислительным процедурам, позволяет получить асимптотически эффективные, несмещенные и нормально распределенные оценки, но требует учета типа цензурирования и применим при относительно большом объеме выборки (не менее 30). Использование метода квантилей для оценок параметров законов распределений менее критично к типу цензурирования. Высокая точность оценок достигается оптимальным подбором квантилей, хотя такой подбор не всегда удается осуществить.

Метод линейных оценок применяют при небольшом объеме выборки, он обеспечивает высокую эффективность, состоятельность и несмещенность оценок параметров распределения. Этот метод основан на нахождении линейной функции от порядковых статистик (упорядоченных элементов выборки), которая была бы несмещенной оценкой искомого параметра. Применение связано с необходимостью использования специальных видов распределений, что вызывает определенные неудобства и затрудняет автоматизацию расчетов.