Статистическая проверка гипотез

Статистическая проверка гипотез, система приёмов в математической статистике, предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе. Процедуры С. п. г. позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т₀, такое, что если гипотеза верна, то вероятность неравенства T >T₀ равна a, где a — заранее заданный значимости уровень. Если в конкретном случае обнаружится, что Т > T₀, то гипотеза отвергается, тогда как появление значения Т £ T₀ не противоречит гипотезе. Пусть, например, требуется проверить гипотезу о том, что независимые результаты наблюдений x₁,..., x_n подчиняются нормальному распределению со средним значением а = a₀ и известной дисперсией s². При этом предположении среднее арифметическое результатов наблюдений распределено нормально со средним а = a₀ и дисперсией s²/n, а величина распределена нормально с параметрами (0, 1). Полагая можно найти связь между T₀ и a по таблицам нормального распределения. Например, при гипотезе а = a₀ событие Т > 1, 96 имеет вероятность а = 0,05. Правило, рекомендующее считать, что гипотеза а = a₀ неверна, если Т > 1,96, будет приводить к ложному отбрасыванию этой гипотезы в среднем в 5 случаях из 100, в которых она верна. Если же Т £ 1,96, то это ещё не означает, что гипотеза подтверждается, т.к. указанное неравенство с большой вероятностью может выполняться при а, близких к a₀. Следовательно, при использовании предложенного критерия можно лишь утверждать, что результаты наблюдений не противоречат гипотезе а = a₀. При выборе статистики Т всегда явно или неявно учитывают гипотезы, конкурирующие с гипотезой а = a₀. Например, если заранее известно, что а ³ a₀, т. е. отклонение гипотезы а = a₀ влечёт принятие гипотезы а > a₀, то вместо Т следует взять . Если дисперсия s² неизвестна, то вместо данного критерия для проверки гипотезы а = a₀ можно воспользоваться т. н. критерием Стьюдента, основанным на статистике которая включает несмещенную оценку дисперсии

и подчинена Стьюдента распределению с n — 1 степенями свободы (подобную задачу см. в ст. Математическая статистика, табл. 1a). Такого рода критерии называются критериями согласия и используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях (см. Непараметрические методы). При решении вопроса о принятии или отклонении какой-либо гипотезы H₀ с помощью любого критерия, основанного на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка «первого рода» совершается тогда, когда отвергается верная гипотеза H₀. Ошибка «второго рода» совершается в том случае, когда гипотеза H₀ принимается, а на самом деле верна не она, а какая-либо альтернативная гипотеза Н. Естественно требовать, чтобы критерий для проверки данной гипотезы приводил возможно реже к ошибочным решениям. Обычная процедура построения наилучшего критерия для простой гипотезы заключается в выборе среди всех критериев с заданным уровнем значимости и (вероятность ошибки первого рода) такого, который приводил бы к наименьшей вероятности ошибки второго рода (или, что то же самое, к наибольшей вероятности отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая до единицы вероятность ошибки второго рода) называется мощностью критерия. В случае, когда альтернативная гипотеза Н простая, наилучшим будет критерий, который имеет наибольшую мощность среди всех других критериев с заданным уровнем значимости а (наиболее мощный критерий). Если альтернативная гипотеза Н сложная, например зависит от параметра, то мощность критерия будет функцией, определенной на классе простых альтернатив, составляющих Н, т. е. будет функцией параметра. Критерий, имеющий наибольшую мощность при каждой альтернативной гипотезе из класса Н, называется равномерно наиболее мощным, однако следует отметить, что такой критерий существует лишь в немногих специальных ситуациях. В задаче проверки гипотезы о среднем значении нормальной совокупности а = а₀ против альтернативной гипотезы а > a₀ равномерно наиболее мощный критерий существует, тогда как при проверке той же гипотезы против альтернативы а ¹ a₀ его нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев в тех или иных специальных классах (Инвариантных, несмещенных критериев и т.п.).

Теория С. п. г. позволяет с единой точки зрения трактовать выдвигаемые практикой различные задачи математической статистики (оценка различия между средними значениями, проверка гипотезы постоянства дисперсии, проверка гипотезы независимости, проверка гипотез о распределениях и т.п. Идеи последовательного анализа, примененные к С. п. г., указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательно проводимых наблюдений (в этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента) (см. также Статистические решения).

Лит.: Kpamep Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Леман Э., Проверка статистических гипотез, пер. с англ., М., 1964.

Л. В. Прохоров.

Оглавление