Поиск по сайту:

Как выполнить тест Брауна – Форсайта на Python


Тест Брауна-Форсайта – это статистический тест, используемый для определения равенства дисперсий двух или более групп. В то время как тест Левена использует абсолютные отклонения от среднего значения, тест Брауна-Форсайта использует отклонения от медианы.

Нулевая гипотеза, используемая в тесте, выглядит следующим образом:

H0: Дисперсия групп (популяций) равна

Альтернативная гипотеза состоит в том, что дисперсии не равны —

H1: Дисперсия групп (популяций) не равна

Для проведения теста мы вычисляем медиану каждой группы и абсолютные отклонения от медианы. Затем мы рассчитываем F-статистику на основе дисперсий этих отклонений. Предположим, что рассчитанная F-статистика больше критического значения из таблицы F-распределения. В этом случае мы отвергаем нулевую гипотезу и приходим к выводу, что дисперсии групп не равны.

В Python библиотека scipy и statsmodels предоставляет метод для выполнения теста Брауна-Форсайта.

Важно отметить, что критерий Брауна-Форсайта чувствителен к выбросам, но более устойчив к отклонениям от нормальности, чем критерий Левена. Обычно рекомендуется использовать тест Брауна-Форсайта, если данные не соответствуют норме.

Браун — тест Форсайта на Python

Синтаксис

levene(sample1, sample2, …sampleN, center=’median’, proportiontocut=0.05)

Параметры

  • sample1, sample2,…sampleN — выборочные данные, которые могут иметь разную длину. Чтобы быть принятыми, образцы должны иметь только один размер.

  • Центр — какую функцию данных использовать для теста. «Медиана» — значение по умолчанию.

  • Proportiontocut – когда центр «обрезан», указывается количество точек данных, которые нужно удалить с каждого конца.

Объяснение

В функции levene() пользователи должны передавать одномерные выборочные данные различной длины вместе с центром параметра в качестве «Медианы». Затем эта функция возвращает статистику и значение p_value предоставленных выборок.

Алгоритм

  • Импортируйте функцию levene из scipy.

  • Создайте образцы данных, для которых вы хотите выполнить тест Брауна-Форсайта.

  • Передайте образцы данных в функцию levene для выполнения теста.

  • Получите статистику и p_value взамен функции.

Вы можете использовать статистику. Метод Левена из библиотеки scipy для выполнения теста Брауна-Форсайта.

from scipy.stats import levene

group1 = [1, 2, 3, 4, 5]
group2 = [2, 3, 4, 5, 6]
group3 = [3, 4, 5, 6, 7]

statistic, pvalue = levene(group1, group2, group3)
print("statistic: ", statistic)
print("p-value: ", pvalue)

Выход

statistic:  0.0
p-value:  1.0

Здесь, как вы можете видеть, значение p равно 1, что больше 0,05. Это означает, что мы можем принять нулевую гипотезу. Следовательно, дисперсии обеих групп одинаковы. Таким образом, альтернативная гипотеза отвергается.

Наряду с решением вопроса Брауна-Форсайта мы также можем прояснить одну путаницу, с которой обычно сталкиваются инженеры по машинному обучению. Именно так связаны друг с другом тесты Брауна-Форсайта и ANOVA.

Как связаны тест Брауна-Форсайта и тест ANOVA?

Тесты Брауна-Форсайта и ANOVA (дисперсионный анализ) связаны между собой, поскольку они проверяют различия в групповых средних значениях. Однако они проверяют разные предположения и имеют разные приложения.

ANOVA — это статистический метод, используемый для проверки наличия существенных различий между средними значениями двух или более групп. Предполагается, что дисперсии групп равны и данные нормально распределены. ANOVA используется для определения того, равны ли средние значения двух или более групп, и сравнивает дисперсии групп.

Тест Брауна-Форсайта представляет собой разновидность теста Левена, который использует абсолютные отклонения от среднего значения, а тест Брауна-Форсайта использует отклонения от медианы. С другой стороны, тест Брауна-Форсайта представляет собой тест на однородность дисперсий, что является необходимым допущением для ANOVA. Он используется для определения того, равны ли дисперсии двух или более групп.

На практике перед дисперсионным анализом обычно выполняют тест Брауна-Форсайта, чтобы проверить, выполняется ли предположение о равных дисперсиях. Если дисперсии не равны, может оказаться целесообразным использовать непараметрический тест, такой как тест Крускала-Уоллиса или тест ANOVA Уэлча, вместо обычного.

Варианты использования Брауна – тест Форсайта

Тест Брауна-Форсайта используется в различных областях, таких как биология, медицина, психология, социальные науки и инженерия, для проверки равных отклонений в разных группах. Некоторые распространенные случаи использования включают в себя —

  • Сравнение дисперсий двух или более выборок. Критерий Брауна-Форсайта позволяет определить, равны ли дисперсии двух или более выборок. Например, в медицинском исследовании тест можно использовать для сравнения отклонений показателей артериального давления у разных групп пациентов.

  • Проверка однородности дисперсий перед выполнением ANOVA. Поскольку тест Брауна-Форсайта является проверкой однородности дисперсий, его можно использовать для проверки того, выполняется ли предположение о равных дисперсиях перед выполнением ANOVA. Это гарантирует, что результаты ANOVA действительны.

  • Тестирование равных дисперсий в данных с ненормально распределенным распределением. Критерий Брауна-Форсайта более устойчив к ненормальности, чем критерий Левена. Его можно использовать для проверки равенства дисперсий в данных с ненормально распределенным распределением.

  • Сравнение дисперсий в планах с повторными измерениями. При проведении экспериментов с планами с повторными измерениями может быть полезно использовать тест Брауна-Форсайта для проверки однородности дисперсий между группами.

  • Контроль качества в производстве. Тест Брауна-Форсайта можно использовать для проверки одинаковых отклонений в различных производственных партиях и обеспечения постоянного качества продукта.

Заключение

В заключение отметим, что тест Брауна-Форсайта — полезный статистический метод обнаружения присутствия гетероскедастичности в наборе данных. Его можно легко реализовать на Python с помощью библиотеки scipy. Результаты испытаний могут служить основой для принятия решений о соответствующем статистическом анализе данных. Понимая предположения теста и интерпретируя результаты, исследователи могут лучше понять распределение своих данных и принять обоснованные решения относительно их анализа.

Статьи по данной тематике: