это быстро и бесплатно
Оформите заказ сейчас и получите скидку 100 руб.!
ID (номер) заказа
1443073
Ознакомительный фрагмент работы:
Содержание
Введение
1. Суть определения критерия Краскела — Уоллиса
2. Пример использования критерия Краскела — Уоллиса
Заключение
Список использованной литературы
Введение
Критерий Краскела — Уоллиса определен для проверки равенства медиан нескольких выборок. Этот критерий выступает многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса выступает ранговым, потому он инвариантен по взаимоотношению к каждому монотонному преобразованию шкалы измерения.
Данный критерий также знаком также под наименованиями: H-критерий Краскела — Уоллиса, тест Крускала — Уоллиса (англ. Kruskal — Wallis test), односторонний дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance).
Целью данной работы является определение сути применения критерия Краскела-Уоллиса. В связи с тем в работе выделены следующие основные задачи:
- охарактеризовать суть определения критерия Краскела — Уоллиса;
- показать пример использования критерия Краскела — Уоллиса.
1. Суть определения критерия Краскела — Уоллиса
Критерий Краскела-Уоллиса представляет собой непараметрическую альтернативу одномерному (межгрупповому) дисперсионному анализу. [4] Данный критерий применяется для сопоставления трех или более выборок, и обследует нулевые гипотезы, по которым всевозможные выборки были отобраны из одного и того же распределения, или из распределений с одними и теми же медианами.
Критерий Краскела – Уоллиса (Kruskal-Wallis H-test) выступает непараметрическим аналогом однофакторного дисперсионного анализа для сопоставления трех и более независимых групп. [1] Этот критерий применяется, когда распределение в группах не подвластна закону нормального распределения, что очень часто встречается в медицинских изучениях, особенно в выборках малого объема. В подобных обстановках надо или трансформировать имеющиеся сведения при помощи всевозможных арифметических преобразований до достижения нормальности распределения, после чего используется дисперсионный анализ, или использовать критерий Краскела – Уоллиса, иногда еще именуемый непараметрическим дисперсионным анализом. Критерий Краскела – Уоллиса рассчитывается с употреблением не фактических показателей значений переменных, а их рангов, потому выступает методом выбора при сильно скошенных распределениях. При помощи него обследуют нулевую гипотезу о том, что медианные значения знака в популяциях, из которых были вынуты изучаемые выборки, не отличаются.
Следовательно, интерпретация критерия Краскела-Уоллиса в основном похожа с параметрическим одномерным дисперсионным анализом, за исключением того, что данный критерий сформирован скорее на рангах, чем на средних. [1]
Расчет критерия Краскела – Уоллиса состоит в том, что вначале все значения, независимо от того, какой выборке они относятся, упорядочат по возрастанию, как если бы это представляла одну объединенную выборку. Любому значению присваивают ранг от наименьшего к наибольшему – номер его места в упорядоченном ряду. Совмещающимся значениям присвоят одинаковый ранг, равный среднему тех мест, которые данные величины распределяют между собой в общем упорядоченном ряду. Следом за ранжированием надо проверить, чтобы общее число рангов было равно числу наблюдений в объединенной выборке. После находят суммы рангов, касающихся к каждой группе (Ri). Дальше высчитывают тестовую статистику критерия Краскела – Уоллиса (Н) по следующей формуле [2]:
где Ri – сумма рангов для каждой группы; ni – число наблюдений в каждой группе; N – общее число наблюдений в объединенной выборке.
Если число сопоставляемых групп 3, а число наблюдений в каждой группе не меньше 5 (для четырех групп – общее количество наблюдений не меньше 10), то расчетное значение тестовой статистики Н сопоставляют с критическим значением хи-квадрат Пирсона (χ2), поскольку распределение Н близко распределению χ2 с числом степеней свободы df = k – 1, где k – количество групп. Если расчетное значение Н равно или больше критического значения χ2, то H0 отвергается.
Когда количество наблюдений в группах меньше 5, то в качестве критического значения употребляют табличные значения распределения Краскела –Уоллиса. В данном случае, если расчетное значение Н равно или больше критического значения H0,05, H0 отвергается. При употреблении таблицы критических значений критерий Краскела – Уоллиса определить различия между тремя группами вероятно, если минимальное количество наблюдений в одной группе равно трем, а в двух других группах – по двум наблюдения. При сравнении четырех или пяти групп наименьшее количество наблюдений в каждой группе должно равняться двум.
2. Пример критерия Краскела — УоллисаТак, к примеру, в ходе исследований изучали воздействие препарата X на пациентов, распределенных по какому-то признаку Y на 3 группы одинакового объема (A, B, C). [3] Итоги подобного выдуманного изучения приведены на рисунке 1:
Рисунок 1. Исходные данные
Находим команду Непараметрическая статистика из меню Анализ для отражения стартовой панели модуля Непараметрическая статистика. Затем находим Сравнение нескольких независимых групп и нажимаем кнопку OK для отражения диалогового окна ДА Краскела-Уоллиса. Нажимаем кнопку Переменные для отражения диалогового окна Выбор переменных. Находим переменную Влияние как зависимую и переменную Группа как группирующую. Нажимаем кнопку Коды, отразится диалоговое окно Выбираем коды для группирующей переменной; в данном диалоге нужно выбрать все коды (нажимая кнопку Все и после кнопку OK). Диалоговое окно ДА Краскела-Уоллиса покажется на экране (рисунок 2).
Рисунок 2. Диалоговое окно
В диалоговом окне нужно нажать ОК и начнется анализ (рисунок 3).
Рисунок 3. Анализ
Видно, что критерий Краскела-Уоллиса высоко значим (p = ,001). Следовательно, характеристики разнообразных экспериментальных групп значимо различаются между собой. Напомним, что процедура Краскела-Уоллиса, по сути, выступает дисперсионным анализом, сформированным на рангах. Суммы рангов (для любой группы) представлены в правом столбце таблицы итогов. Максимальная ранговая сумма (самое эффективное воздействие препарата) причисляется к группе C. Минимальная ранговая сумма (самое худшее воздействие препарата) относится к группе A.
Рассмотрим пример дисперсионного анализа Краскела-Уоллиса и медианного теста.
Данные тесты - альтернативны однофакторной межгрупповой ANOVA. Пример базирован на (искусственных) сведениях. [3]
Рисунок 4. Исходные данные.
Данные сведения приобретены в исследовании маленьких детей, которые случайным образом приписывались к одной из трех экспериментальных групп. Любому ребенку предлагалась серия парных тестов. Задача ребенка заключалось в том, чтобы произвести правильный выбор и заработать вознаграждение. В первой группе тестом была форма (группа 1 - Форма - 1 - Form), во второй - цвет (группа 2 - Цвет - 2 Color), в третьей - размер 3 - Размер - 3 - Size) предмета. Зависимая переменная - количество испытаний, которые требовались любому ребенку, чтобы приобрести вознаграждение.
Итоги ранговой ДА Краскела-Уоллиса изображены в первой таблице результатов (рисунок 5), результаты медианного теста - во второй (рисунок 6).
Рисунок 5. Итоги критерия Краскела-Уоллиса.
Можно увидеть, что критерий Краскела-Уоллиса высоко значим. Следовательно, характеристики разнообразных экспериментальных групп существенно различаются друг от друга. Процедура Краскела-Уоллиса, по сути, выступает дисперсионным анализом, основанным на рангах. Суммы рангов (для любой группы) изображены в правом столбце таблицы итогов. Максимальная ранговая сумма (самое худшее выполнение теста) относится к Размеру - Size (это тот параметр, который надо отличить, чтобы приобрести вознаграждение). Минимальная ранговая сумма (лучшее выполнение) касается к Форме - Form.
Медианный критерий также значим, но, в меньшей мере.
Рисунок 6. Итоги медианного теста.
Надо отметить, что медианный критерий более "жесткий" и меньше чувствительный, чем критерий Краскела-Уоллиса. В таблице итогов показано количество наблюдений (детей) в каждой экспериментальной группе, которые расположены ниже (или равны) общей медианы и количество наблюдений, расположенных выше общей медианы. И также, максимальное количество испытуемых с числом попыток (до приобретения вознаграждения) выше общей медианы причисляется к группе Размер - Size. Больше всего испытуемых с количеством попыток ниже медианы причисляется к группе Форма - Form. Следовательно, медианный тест доказывает, что форма предмета наиболее легко различается детьми, тогда как размер различается хуже всего.
Графическое представление результатов показано на рисунке 7.
Рисунок 7. График результатов медианного теста в виде диаграммы.
Снова четко видно, выполнение теста Форма - Form было выше любого другого; медиана числа испытаний при этом условии меньше, чем при любом другом.
Рисунок 8. Категоризованная гистограмма.
Данный график снова доказывает, что в группе Форма - Form выполнение "лучше" (распределение немного скошено влево), чем при иных условиях. Самое худшее осуществление, как отчетливо видно из графиков, для группы Размер - Size. Таким образом, также можно заключить, что наиболее легко дети различают Форму - Form.
Заключение
Таким образом, критерий Краскела-Уоллиса представляет собой непараметрическую альтернативу одномерному (межгрупповому) дисперсионному анализу. Данный критерий применяется для сопоставления трех или более выборок, и обследует нулевые гипотезы, по которым всевозможные выборки были отобраны из одного и того же распределения, или из распределений с одними и теми же медианами.
Расчет критерия Краскела – Уоллиса состоит в том, что вначале все значения, независимо от того, какой выборке они относятся, упорядочат по возрастанию, как если бы это представляла одну объединенную выборку. Любому значению присваивают ранг от наименьшего к наибольшему – номер его места в упорядоченном ряду. Совмещающимся значениям присвоят одинаковый ранг, равный среднему тех мест, которые данные величины распределяют между собой в общем упорядоченном ряду. Следом за ранжированием надо проверить, чтобы общее число рангов было равно числу наблюдений в объединенной выборке. После находят суммы рангов, касающихся к каждой группе (Ri). Дальше высчитывают тестовую статистику критерия Краскела – Уоллиса (Н).
Когда количество наблюдений в группах меньше 5, то в качестве критического значения употребляют табличные значения распределения Краскела –Уоллиса. В данном случае, если расчетное значение Н равно или больше критического значения H0,05, H0 отвергается. При употреблении таблицы критических значений критерий Краскела – Уоллиса определить различия между тремя группами вероятно, если минимальное количество наблюдений в одной группе равно трем, а в двух других группах – по двум наблюдения. При сравнении четырех или пяти групп наименьшее количество наблюдений в каждой группе должно равняться двум.
Список использованной литературы
Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.
Унгуряну Т.Н. Сраввнение трех и более независмых групп с использованием непараметрического критерия Краскела - Уоллиса в программе Stata// Экология человека. 2014. № 2. С. 54–61.
Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — Pp. 583—621.
Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников
Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.
Цены ниже, чем в агентствах и у конкурентов
Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит
Бесплатные доработки и консультации
Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки
Гарантируем возврат
Если работа вас не устроит – мы вернем 100% суммы заказа
Техподдержка 7 дней в неделю
Наши менеджеры всегда на связи и оперативно решат любую проблему
Строгий отбор экспертов
К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»
Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован
Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн
Выполнить 2 контрольные работы по Информационные технологии и сети в нефтегазовой отрасли. М-07765
Контрольная, Информационные технологии
Срок сдачи к 12 дек.
Архитектура и организация конфигурации памяти вычислительной системы
Лабораторная, Архитектура средств вычислительной техники
Срок сдачи к 12 дек.
Организации профилактики травматизма в спортивных секциях в общеобразовательной школе
Курсовая, профилактики травматизма, медицина
Срок сдачи к 5 дек.
краткая характеристика сбербанка анализ тарифов РКО
Отчет по практике, дистанционное банковское обслуживание
Срок сдачи к 5 дек.
Исследование методов получения случайных чисел с заданным законом распределения
Лабораторная, Моделирование, математика
Срок сдачи к 10 дек.
Проектирование заготовок, получаемых литьем в песчано-глинистые формы
Лабораторная, основы технологии машиностроения
Срок сдачи к 14 дек.
Вам необходимо выбрать модель медиастратегии
Другое, Медиапланирование, реклама, маркетинг
Срок сдачи к 7 дек.
Ответить на задания
Решение задач, Цифровизация процессов управления, информатика, программирование
Срок сдачи к 20 дек.
Написать реферат по Информационные технологии и сети в нефтегазовой отрасли. М-07764
Реферат, Информационные технологии
Срок сдачи к 11 дек.
Написать реферат по Информационные технологии и сети в нефтегазовой отрасли. М-07764
Реферат, Геология
Срок сдачи к 11 дек.
Разработка веб-информационной системы для автоматизации складских операций компании Hoff
Диплом, Логистические системы, логистика, информатика, программирование, теория автоматического управления
Срок сдачи к 1 мар.
Нужно решить задание по информатике и математическому анализу (скрин...
Решение задач, Информатика
Срок сдачи к 5 дек.
Заполните форму и узнайте цену на индивидуальную работу!