Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Корреляционный анализ

Тип Реферат
Предмет Математика
Просмотров
2574
Размер файла
239 б
Поделиться

Ознакомительный фрагмент работы:

Корреляционный анализ

Корреляционный анализ

Корреляционный анализ - математико-статистический метод выявления взаимозависимости компонент многомерной случайной величины и оценки тесноты их связи.

Предпосылки корреляционного анализа

При построении корреляционных моделей исходят из выполнения условий случайности результатов наблюдений и нормальности закона распределения анализируемой h-мерной генеральной совокупности, что обеспечивает линейный характер изучаемой зависимости между наблюдаемыми признаками и позволяет использовать в качестве показателей силы стохастической (вероятностной) связи парные, частные и множественные коэффициенты корреляции и детерминации.

Понятие "корреляционная зависимость"

В статистических исследованиях выделяют два вида связи между случайными величинами: функциональную и стохастическую.

Зависимость признаков называется функциональной, если каждое наблюдаемое значение зависимой переменной однозначно определяется по полученным в том же самом наблюдении значениям остальных переменных согласно некоторому правилу: , единому для всех наблюдений.

Стохастической зависимостью переменной от переменных называется такое отношение между случайными величинами , при котором каждой реализации случайного вектора однозначно соответствует некоторое условное распределение вероятностей случайной величины , при этом, по крайней мере, двум возможным различным реализациям отвечают неодинаковые распределения.

В отличие от функциональной зависимости, когда каждому набору значений объясняющих переменных соответствует только одно значение объясняемой переменной , при стохастической зависимости любой допустимой совокупности значений отвечает множество возможных значений зависимой переменной .

Корреляционной зависимостью переменной от переменных называется функциональная зависимость условного математическим ожидания случайной величины от реализации случайного вектора .

Корреляционная зависимость является лишь одной из частных форм стохастической связи между случайными величинами и не исчерпывает в общем случае весь объем понятия "стохастическая зависимость".

Функция , устанавливающая зависимость условного математического ожидания от возможных значений случайных величин , называется функцией регрессии случайной величины на случайный вектор .

Если функция регрессии представима как линейная комбинации своих аргументов:

,

где - некоторые константы, то соответствующая корреляционная зависимость называется линейной.

Аналитическое задание корреляционной зависимости в виде

называется уравнением регрессии случайной величины на случайный вектор .

Двумерная корреляционная модель

Анализируется корреляционная зависимость между двумя признаками , .

Предполагается, что распределение вероятностей двумерной случайной величины подчинено закону Гаусса, т.е. плотность совместного распределения , определяется формулой:


содержащей пять параметров:

- математическое ожидание ;

- математическое ожидание ;

- дисперсия ;

- дисперсия ;

- коэффициент корреляции между , .


Коэффициент корреляции как мера тесноты стохастической связи между двумя случайными величинами

Из условия нормальности совместного распределения признаков , непосредственно вытекает, что распределение каждого их них также подчинено закону Гаусса с соответствующими параметрами:

;

.

Если , то из выражений, задающих двумерную и одномерные плотности распределения вероятностей , , следует, что , т.е. , есть независимые между собой случайные величины.

Для случайных величин , , совместное распределение которых является нормальным, понятия "некоррелированность" и "стохастическая независимость" эквивалентны.

Таким образом, для решаемой задачи коэффициент корреляции может служить мерой силы стохастической взаимосвязи рассматриваемых случайных величин.

Вне рамок корреляционной модели равенство нулю коэффициента корреляции указывает лишь на некоррелированность исходных переменных, но не подтверждает отсутствие иной формы стохастической зависимости.

Коэффициент корреляции не имеет размерности и, следовательно, его можно использовать при анализе зависимости признаков, различающихся по мерным шкалам.

Значение по абсолютной величине не превосходит единицы.

Если , линейная связь между переменными и отсутствует.

Значение указывает на наличие функциональной линейной зависимости между ними.

По мере приближения к единице условные дисперсии стремятся к нулю, что свидетельствует о меньшем рассеянии значений переменных , относительно соответствующих линий регрессии и о более тесной связи между данными переменными.

Положительный знак коэффициента корреляции означает, что прямые регрессии имеют в координатной плоскости положительный тангенс угла наклона, с увеличением (или уменьшением) значения любой из переменных , пропорционально в среднем возрастает (соответственно убывает) значение другой переменной.

Отрицательный знак коэффициента корреляции указывает на обратную тенденцию.

Уравнения линейной парной регрессии

Функции регрессии на и на находятся с помощью формул, определяющих условные математические ожидания:

,


При этом условные плотности распределения вероятностей случайных величин , представляются в виде отношений известных безусловных плотностей распределения:

Дальнейшее интегрирование функций , по x, соответственно по y, непосредственно дает уравнение регрессии на , а также уравнение регрессии на :

;

,

; ,

где

- коэффициент регрессии на ;

- коэффициент регрессии на .

Линейный характер корреляционной зависимости между совместно нормально распределенными случайными величинами проявляется в том, что с изменением одной величины пропорционально изменяется условное математическое ожидание другой величины. Графики функций регрессии (именуемые линиями регрессии) представляют собой прямые.

В случае некоррелированности , , т.е. при , прямые регрессии на и на параллельны соответственно координатным осям и .

Парный коэффициент детерминации

Степень рассеяния значений (или ) относительно линии регрессии на (или на ) характеризуют (в среднем) условные дисперсии:

Расчетные формулы для и находятся подобно тому, как определялись функции регрессии на и на .

В итоге,

.

Квадрат коэффициента корреляции называется парным коэффициентом детерминации.

Из приведенных выражений для условных дисперсий следует, что величина указывает долю дисперсии одной случайной величины, обусловленную вариацией другой случайной величины.


Эмпирические характеристики корреляционной зависимости

В практике статистических исследований параметры совместного распределения вероятностей случайных величин, включенных в анализ, как правило, неизвестны, и тесноту связи между переменными оценивают по статистическим данным и выборочным аналогам корреляционных характеристик.

С этой целью в двумерном корреляционном анализе используют "поле корреляции", строят корреляционную таблицу, рассчитывают точечные оценки параметров корреляционной модели, проверяют значимость параметров связи и находят интервальные оценки для значимых параметров, оценивают уравнения регрессии.

Корреляционное поле

Корреляционным полем называется совокупность нанесенных на координатную плоскость реализаций случайного вектора , т.е. выборочных точек .

По расположению точек корреляционного поля можно составить предварительное мнение о характерных особенностях зависимости случайных величин (например, о том, что значение какой-либо из этих величин в среднем возрастает или убывает при возрастании значения другой величины).

Наиболее точную информацию о направлении и силе связи между величинами , дают коэффициент корреляции и уравнения регрессии.

Корреляционная таблица

В понятийном смысле - представляет собой обобщение понятия «вариационный ряд», с прикладной точки зрения - является формой компактной записи выборочных данных двумерной случайной величины :

n

где

;

- упорядоченные по возрастанию последовательности всех различных значений , соответственно , имеющихся в выборке .

- количество пар .

- сумма элементов -го столбца, соответственно - -ой строки корреляционной таблицы. При этом

.

Точечные оценки параметров двумерного распределения

Для получения приближенных значений параметров корреляционной модели используют, как правило, метод моментов, расчеты производят согласно следующим формулам.

Характеристики распределения случайного вектора

теоретические

оценки по выборочным данным

сгруппированным

не сгруппированным

Приведенные эмпирические характеристики двумерного нормального закона распределения случайного вектора обладают свойством состоятельности, , являются, кроме того, несмещенными и эффективными оценками.

Аппроксимация уравнений регрессии

; .

Проверка гипотезы об отсутствии корреляционной зависимости между случайными величинами

Выборочный парный коэффициент корреляции r, найденный по конечному числу статистических данных, практически всегда отличен от нуля, однако, отсюда не всегда следует, что неизвестный генеральный парный коэффициент корреляции ρ также не равен нулю, т.е. что корреляционная зависимость действительно имеет место. Требуется дополнительно осуществить проверку предположения о значимости коэффициента корреляции.

При справедливости основной гипотезы ("корреляционная зависимость между , отсутствует") статистика применяемого критерия

имеет распределение Стьюдента с числом степеней свободы, равным .

При уровне значимости гипотеза отвергается, если выполняется неравенство , в котором под символом понимается критическое значение, удовлетворяющее уравнению

.

При отвержении основной гипотезы заключают, что признаки , связаны линейным корреляционным соотношением, в ином случае делают вывод, что на основе имеющейся выборки корреляционная зависимость между ними не установлена.

Если в результате проверки гипотеза будет отвергнута, то полагают, что коэффициент корреляции значимо (существенно) отличается от нуля, а рассчитанное по статистическим данным значение r может быть использовано в качестве его точечной оценки.

Интервальная оценка коэффициента корреляции

корреляционная регрессия уравнение математический

При построении доверительного интервала для неизвестного коэффициента корреляции используется специальная функция - -преобразование Фишера (гиперболический арктангенс) выборочного коэффициента корреляции r:

.

- возрастающая нечетная функция: z(-r) = -z(r).

Распределение вероятностей значений приближается (тем более точно, чем больше объем выборки n) нормальным распределением вероятностей с параметрами:

и .

Статистика имеет асимптотическое стандартное нормальное распределение .

Асимптотически точный доверительный интервал надежности для нормированного отклонения z:

,

где - квантиль уровня распределения , т.е. корень уравнения .

Доверительный интервал для математического ожидания :

.

Величиной в выражении можно пренебречь, принимая во внимание, что она при есть бесконечно малая более высокого порядка в сравнении с .

Доверительный интервал для гиперболического арктангенса коэффициента корреляции :

.

Решение относительно данного двойного неравенства приводит к искомому доверительному интервалу для коэффициента корреляции:

,

с границами, определяемыми как значения гиперболического тангенса для значений , равных соответственно и .

Функция задает преобразование, обратное -преобразованию Фишера. Следовательно, .

Этапы определения ДИ для коэффициента корреляции

- находится выборочный коэффициент корреляции r;

- выполняется прямое преобразование Фишера значения r: ;

- выбирается квантиль , исходя из условия ;

- вычисляются значения и ;

- с помощью обратного преобразования Фишера находятся границы ДИ:

и .

Доверительные интервалы для коэффициентов регрессии

Их построение осуществляется в соответствии с общей схемой. При этом используются статистики:

; ,

имеющие распределение Стьюдента с числом степеней свободы, равном .

;

,

где - корень уравнения .

Многомерная корреляционная модель

Предполагается, что совместное распределение анализируемых случайных переменных (признаков) подчинено h-мерному нормальному закону.

Типовые задачи

¨ определение тесноты связи между некоторыми переменными при фиксировании или исключении влияния остальных переменных;

¨ определение тесноты связи одной из рассматриваемых переменных с совокупностью всех остальных переменных, включенных в анализ.

Корреляционная матрица

Начальный этап многомерного корреляционного анализа количественных признаков состоит в оценке (приближении) на основе выборочных данных матрицы

,

элементы которой - парные коэффициенты корреляции переменных .

Выборочная корреляционная матрица

В качестве статистического аналога корреляционной матрицы принимается матрица

,


здесь - выборочные парные коэффициенты корреляции переменных .

Свойство корреляционных матриц

Матрицы , qh симметричны относительно главной диагонали.

Вся имеющаяся для анализа статистическая информация о зависимостях между случайными величинами содержится в выборочной корреляционной матрице .

Однако раскрытие многообразия взаимосвязей данных переменных непосредственно по их парным коэффициентам корреляции невозможно. Для проведения исследования при решении указанных типовых задач необходимо вычислять также частные и множественные коэффициенты корреляции, представляющие собой определенные действительные функции матрицы .

Частный коэффициент корреляции

,

где - минор элемента матрицы , т.е. определитель матрицы, получающейся из корреляционной матрицы удалением -ой строки и -го столбца.


Свойства частного коэффициента корреляции

обладает всеми свойствами парного коэффициента корреляции , т.к. является коэффициентом корреляции для их условного двумерного распределения. В отличие от парного коэффициента корреляции , на величине которого сказывается не только влияние переменных друг на друга, но и воздействие остальных переменных, частный коэффициент корреляции позволяет характеризовать тесноту связи между признаками в «чистом» виде, исключая при анализе зависимости влияние других переменных. Если парный коэффициент корреляции больше соответствующего частного коэффициента , то можно заключить, что остальные рассматриваемые переменные усиливают взаимосвязь между изучаемыми величинами . Уменьшение значения парного коэффициента корреляции, в сравнении с отвечающим ему частным коэффициентом корреляции, свидетельствует об ослаблении связи между исследуемыми величинами в результате воздействия других переменных.

Выборочный частный коэффициент корреляции

Точечная оценка определяется по формуле:

,


здесь - минор элемента выборочной корреляционной матрицы .

В случае трехмерной корреляционной модели для переменных находятся три частных коэффициента корреляции:

;

;

.

называется частным коэффициентом детерминации.

Величина есть доля дисперсии переменной , обусловленная вариацией при фиксированных остальных рассматриваемых переменных.

Множественный коэффициент корреляции

Мерой тесноты линейной взаимосвязи между переменной и совокупностью остальных переменных служит множественный коэффициент корреляции:

,


Где - определитель матрицы ;

- минор -го элемента главной диагонали матрицы .

Если , то множественный коэффициент корреляции совпадает с абсолютным значением парного коэффициента корреляции , т.е. есть обобщение .

По величине множественного коэффициента корреляции делается вывод о тесноте, но не о направлении взаимосвязи.

Свойства множественного коэффициента корреляции

- Численное значение множественного коэффициента корреляции заключено между нулем и единицей:

.

- Если , то переменная связана с остальными рассматриваемыми случайными величинами линейной функциональной зависимостью.

Например, для трехмерной корреляционной модели, если , то точки расположены в плоскости регрессии на .

- Если , то случайная величина стохастически независима от других переменных, входящих в анализ.

В частности, если , то одномерная случайная величина и двумерная случайная величина являются независимыми (в силу нормальности их совместного распределения).

- Множественный коэффициент корреляции не уменьшается при введении в модель дополнительных признаков и не увеличивается при исключении отдельных признаков из модели.

- По величине множественный коэффициент корреляции переменной не меньше абсолютной величины частного коэффициента корреляции данной и любой другой переменной :

.

Выборочный множественный коэффициент корреляции

В качестве точечной оценки принимается

.

где - минор -го элемента главной диагонали выборочной корреляционной матрицы .

В случае трехмерной корреляционной модели для переменных вычисляются три множественных коэффициента корреляции:

;

;

.


называется множественным коэффициентом детерминации.

Множественный коэффициент детерминации показывает долю дисперсии исследуемой случайной величины , обусловленную изменением остальных переменных .

Уравнения регрессии для трехмерной корреляционной модели

I. При фиксировании значения одной случайной величины в системе случайных величин трехмерное нормальное распределение данных величин становится условным двумерным нормальным распределением, определяемым пятью параметрами.

Если фиксировано, например, значение случайной величины , то условное двумерное нормальное распределение характеризуется следующими параметрами:

; ;

; ;

.

Линейная корреляционная зависимость между величинами при фиксированном значении случайной величины графически выражается прямыми регрессии в плоскости :


;

.

II. При фиксированных значениях двух переменных в системе случайных величин трехмерное нормальное распределение есть определяемое двумя параметрами условное одномерное нормальное распределение соответствующей переменной.

В частности, при фиксированных значениях компонент двумерного случайного вектора совместное распределение переменных становится условным одномерным нормальным распределением случайной величины , параметрами которого являются условное математическое ожидание

и условная дисперсия , совпадающая с - остаточной дисперсией относительно плоскости регрессии на :

.

Уравнение регрессии на может быть представлено в виде:

,


где ; - частные коэффициенты регрессии.

Для расчета условных средних квадратических отклонений используются формулы:

; ;

; .

Функция регрессии линейно зависит от двух переменных . Соответствующая ей поверхность представляет собой плоскость.

Для рассматриваемой модели имеют место три уравнения регрессии и три отвечающие им плоскости регрессии.

Необходимые для расчетов коэффициентов уравнений регрессии оценки девяти определяющих совместное распределение параметров трехмерной корреляционной модели по выборочным данным осуществляются по формулам:

; ; ;

; ; ;

; ; .

Проверка значимости коэффициентов связи

а) для частного коэффициента корреляции

Если верна основная гипотеза , то статистика

имеет распределение Стьюдента с числом степеней свободы, равным .

При уровне значимости исходная гипотеза отвергается, если справедливо неравенство , где - критическое значение, удовлетворяющее условию .

б) для множественного коэффициента корреляции

При справедливости основной гипотезы статистика

имеет распределение Фишера-Снедекора с и степенями свободы.

При уровне значимости гипотеза отвергается, если выполняется неравенство , где - критическое значение, удовлетворяющее условию .


Интервальная оценка частных коэффициентов корреляции

- выполняется прямое преобразование Фишера значения

: ;

- выбирается квантиль , исходя из условия ;

- вычисляются значения и ;

- с помощью обратного преобразования Фишера находятся границы ДИ:

и .


Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
159599
рейтинг
icon
3275
работ сдано
icon
1404
отзывов
avatar
Математика
Физика
История
icon
156450
рейтинг
icon
6068
работ сдано
icon
2737
отзывов
avatar
Химия
Экономика
Биология
icon
105734
рейтинг
icon
2110
работ сдано
icon
1318
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
63 457 оценок star star star star star
среднее 4.9 из 5
Тгу им. Г. Р. Державина
Реферат сделан досрочно, преподавателю понравилось, я тоже в восторге. Спасибо Татьяне за ...
star star star star star
РЭУ им.Плеханово
Альберт хороший исполнитель, сделал реферат очень быстро, вечером заказала, утром уже все ...
star star star star star
ФЭК
Маринаааа, спасибо вам огромное! Вы профессионал своего дела! Рекомендую всем ✌🏽😎
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Подогнать готовую курсовую под СТО

Курсовая, не знаю

Срок сдачи к 7 дек.

только что
только что

Выполнить задания

Другое, Товароведение

Срок сдачи к 6 дек.

1 минуту назад

Архитектура и организация конфигурации памяти вычислительной системы

Лабораторная, Архитектура средств вычислительной техники

Срок сдачи к 12 дек.

1 минуту назад

Организации профилактики травматизма в спортивных секциях в общеобразовательной школе

Курсовая, профилактики травматизма, медицина

Срок сдачи к 5 дек.

2 минуты назад

краткая характеристика сбербанка анализ тарифов РКО

Отчет по практике, дистанционное банковское обслуживание

Срок сдачи к 5 дек.

2 минуты назад

Исследование методов получения случайных чисел с заданным законом распределения

Лабораторная, Моделирование, математика

Срок сдачи к 10 дек.

4 минуты назад

Проектирование заготовок, получаемых литьем в песчано-глинистые формы

Лабораторная, основы технологии машиностроения

Срок сдачи к 14 дек.

4 минуты назад

2504

Презентация, ММУ одна

Срок сдачи к 7 дек.

6 минут назад

выполнить 3 задачи

Контрольная, Сопротивление материалов

Срок сдачи к 11 дек.

6 минут назад

Вам необходимо выбрать модель медиастратегии

Другое, Медиапланирование, реклама, маркетинг

Срок сдачи к 7 дек.

7 минут назад

Ответить на задания

Решение задач, Цифровизация процессов управления, информатика, программирование

Срок сдачи к 20 дек.

7 минут назад
8 минут назад

Все на фото

Курсовая, Землеустройство

Срок сдачи к 12 дек.

9 минут назад

Разработка веб-информационной системы для автоматизации складских операций компании Hoff

Диплом, Логистические системы, логистика, информатика, программирование, теория автоматического управления

Срок сдачи к 1 мар.

10 минут назад
11 минут назад

перевод текста, выполнение упражнений

Перевод с ин. языка, Немецкий язык

Срок сдачи к 7 дек.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно