это быстро и бесплатно
Оформите заказ сейчас и получите скидку 100 руб.!
ID (номер) заказа
1457673
Ознакомительный фрагмент работы:
Аннотация: В статье строится качественная модель множественной регрессии, характеризующая зависимость валового внутреннего продукта Азербайджана от результатов деятельности железнодорожной отрасли. Проводится анализ выполнимости предпосылок Гаусса-Маркова. Дается экономическая интерпретация результатов построения эконометрической модели.
Ключевые слова: эконометрическая модель, железнодорожный транспорт, пакет «Анализ данных» в Microsoft Excel, метод наименьших квадратов, условия Гаусса-Маркова.
Актуальность.
Значимость настоящего исследования заключается в том, что применение метода корреляционно-регрессионного анализа позволяет получить качественные модели, описывающие взаимосвязи в социально-экономических явлениях и процессах, пригодные для прогнозирования.
Основным результирующим индикатором экономического роста страны является валовой внутренний продукт Азербайджана, млн. манат (Y).
Факторными признаками являются основные результаты деятельности железнодорожного транспорта Азербайджана:
Протяженность дорог, км
Перевозка грузов, тыс. тонн
Грузооборот, млн. т/км
Перевозка пассажиров, тыс. пасс.
Пассажирооборот, млн. пасс./км
Средняя дальность перевозки грузов, км
Средняя дальность перевозки пассажиров, км
Доходы от перевозок, тыс. манат
Расходы на транспорт, тыс. манат
Число работников, человек
Среднемесячная заработная плата работников, манат
Инвестиции в основной капитал, тыс. манат
Ввод в эксплуатацию основных средств, тыс. манат
Количество грузовых вагонов, единиц
Количество пассажирских вагонов, единиц
Количество контейнеров, единиц
Исходные статистические данные собраны …..
По исходным данным построена матрица парных коэффициентов корреляции с помощью инструмента «Корреляция» в Excel (рис. 1), на которой серым цветом выделены коэффициенты корреляции свыше 0,7 по модулю.
Рис. 1. Матрица парных коэффициентов корреляции
Наиболее высокая прямая связь наблюдается между ВВП и среднемесячной заработной платой работников железнодорожного транспорта. Также высоко по шкале Чеддока взаимосвязаны ВВП и такие факторы, как средняя дальность перевозки грузов, средняя дальность перевозки пассажиров, доходы от перевозок, расходы на транспорт, число работников отрасли, количество грузовых вагонов и количество контейнеров. Фактор Х2 – перевозка грузов, не имеет связи с результатом Y – ВВП, т.к. rx2y < 0,1, следовательно, удалим его из дальнейшего анализа.
Проверили наличие мультиколлинеарности между оставшимися факторами с помощью статистики Фаррара-Глоубера.
Расчетное значение статистики Фаррара–Глоубера составило:
FGнабл=-n-1-16(2k+5)lndetR1=469,919 (1)
где n = 18 – количество наблюдений;
k = 15 – количество факторов.
Фактическое значение этого критерия FGнабл сравнили с табличным значением χ2 при 12kk-1 степенях свободы и уровне значимости α= 0,05, определив его с помощью функции ХИ2ОБР.
Поскольку FGнабл > FGкрит (469,919 > 129,918), то в массиве объясняющих переменных существует мультиколлинеарность.
Получили следующие характеристики модели со всеми факторами (табл. 2).
Таблица 2. Фрагмент статистики модели с полным набором факторов
Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 547526,628 686969,477 0,797 0,509
X1 -218,049 269,922 -0,808 0,504
X3 -0,247 2,468 -0,100 0,929
X4 -11,930 12,009 -0,993 0,425
X5 25,880 106,924 0,242 0,831
X6 8,788 237,252 0,037 0,974
X7 -257,151 281,454 -0,914 0,457
X8 0,006 0,275 0,021 0,985
X9 -0,011 0,097 -0,115 0,919
X10 2,357 4,329 0,545 0,641
X11 179,911 111,272 1,617 0,247
X12 0,145 0,432 0,334 0,770
X13 0,166 0,371 0,447 0,698
X14 -4,228 8,911 -0,474 0,682
X15 59,167 119,034 0,497 0,668
X16 -0,198 1,774 -0,112 0,921
Табличное значение t-критерия Стьюдента:
tкрит=СТЬЮДРАСПОБР(0,05;18-4-1)=4,303 (2)
Коэффициент регрессии считается статистически значимым, если tрасч по модулю превышает tкрит – табличное (критическое) значение t-критерия Стьюдента.
Для дальнейшего улучшения из модели удален наименее значимый фактор, то есть фактор Х8 с наименьшим значением tрасч. Затем модель строится заново, и факторы удаляются до тех пор, пока в модели не останутся только значимые факторы. В этом заключается метод пошагового отбора факторов с исключением.
Значимыми являются факторы X1, X4, X7, X10, X11, X14 и X15, но между факторами наблюдается мультиколлинеарность. Чтобы от нее избавиться, воспользуемся алгоритмом Фаррара-Глоубера.
Проверим наличие мультиколлинеарности каждой переменной с другими переменными.
Вычислим обратную матрицу C=R1-1Вычислим F-критерии Fj=cjj-1*n-k-1k,
где cjj – диагональные элементы матрицы C:
F1=4,749-1*18-7-17=5,356F4=26,619F7=18,693F10=35,652F11=17,238F14=82,201F15=30,626Фактические значения F-критериев сравниваем с табличным значением Fтабл = 3,135 при 1= 7 и 2 = (n – k – 1) = 10 степенях свободы и уровне значимости α=0,05, где k – количество факторов.
Так как все Fj > Fтабл, то все факторы мультиколлинеарны с другими.
Вычислим частные коэффициенты корреляции по формуле
rij( )=-cijcii*cjjгде c – элементы матрицы C.
Вычислим t-критерии по формуле:
tij=rij( )n-k-1 1-rij( )2Результат представим в таблице 3.
Таблица 3. Проверка наличия мультиколлинеарности каждой пары переменных
X4 X7 X10 X11 X14 X15
r1j -0,156 -0,477 0,401 0,227 0,044 -0,317
t1j -0,500 -1,716 1,383 0,737 0,141 -1,058
r4j -0,775 0,811 -0,152 -0,856 0,699
t4j -3,872 4,388 -0,487 -5,238 3,088
r7j 0,639 0,166 -0,616 0,505
t7j 2,627 0,533 -2,471 1,850
r10j -0,137 0,599 -0,287
t10j -0,438 2,368 -0,947
r11j -0,487 0,385
t11j -1,764 1,318
r14j 0,870
t14j 5,585
Фактические значения t-критериев сравниваются с табличным значением при степенях свободы (n – k – 1)=10 и уровне значимости α=0,05: tтабл = 2,228. Так как |t14,15| >tтабл и r14,15= 0,8701, то между парами независимых переменных Х14 и Х15 существует сильная мультиколлинеарность.
Для того чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных мультиколлинеарных пар. Удалить следует переменную Х14 из пары Х14 и Х15, так как у нее большее значение F-критерия. Следовательно, она больше влияют на общую мультиколлинеарность факторов.
Построили модель заново, удалили пошагово незначимые по критерию Стьюдента факторы и получили модель со значимыми факторами и отсутствием мультиколлинеарности.
Результат построения модели со значимыми переменными отражен на рис. 2.
Рис. 2. Статистики модели с двумя переменными
Уравнение множественной линейной регрессии с двумя независимыми переменными имеет вид:
Y=396390,324-189,097*Х1+210,475*Х2 (3)
Экономическая интерпретация параметров такова:
при прочих равных условиях при увеличении протяженности дорог в Азербайджане на 1 км валовой внутренний продукт Азербайджана снижается на 189,097 млн. манат;
при прочих равных условиях при увеличении среднемесячной заработной платы работников железнодорожной отрасли на 1 манат валовой внутренний продукт растет на 210,475 млн. манат.
Коэффициент корреляции (Множественный R) двухфакторной модели равен 0,991, что по шкале Чеддока указывает на весьма высокую связь между результатом и факторами.
Коэффициент детерминации (R квадрат) показывает, какую часть дисперсии результативного признака объяснить можно с помощью уравнения регрессии. То есть 98,1% вариации ВВП Азербайджана обусловлено данной моделью.
Оценка значимости уравнения регрессии в целом производится с помощью F-критерия Фишера. C помощью инструмента «Регрессия» пакета «Анализ данных» Excel F-статистика уже рассчитана и находится в ячейке F, равная 396,597.
Табличное значение F-критерия:
Fкрит=FРАСПОБР(0,05;2;18-2-1)=3,682 (4)
Поскольку F>Fкрит, то признается статистическая значимость уравнения в целом с 95% вероятностью.
Поскольку Р-Значение при всех коэффициентах регрессии меньше 0,05, то параметры регрессии являются статистически значимыми и надежными с вероятностью 95% по критерию Стьюдента.
Средняя ошибка аппроксимации составила:
A=1n*(y-y)y*100%=9% (5)
Средняя ошибка аппроксимации не превышает 10%, что говорит о высоком качестве уравнения регрессии, т. е. характеризует хороший подбор модели к реальным исходным данным.
Для того чтобы регрессионная модель, построенная по МНК, имела самые качественные и адекватные оценки, необходимо выполнение следующих условий, известных как условия Гаусса – Маркова:
1. Математическое ожидание остатков в любом наблюдении должно быть равно нулю.
2. В модели возмущение (или зависимая переменная) есть величина случайная, а объясняющая переменная – величина не случайная.
3. Отсутствие систематической связи между значениями остатков в любых двух наблюдениях, то есть отсутствие автокорреляции ряда остатков.
4. Дисперсия остатков должна быть постоянна для всех наблюдений (гомоскедастичность).
5. Остатки εi, i = 1, 2, ... , n, имеют нормальное распределение.
При выполнении предпосылок оценки, получаемые по МНК, будут обладать свойствами несмещенности, состоятельности и эффективности.
Проверили выполнимость условий Гаусса-Маркова.
Рис. 3. Зависимость остатков от Y
На рис. 3 получена горизонтальная полоса, следовательно, остатки не носят систематический характер, математическое ожидание ряда остатков равно нулю (1-я предпосылка выполняется).Остатки не имеют зависимости с факторами Х (2-я предпосылка выполняется).
Статистика Дарбина-Уотсона:
DW=(ei-ei-1)2ei2=2,106 (6)
Поскольку dU=1,53<DW<4-dU=2,47, то расчетное значение критерия Дарбина-Уотсона попадает в область принятия гипотезы об отсутствии автокорреляции остатков, следовательно, 3-я предпосылка МНК выполняется, автокорреляция остатков отсутствует.
Тест Гольдфельда-Квандта:
F=e12e22=1,442(7)
Поскольку F<Fтабл=6,944, то гипотеза об отсутствии гетероскедастичности принимается и 4-я предпосылка выполняется, имеет место гомоскедастичность – постоянство дисперсий остаточных величин.
RS – критерий:
RS=εmax-εminSe=4,394 (8)
Расчетное RS – критерия попадает в интервал, ограниченный табличными значениями (3,18;4,49), и с уровнем значимости α=0,05 гипотеза о нормальности распределения остаточной компоненты принимается и 5-я предпосылка МНК выполняется.
Модель регрессии статистически значима с 95% вероятностью по критерию Фишера так же, как и параметры модели по критерию Стьюдента. Связь между факторами и результатом является весьма тесной, практически функциональной, а также модель адекватна реальным данным, поскольку средняя ошибка аппроксимации менее 10%.
Корреляционно-регрессионный анализ позволил получить статистически значимую и пригодную для прогнозирования регрессионную модель зависимости валового внутреннего продукта Азербайджана от факторов: протяженность дорог и среднемесячная заработная плата работников железнодорожной отрасли.
Снижение валового внутреннего продукта при увеличении протяженности дорог связано в первую очередь с расходами на обслуживание железнодорожных путей и их строительство.
Увеличение валового внутреннего продукта при увеличении среднемесячной заработной платы работников железнодорожной отрасли Азербайджана связано с вкладом работников в конечное потребление домохозяйств.
Список используемой литературы:
Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное моделирование: Учеб. пособие.– М.: Вузовский учебник, 2007.– 365 с.
Статистика. Расчеты в Microsoft Excel: учебное пособие для вузов / В. Б. Яковлев.– 2-е изд., испр. и доп.– М.: Издательство Юрайт, 2018.– 353 с.
Эконометрика: учебник для бакалавриата и магистратуры / И. И. Елисеева [и др.]; под ред. И. И. Елисеевой.– М.: Издательство Юрайт, 2017.– 449 с.
Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников
Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.
Цены ниже, чем в агентствах и у конкурентов
Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит
Бесплатные доработки и консультации
Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки
Гарантируем возврат
Если работа вас не устроит – мы вернем 100% суммы заказа
Техподдержка 7 дней в неделю
Наши менеджеры всегда на связи и оперативно решат любую проблему
Строгий отбор экспертов
К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»
Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован
Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн
Выполнить контрольную работу по Теоретической механике. М-08023
Контрольная, Теоретическая механика
Срок сдачи к 30 дек.
Пересечение криволинейных поверхностей плоскостью треугольника АВС
Решение задач, Начертательная геометрия
Срок сдачи к 10 янв.
выполнить задания
Решение задач, Актуальные проблемы права интеллектуального собственности
Срок сдачи к 28 янв.
Органихзация рекламного агенства
Другое, Организация рекламной и PR-деятельности
Срок сдачи к 2 янв.
Тема: имидж современного руководителя
Курсовая, менеджмент сфере культуры и искусства
Срок сдачи к 26 дек.
Практическая работа по дисциплине «Информационное обеспечение логистических процессов»
Другое, Операционная деятельность в логистике
Срок сдачи к 26 дек.
Заполните форму и узнайте цену на индивидуальную работу!