это быстро и бесплатно
Оформите заказ сейчас и получите скидку 100 руб.!
ID (номер) заказа
2650459
Ознакомительный фрагмент работы:
Введение
Можно сказать, что жизнь человека, да и в целом вся окружающая среда состоит из череды некоторых событий. Хотелось бы все эти события не только отслеживать, но и пытаться прогнозировать. При этом стоит понимать, что многие события или, другими словами, явления – случайные, т. е. они могут наступить, а могут не наступить. Например, выиграть в лотерею автомобиль – событие случайное. Задача любой науки, в том числе и экономической, состоит в выявлении и исследовании закономерностей, которым подчиняются реальные процессы. Найденные закономерности, относящиеся к экономике, имеют не только теоретическую ценность, но и широко применяются на практике.
Математическая статистика – это раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей. Таким образом, теория вероятностей изучает закономерности случайных явлений на основе абстрактного описания, а математическая статистика уже на основе этого описания оперирует непосредственно результатами конкретных наблюдений. Можно сказать, что теория вероятностей – это базис, фундаментальная надстройка математической статистики, которая уже применяется в реальной жизни. В связи с этим план изучения таков: сначала понять основные моменты теории вероятностей, а затем на их основе уже рассмотреть инструментарий математической статистики.
Математическая статистика - наука о математических методах сбора и обработки статистических данных для научных и практических выводов. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных - результатов наблюдений. Во время статистических наблюдений для каждого объекта в ряде случаев можно измерить значение нескольких признаков. Таким образом, получается многомерная выборка. Если многомерную выборку обработать по значениям отдельного признака, то получится обычная обработка одномерной выборки. Смысл обработки многомерных выборок состоит в том, чтобы установить связь между признаками. Связи между ними могут быть функциональными, то есть каждому значению одной величины соответствует определенное значение другой величины. Связь между случайными величинами часто носит случайный характер. Она называется статистической, если изменение одной величины вызывает изменение распределения другой величины. Если среднее значение одной случайной величины функционально зависит от значения другой случайной величины, то такая статистическая зависимость называется корреляционной.
Теоретическая частьДиаграмма рассеивания – (разброса, поле корреляции) – инструмент позволяющий выявить вид и степень зависимости (корреляцию) между парами переменных x, y которые могут представлять:
Характеристику качества и воздействующий на нее фактор
Две характеристики качества
Два фактора, воздействующие на одну и ту же характеристику качества
Диаграмма представляет собой множество точек, координаты которых равны значениям параметров x и y.
Выборочная средняя – это среднее арифметическое значение варианта статистического ряда.
Выборочная дисперсия – среднее арифметическое квадратов отклонений значений выборки от выборки среднего.
Среднее квадратическое отклонение показывает насколько в среднем отклоняются конкретные варианты признака от их среднего значения. Вычисляется путем извлечения корня из дисперсии.
Модой в статистике называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет вариант, имеющий наибольшую частоту.
Медианой в статистике называют величину варианта, которая находится в середине вариационного ряда. Она делит ряд пополам, т.е. по обе стороны от нее находятся одинаковое количество единиц совокупности.
Асимметрия – статистический показатель для сравнительного анализа степени смещения показателей распределения признака относительно среднего значения.
Эксцесс характеризует крутовершинность кривой распределения.
Корреляционный момент – математическое ожидание произведения отклонений этих величин от своих математических ожиданий.
Коэффициент корреляции – это статистический показатель зависимости двух случайных величин.
Полигоном частот называют ломаную, отрезки которой соединяют точки. Для построения полигона частот на оси абсцисс откладывают вариант, а на оси ординат – соответствующие им частоты. Такие точки соединяют отрезками прямых и получают полигон частот.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною, а высоты (в случае равных интервалов) должны быть пропорциональны частотам. При построении гистограммы с неравными интервалами по оси ординат наносят не частоты, а плотность частоты. Это необходимо сделать для устранения влияния величины интервала на распределение и иметь возможность сравнивать частоты.
Практическая частьДана выборка, состоящая из 100 пар чисел Xi,Yi, i=1,2,…, 100.
X Y X Y
6,37 13,6 5,51 12,8
1,65 3,19 4,38 8,37
7,39 16,3 9,81 19,2
9,17 20,3 0,04 0,89
7,61 15,8 5,37 10,6
2,76 7,69 1,48 3,67
2,76 6,75 1,69 2,48
7,25 15,9 7,52 15,3
6,49 15,0 7,00 13,3
2,19 6,42 9,57 19,3
6,44 15,2 1,89 3,33
8,74 16,6 3,36 9,17
8,21 16,2 9,54 19,1
0,31 0,83 4,35 10,3
3,42 8,73 7,42 17,5
6,42 13,4 3,75 10,8
0,52 2,63 3,31 6,95
3,19 6,72 6,99 16,6
1,89 4,47 1,23 3,08
4,40 9,84 5,84 12,1
3,44 7,79 3,49 9,08
2,84 7,61 6,47 14,7
4,30 9,56 9,10 19,3
2,20 5,62 7,92 16,8
0,18 2,61 3,93 10,1
1,70 6,49 0,72 4,42
0,58 3,58 6,61 12,5
0,11 1,25 2,86 5,56
9,06 21,9 7,69 16,5
0,02 0,78 5,73 11,7
1,58 5,99 0,48 2,87
2,61 6,29 0,11 2,13
8,57 16,6 6,72 14,1
3,52 9,37 8,21 19,0
0,29 1,41 3,97 9,83
2,76 5,09 1,28 3,40
2,04 3,57 8,00 17,6
5,27 10,9 7,85 17,6
2,58 6,20 5,30 10,5
5,90 12,9 6,11 13,6
8,67 18,6 1,49 4,20
9,54 19,7 2,90 7,48
7,01 15,9 0,59 2,81
9,12 18,7 5,82 13,7
1,22 1,89 0,03 1,57
7,72 16,1 0,14 1,51
8,53 18,7 2,77 7,22
7,46 16,1 1,33 4,09
7,77 17,1 2,48 5,80
6,43 11,8 9,71 20,7
1. Построить диаграмму рассеивания.
2. Вычислить выборочные средние, выборочные и исправленные дисперсии, средние квадратичные отклонения, моды и медианы, асимметрию, эксцесс выборки по X и по Y, корреляционный момент и коэффициент корреляции (по не сгруппированной выборке).
3. Построить корреляционную таблицу.
4. Построить полигоны, гистограммы нормированных относительных частот, эмпирические функции распределения по X и по Y.
5. Вычислить все числовые характеристики из п. 2 по корреляционной таблице (по сгруппированной выборке).
6. Вычислить параметры для уравнения линейной регрессии Y на X, построить линию регрессии на диаграмме рассеивания.
7. Вычислить параметры для уравнения линейной регрессии X на Y, построить линию регрессии на диаграмме рассеивания.
Решение
Диаграмма рассеяния – это графическое изображение исходных данных. Для его построения внесем данные в MS Excel и построим точечную диаграмму, добавив к нему линию тренда.
1) Выборочная средняя:
x=xiyiyi=6522,15951030,88=6,3272) Выборочная дисперсия:
D=xi-x2yiyi=6657,31481030,88=6,458Дисперсия характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
3) Исправленная дисперсия:
S2=xi-x2yiyi-1=6657,31481029,88=6,4644) Выборочное среднее квадратическое отклонение:
σ=D=6,458=2,541Каждое значение ряда X отличается от среднего значения 6,327 в среднем на 2,541.
5) Исправленное среднее квадратическое отклонение:
s=S2=6,464=2,5426) Мода - наиболее часто встречающееся значение признака у единиц данной совокупности. У совокупности значений X мода Моx=2,76.
7) Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Находим xi, при котором накопленная частота R будет больше y2=515,67. Это значение x51=5,51. Таким образом, медиана Меx=5,51.
8) Асимметрия.
Симметричным является распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой.
Наиболее точным и распространенным показателем асимметрии является моментный коэффициент асимметрии.
As=M3σ3где M3 - центральный момент третьего порядка.
M3=xi-x3yiyi=-10728,09021030,88=-10,4As=M3σ3=-10,42,5413=-0,634Отрицательный знак свидетельствует о наличии левосторонней асимметрии.
9) Эксцесс выборки по X и по Y
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Чаще всего эксцесс оценивается с помощью показателя:
Ex=M4σ4-3Для распределений более островершинных (вытянутых), чем нормальное, показатель эксцесса положительный Ex>0, для более плосковершинных (сплюснутых) – отрицательный Ex<0, т.к. для нормального распределения M4σ4=3.
M4=xi-x4yiyi=102313,451030,88=99,25Ex=99,252,5414-3=2,38-3=-0,62Ex=-0,62<0 - плосковершинное распределение.
10) Корреляционный момент μ случайных величин X и Y описывает взаимодействие этих величин.
μ=xy-xсрyср=65,2216-4,6006*10,3088=17,79511) Коэффициент корреляции rxy характеризует наличие линейной связи между случайными величинами X и Y.
rxy=μσxσy=17,795xi-xср2nyi-yср2n=17,795905,79771003600,6488100=17,7953,0096*6,0005=0,9853Связь между признаком Y фактором X сильная и прямая (определяется по шкале Чеддока).
Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Количество групп можно определить с помощью формулы Стержэсса:
k=1+3,322lnn=1+3,322ln100≈16Зная число групп, рассчитаем длину (размах) интервала:
hx=xmax-xmink=9,81-0,0216=0,611875≈0,61hy=ymax-ymink=21,9-0,7816=1,32Теперь построим интервальные ряды с 16 группами с указанными интервалами.
X Y
[0,02-0,63) [0,78-2,1)
[0,63-1,24) [2,1-3,42)
[1,24-1,85) [3,42;4,74)
[1,85-2,46) [4,74;6,06)
[2,46-3,07) [6,06;7,38)
[3,07-3,68) [7,38;8,7)
[3,68-4,29) [8,7;10,02)
[4,29-4,90) [10,02;11,34)
[4,90-5,51) [11,34;12,66)
[5,51-6,12) [12,66;13,98)
[6,12-6,73) [13,98;15,3)
[6,73-7,34) [15,3;16,62)
[7,34-7,95) [16,62;17,94)
[7,95-8,56) [17,94;19,26)
[8,56-9,17) [19,26;20,58)
[9,17-9,81] [20,58;21,9]
Построим корреляционную таблицу
Данная корреляционная таблица уже при общем знакомстве дает возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить ее направление. В нашем случае частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол (т. е. бóльшим значениям фактора соответствуют бóльшие значения функции). А значит, присутствие наличие прямой корреляционной зависимости между признаками.
Корреляционная таблица
Найдем середины интервалов X и вычислим относительные и накопленные частоты. Относительные частоты будем высчитывать по формуле:
nотнx=nxinnотнy=nyjnНакопленные частоты будем высчитывать по формуле:
nнакопx=xi<xnxinnнакопy=yi<ynyjnПолученные данные занесем в таблицы.
Построим гистограммы относительных частот и полигоны нормированных относительных частот для признаков X и Y.
Запишем эмпирические функции распределения признаков X и Y:
Fx*=0, x≤0,325 0,13, 0,325<x≤0,935 0,16, 0,935<x≤1,5450,24, 1,545<x≤2,155 0,29, 2,155<x≤2,7650,39, 2,765<x≤3,3750,46, 3,375<x≤3,9850,49, 3,985<x≤4,5950,53, 4,595<x≤5,2050,56, 5,205<x≤5,8150,62, 5,815<x≤6,4250,7, 6,425<x≤7,0350,74, 7,035<x≤7,6450,84, 7,645<x≤8,2550,88, 8,255<x≤8,865 0,94, 8,865<x≤9,491, x>9,49Fy*=0, y≤1,44 0,08, 1,44<y≤2,76 0,18, 2,76<y≤4,080,25, 4,08<y≤5,4 0,3, 5,4<y≤6,720,38, 6,72<y≤8,040,43, 8,04<y≤9,360,5, 9,36<y≤10,680,56, 10,68<y≤120,6, 12<y≤13,320,67,13,32<y≤14,640,71, 14,64<y≤15,960,83, 15,96<y≤17,280,88, 17,28<y≤18,60,94,18,6<y≤19,92 0,98,19,92<y≤21,241, y>21,245.
1) Выборочная средняя:
x=xinxin=461,42100=4,614y=yjnyjn=1029,72100=10,2972) Выборочная дисперсия:
Dx=xi-x2nxin=886,8132100=8,868Dy=yi-y2nyjn=3524,16100=35,242Дисперсия характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
3) Исправленная дисперсия:
Sx2=xi-x2nxin-1=886,813299=8,958Sy2=yi-y2nyjn-1=3524,1699=35,5984) Выборочное среднее квадратическое отклонение:
σx=Dx=8,868=2,978Каждое значение ряда X отличается от среднего значения 4,614 в среднем на 2,978.
σy=Dy=35,242=5,936Каждое значение ряда Y отличается от среднего значения 10,297 в среднем на 5,936.
5) Исправленное среднее квадратическое отклонение:
sx=Sx2=8,958=2,993sy=Sy2=35,598=5,9966) Мод у совокупностей значений X и Y нет.
7) Находим xi, при котором накопленная частота Rnxi будет больше nxi2=50. Это значение x8=4,595. Таким образом, медиана Меx=4,595.
Находим yi, при котором накопленная частота Rnyj будет больше nyj2=50. Это значение y8=10,68. Таким образом, медиана Меy=10,68.
8) Коэффициент асимметрии для X:
Asx=M3xσx3где M3x - центральный момент третьего порядка.
M3x=xi-x3nxin=185,38100=1,85Asx=M3xσx3=1,852,9783=0,07Положительный знак свидетельствует о наличии правосторонней асимметрии.
Коэффициент асимметрии для Y:
Asy=M3yσy3где M3y - центральный момент третьего порядка.
M3y=yi-y3nyjn=1504,21100=15,04Asy=M3yσy3=15,045,9363=0,07Положительный знак свидетельствует о наличии правосторонней асимметрии.
9) Эксцесс выборки
Ex=M4σ4-3M4x=xi-x4nxin=13109,37100=131,09Exx=131,092,9784-3=-1,33Ex=-1,33<0 - плосковершинное распределение.
M4y=yi-y4nyjn=214046,19100=2140,46Exy=2140,465,9364-3=-1,28Ex=-1,28<0 - плосковершинное распределение.
10) Корреляционный момент μ:
μx=xnxi-xсрnсрxi=28,839-4,901*6,25=-1,792μy=ynyj-yсрnсрyj=64,358-11,34*6,25=-6,51711) Коэффициент корреляции
rxnxi=μxxi-xср2knxi-nсрxi2k=-1,792126,651612916=-0,22rynyj=μyyi-yср2knyi-nсрyi2k=-6,517592,416169316=-0,44Связь между признаком x фактором nxi слабая и обратная (определяется по шкале Чеддока).
Связь между признаком y фактором nyj умеренная и обратная.
Линейное уравнение регрессии имеет вид y=bx+aВычислим параметры a и b
Sx2=xi2n-xср2=3022,35100-4,6012=9,06b=xy-xсрyсрSx2=65,2216-4,601*10,3099,06=17,799,06=1,9646a=yср-bxср=10,309-1,9646*4,601=1,2707Линейное уравнение регрессии Y на X:
y=1,9646x+1,2707Построим линию регрессии на диаграмме рассеивания, предварительно упорядочив значения X.
Линейное уравнение регрессии имеет вид x=by+aВычислим параметры a и b
Sy2=yi2n-yср2=14227,8100-10,3092=36,01b=xy-xсрyсрSy2=65,2216-4,601*10,30936,01=17,7936,01=0,4942a=xср-byср=4,601-0,4942*10,309=-0,4942Линейное уравнение регрессии X на Y:
x=0,4942y-0,4942Построим линию регрессии на диаграмме рассеивания, предварительно упорядочив значения Y.
ЗаключениеПри выполнении данной курсовой работы я ознакомился с одной из важных тем, которую изучает высшая математика «Элементы математической статистики».
На примере выборки из 100 случайных величин, я применил правила и законы математической статистики, которые получил в ходе прохождения лекций и практических занятий по теории вероятности и математической статистики.
В практической части я выполнил следующие задачи:
Построил диаграмму рассеивания. Вычислил выборочные средние, выборочные и исправленные дисперсии, средние квадратичные отклонения, моды и медианы, асимметрию, эксцесс выборки по X и по Y, корреляционный момент и коэффициент корреляции (по не сгруппированной выборке). Построил корреляционную таблицу. Построил полигоны, гистограммы нормированных относительных частот, эмпирические функции распределения по X и по Y. Вычислил все числовые характеристики из п. 2 по корреляционной таблице (по сгруппированной выборке). Вычислил параметры для уравнения линейной регрессии Y на X, построил линию регрессии на диаграмме рассеивания. Вычислил параметры для уравнения линейной регрессии X на Y, построил линию регрессии на диаграмме рассеивания.
Целью данного курсового проекта является получение навыков самостоятельной обработки большого количества данных (чисел).
Результатом выполнения курсовой работы является умение работы со статистическими данными.
Список литературы1. Гмурман В.Е. Теория вероятностей и математическая статистика: Учебник – 9-е изд., стер. – М.: Высшая школа. 2003г. – 479с.
2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике — Задачник – 3-е изд., перераб. и доп. – М.: Высшая школа, 1979г. – 400с.
3.Гриценко С. А., Маркова И. А. «ТВМС. Часть 1. Теория вероятностей. Учебное пособие». - Дубна: МУПОЧ «Дубна», 2003
4. Кабанова Е. И. Теория вероятностей и математическая статистика: курс лекций / Кабанова Елена Ивановна; Международный университет природы, общества и человека "Дубна". Кафедра высшей математики и информационных систем. - Дубна: Международный университет природы, общества и человека "Дубна", 1996. - 80 с.
5. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник – 3-е изд., стер. – М.: ЮНИТИ, 2007г. – 551с.Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник – 3-е изд., стер. – М.: ЮНИТИ, 2007г. – 551с.
6. Трофимова, Е. А. Теория вероятностей и математическая статистика: учеб. пособие / Е. А. Трофимова, Н. В. Кисляк, Д. В. Гилёв ; [под общ. ред. Е. А. Трофимовой] ; М-во образования и науки Рос. Федерации, Урал. федер. ун-т. – Екатеринбург: Изд-во Урал. ун-та, 2018. – 160 с.
7. Чавлейшвили М.П. Задачи по теории вероятностей – Методическое пособие — Дубна: Университет Дубна, 2000г. – 88с.
8. Чавлейшвили М.П. Задачи по математической статистике – Методическое пособие — Дубна: Университет Дубна, 2003г. – 123с.
Перечень ресурсов информационно-телекоммуникационной сети «Интернет» Электронно-библиотечные системы и базы данных
1. Библиотечная система государственного университета «Дубна»
2. Электронная библиотека студента Библиофонд
Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников
Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.
Цены ниже, чем в агентствах и у конкурентов
Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит
Бесплатные доработки и консультации
Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки
Гарантируем возврат
Если работа вас не устроит – мы вернем 100% суммы заказа
Техподдержка 7 дней в неделю
Наши менеджеры всегда на связи и оперативно решат любую проблему
Строгий отбор экспертов
К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»
Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован
Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн
Требуется разобрать ст. 135 Налогового кодекса по составу напогового...
Решение задач, Налоговое право
Срок сдачи к 5 дек.
Школьный кабинет химии и его роль в химико-образовательном процессе
Курсовая, Методика преподавания химии
Срок сдачи к 26 дек.
Реферат по теме «общественное мнение как объект манипулятивного воздействий. интерпретация общественного мнения по п. бурдьё»
Реферат, Социология
Срок сдачи к 9 дек.
Выполнить курсовую работу. Образовательные стандарты и программы. Е-01220
Курсовая, Английский язык
Срок сдачи к 10 дек.
Изложение темы: экзистенциализм. основные идеи с. кьеркегора.
Реферат, Философия
Срок сдачи к 12 дек.
Заполните форму и узнайте цену на индивидуальную работу!