Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Комплексная статистическая обработка экспериментальных данных

Тип Реферат
Предмет Экономика
Просмотров
1611
Размер файла
618 б
Поделиться

Ознакомительный фрагмент работы:

Комплексная статистическая обработка экспериментальных данных

Министерство образования и науки Украины

Пояснительная записка

к курсовой работе

по дисциплине Статистика

Комплексная статистическая обработка экспериментальных данных


Реферат

Объектом исследования данной работы является комплексный анализ сгенерированных выборок случайных величин и подбор их закона распределения.

Целью работы является изучение методов и приемов анализа статистической информации, получение навыков и опыта работы в пакете STATISTICA.

В данной работе применялись широко используемые статистические методы обработки и анализа данных.

Результатом работы является освоение методов обработки данных статистического наблюдения, их анализа с помощью обобщающих показателей, установление теоретических законов распределения случайных величин и доказательство адекватности этих законов.

Данную курсовую работу можно использовать в качестве наглядного пособия по обработке статистических данных для различных учебных целей и задач.


Задание на курсовой проект

По специально сгенерированному имитатору получить последовательности случайных чисел двух типов:

а) ,

где – номер варианта,

- номер измерения случайной величины,

– случайное число, возвращаемое при обращении к стандартной функции выбранного языка программирования – датчику случайных чисел.

б) .

Для исследований предусмотреть следующие объёмы измерений для каждой из случайных величин: 100, 200, …, 1000 (объёмы выборок).

Произвести статистический анализ каждой из полученных выборок для двух случайных величин в следующей последовательности:

а) найти размах варьирования;

б) определить целесообразное количество групп по формуле Стерджесса, построить группировку и интервальный ряд;

в) привести графическое изображение полигона частот, гистограммы, кумуляты и эмпирической функции распределения;

г) вычислить и проанализировать точечные оценки и для простого и интервального рядов; построить и проанализировать зависимость величины точечной оценки от объема выборки и от номера эксперимента (10 выборок для объема выборки 1000);

д) построить доверительные интервалы для и , используя различные значения доверительной вероятности (0,9; 0,95; 0,975; 0,995; 0,999) и проанализировать зависимость длины доверительного интервала от объёма выборки и от величины доверительной вероятности;

е) вычислить и проанализировать медиану, коэффициент вариации, коэффициент асимметрии и эксцесс, моду; проанализировать зависимости числовых характеристик от объема выборки;

ж) оценить однородность каждой из выборок, используя:

1) коэффициент вариации;

2) метод -статистик Ирвина.

з) определить, близки ли к нормальному распределению полученные эмпирические распределения на основе:

1) анализа числовых характеристик положения и вариации;

2) на основе критерия согласия Пирсона;

и) по виду гистограмм выдвинуть гипотезу о предполагаемых законах распределений исследуемых случайных величин, определить оценки параметров предполагаемых распределений (метод моментов и максимального правдоподобия) и проверить гипотезу о законе распределения по критерию Пирсона.


Введение

С давних пор человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов, а также связанных с ними вычислений. Люди получали разносторонние, хотя и различающиеся полнотой сведения на различных этапах общественного развития. Данные учитывались повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне – при определении направления экономической и социальной политики, характера внешнеполитической деятельности.

Выполняя самые разнообразные функции сбора, систематизации и анализа сведений, характеризующих экономическое и социальное развитие общества, статистика всегда играла роль главного поставщика факторов для управленческих, научно-исследовательских и прикладных практических нужд различного рода структур, организаций и населения. Роль статистики в нашей жизни настолько значительна, что люди, часто не задумываясь и не осознавая, постоянно используют элементы статистической методологии в повседневной практике.

Применяя статистические методы в экономических исследованиях, можно осуществлять стратегическое планирование, а также анализировать и прогнозировать рыночную конъюнктуру, уменьшая степень неопределенности в отношении внешнего окружения.

С увеличением объемов информации, становится актуальным вопрос ее компьютерной обработки. Получение навыков обработки и анализа экспериментальных данных с помощью компьютера, например, в пакете STATISTICA дает возможность получить полную информацию об исследуемом объекте и найти оптимальное решение конкретной поставленной задачи.


1. Генерация исходных данных

В данной курсовой работе вместо статистического наблюдения используются случайные величины, сгенерированные по следующим формулам:

1) непрерывная случайная величина X, определяемая по формуле 1.1;

(1.1)

2) непрерывная случайная величина У, определяемая по формуле 1.2.

(1.2)

где , - значения случайной величины X и У в различных опытах;

- случайное число, равномерно распределенное на отрезке [0, 1], возвращаемое при обращении к стандартной функции на выбранном языке программирования к датчику случайных чисел; Для генерации исходных данных были использованы следующие методы:

1) Для случайной величины в окне Variable в поле LongName была введена формула 1.3:

(1.3)

2) Для случайной величины был создан программный имитатор в модуле STATISTICABASIC. Реализация алгоритма генерации данных в модуле STATISTICABASIC приведена в приложении А.

В результате были получены выборки, объемом 100, 200…1000 значений для каждой из случайных величин.


2. Первичная обработка результатов наблюдения

2.1 Построение вариационного ряда

Вариационный ряд - упорядоченные по возрастанию значения признака.

Построение вариационного ряда в пакете STATISTICA производилось следующим образом:

вмодуле Basic Statistics and Tables: Analysis → Frequency tables → кнопка Variables длявыборапеременной → отметилиAlldistinctvalues → ОК.

Размах варьирования – абсолютная величина разности между максимальным и минимальным значениями (вариантами) изучаемого признака:

(2.1)

Построение размаха варьирования в пакете STATISTICA производилось следующим образом:

в модуле Basic Statistics and Tables: Analysis → Descriptive statistics → Variables (выбратьпеременную) → нажали Box & whisker plot for all variables → выбрали Median / Quart. / Range → ОК.

Значения размаха варьирования для заданных выборок в таблице 2.1.

Таблица 2.1 – Размах варьирования для заданных выборок

Выборка
10025,2016,99318,20928,8052,42926,376
50025,1106,98418,12633,6950,19633,499
100025,2376,71118,46633,962-1,57435,536

Случайная величина имеет меньший размах, чем случайная величина .

2.2 Группировка статистических данных

Число групп определяется по формуле Стерджесса (2.2):

, (2.2)

где – количество групп;

– объем выборки.

После определения числа групп следует определить интервалы группировки - значения варьирующего признака, лежащие в определенных границах. Величина равного интервала определяется по формуле (2.3):

(2.3)
,

где – число групп интервалов,

– размах выборки .

Ниже приведены значения числа групп интервалов для всех выборок:

При : .

При : .

При :.

При :.

При : .

При :.

При :.

При :.

При : .

При : .

Построение интервального ряда в пакете STATISTICA производилось следующим образом:

а) Analysis→Frequency tables→Variables(выбралипеременную);

б) установили количество интервалов в “No. of exact intervals”, посчитанных по формуле Стерджесса;

в) установили флажки в Display options:

- Cumulative frequencies – накопленные частоты;

- Percentages - частости;

- Cumulative percentages – накопленные частости.

Интервальные ряды по каждой выборке для случайных величин X и Y приведены в таблицах 2.2-2.7 и Д.1-Д.14.

Таблица 2.2 - Интервальный ряд СВ при

ЧастотаКумул. частотаПроцентКумул. процент
5,475289<x<=8,510050888,000008,0000
8,510050<x<=11,54481152315,0000023,0000
11,54481<x<=14,57957163916,0000039,0000
14,57957<x<=17,61433185718,0000057,0000
17,61433<x<=20,64909207720,0000077,0000
20,64909<x<=23,68385139013,0000090,0000
23,68385<x<=26,718621010010,00000100,0000

Таблица 2.3 - Интервальный ряд СВ при

ЧастотаКумул. частотаПроцентКумул. процент
5,850935<x<=8,11673425255,000005,0000
8,116734<x<=10,38253628712,4000017,4000
10,38253<x<=12,648336415112,8000030,2000
12,64833<x<=14,914135520611,0000041,2000
14,91413<x<=17,179937027614,0000055,2000
17,17993<x<=19,445736434012,8000068,0000
19,44573<x<=21,711537441414,8000082,8000
21,71153<x<=23,977335947311,8000094,6000
23,97733<x<=26,24313275005,40000100,0000

Таблица 2.4 - Интервальный ряд СВ при

ЧастотаКумул. частотаПроцентКумул. процент
5,745344<x<=7,79706950505,000005,0000
7,797069<x<=9,84879510615610,6000015,6000
9,848795<x<=11,9005213429013,4000029,0000
11,90052<x<=13,95225883788,8000037,8000
13,95225<x<=16,0039711749511,7000049,5000
16,00397<x<=18,0557012161612,1000061,6000
18,05570<x<=20,1074210772310,7000072,3000
20,10742<x<=22,1591511784011,7000084,0000
22,15915<x<=24,2108711195111,1000095,1000
24,21087<x<=26,262604910004,90000100,0000

Таблица 2.5 - Интервальный ряд СВ при

ЧастотаКумул.ПроцентКумул.
0,231076<x<=4,627075111,000001,0000
4,627075<x<=9,023072676,000007,0000
9,023072<x<=13,41907202720,0000027,0000
13,41907<x<=17,81507315831,0000058,0000
17,81507<x<=22,21107228022,0000080,0000
22,21107<x<=26,60706179717,0000097,0000
26,60706<x<=31,0030631003,00000100,0000

Таблица 2.6 - Интервальный ряд СВ при

ЧастотаКумул.ПроцентКумул.
-1,89766<x<=2,289667220,400000,4000
2,289667<x<=6,47699721234,200004,6000
6,476997<x<=10,66433598211,8000016,4000
10,66433<x<=14,8516612520725,0000041,4000
14,85166<x<=19,0389914735429,4000070,8000
19,03899<x<=23,226329945319,8000090,6000
23,22632<x<=27,41365394927,8000098,4000
27,41365<x<=31,6009874991,4000099,8000

Таблица 2.7 - Интервальный ряд СВ при

ЧастотаКумул.ПроцентКумул.
-3,54794<x<=0,400491550,500000,5000
0,400491<x<=4,3489259140,900001,4000
4,348925<x<=8,29735961756,100007,5000
8,297359<x<=12,2457917725217,7000025,2000
12,24579<x<=16,1942327953127,9000053,1000
16,19423<x<=20,1426626779826,7000079,8000
20,14266<x<=24,0911015495215,4000095,2000
24,09110<x<=28,03953389903,8000099,0000
28,03953<x<=31,9879789980,8000099,8000
31,98797<x<=35,93640210000,20000100,0000

2.3 Графическое изображение рядов распределения

Графическое изображение интервальных рядов включает построения полигона частот, гистограммы и кумуляты.

В пакете STATISTICA построение полигона происходит следующим образом:

а) Analysis → Frequency tables → Variables (выбратьпеременную);

б) установить количество интервалов в “No. of exact intervals”;

в) Frequency tables → Count;

г) нажать правую кнопку мыши и из выпадающего списка выбрать “Custom Graphs”;

д) 2D Graphs → Graph Type → Line Plot. [1]

Построение кумуляты:

а)Analysis → Frequencytables → Variables (выбрать переменную);

б) установить количество интервалов в “No. ofexactintervals”;

в) Frequency tables → Cumul. Count;

г) нажать правую кнопку мыши и выбрать “Custom Graphs”;

д) 2D Graphs → Graph Type → Line Plot (Bar ).

Построение гистограммы происходит следующим образом:

а) Analysis → Frequency tables → Variables (выбратьпеременную);

б) установить количество интервалов в “No. ofexactintervals”;

в) Frequencytables → Percent;

г) нажать правую кнопку мыши и из выпадающего списка выбрать “CustomGraphs”;

д) 2D Graphs → Graph Type → Bar

2.4 Точечные оценки средних показателей

Точечная оценка математического ожидания по вариационному ряду вычисляется по формуле (2.4):

(2.4)

где – значения элементов выборки.

Оценка дисперсии по вариационному ряду вычисляется по формуле (2.5).

(2.5)

Вычисление оценки математического ожидания по интервальному вариационному ряду осуществляется по формуле (2.6):

(2.6)

где – середина -го интервала;

– статистическая вероятность (частость) попадания в -тый интервал.

Оценка дисперсии для интервального ряда вычисляется по формуле (2.7):

(2.7)

Вычисление точечных оценок по вариационному ряду в пакете STATISTICA:

Analysis → Descriptive statistics → Categorization → Number of intervals (установитьколичествоинтервалов) → More statistics → Mean, Variance. [2]

Значения точечных оценок математического ожидания и дисперсии для простого и интервального рядов приведены в таблице 2.8.

Таблица 2.8 – Оценки математического ожидания и дисперсии

ВыборкаМатематическое ожиданиеДисперсия
Простой рядИнтервальный рядПростой рядИнтервальный ряд
()16,25416,27927,84928,517
()16,18916,17426,25926,598
()15,95016,00627,60828,330
()16,66816,93631,12531,113
()15,98916,00730,40631,242
()15,79215,74027,05928,636

Из приведенных данных видно, что полученные оценки математического ожидания и дисперсии по вариационному (простому) и интервальному рядам имеют близкие значения. Причем, чем больше объем выборки, тем более точный результат. От номера эксперимента, то есть от количества испытаний величины точечной оценки не зависят. Это видно на рисунках 2.25 – 2.32.

Рисунок 2.25 - Зависимость от объема выборки для

Рисунок 2.26 - Зависимость от объема выборки для


Рисунок 2.27 - Зависимость от объема выборки для

Рисунок 2.28 - Зависимость от объема выборки для

Рисунок 2.29 - Зависимость от номера эксперимента по


Рисунок 2.30 - Зависимость от номера эксперимента по

Рисунок 2.31 - Зависимость от номера эксперимента по

Рисунок 2.32 - Зависимость от номера эксперимента по


В таблице 2.9 приведены оценки математического ожидания и дисперсии, вычисленные для 10 выборок по 1000 элементов в каждой для случайной величины и случайной величины .

Таблица 2.9 – Точечные оценки выборок из 1000 элементов для и

Выборка
115,79227,83215,75427,421
216,19329,50116,28329,650
316,07629,00615,90028,716
416,05228,88416,09626,124
515,96828,50815,94730,983
616,21228,71016,16329,956
716,21528,74716,03030,011
815,94527,24316,42829,069
916,08028,10316,05428,265
1015,85328,36915,98028,913

2.5 Доверительные интервалы

Для того чтобы оценить достоверность оценок, вводят понятие доверительный интервал и доверительная вероятность.

(2.7)
Доверительный интервал для математического ожидания определяется по формуле (2.7):

где – математическое ожидание генеральной совокупности;

- доверительная вероятность;

- оценка математического ожидания;

(2.8)
- величина доверительного интервала, вычисляется по формуле (2.8):

где - квантиль нормального распределения, получается обратным интерполированием из таблицы для функции распределения стандартного нормального закона. Вычисляется по формуле (2.9).

(2.10)
(2.9)

- оценка дисперсии, вычисляется по формуле (2.10).

Доверительный интервал для дисперсии определяется по формуле (2.11).

(2.12)
,

где – дисперсия генеральной совокупности;

– оценка дисперсии.

– квантиль нормального распределения.

Оценка стандартного отклонения в зависимости от закона распределения случайной величины имеет различное значение.

Для нормального закона распределения эта величина будет равна:


Для равномерного:

Ниже в таблицах 2.10-2.21 приведены доверительные интервалы математического ожидания исследуемых выборок.

-точный метод

Таблица 2.10 - Доверительные интервалы для СВ ,

15,37817,130
15,20717,301
15,05317,455
14,73917,769
14,48118,027

-грубый метод

Таблица 2.11 – Доверительные интервалы для СВ ,

15,37617,132
15,20717,301
15,05817,450
14,75317,755
14,50818,000

-точный метод

Таблица 2.12 - Доверительные интервалы для СВ ,

15,81116,566
15,73816,639
15,67316,704
15,54216,835
15,40816,940

-грубый метод

Таблица 2.13 – Доверительные интервалы для СВ ,

15,79516,553
15,72216,626
15,65716,691
15,52616,822
15,42016,928

-точный метод

Таблица 2.14 - Доверительные интервалы для СВ ,

15,67716,224
15,62416,276
15,57716,323
15,48316,418
15,44716,565

-грубый метод

Таблица 2.15 – Доверительные интервалы для СВ ,

15,72916,283
15,67616,336
15,62916,383
15,53316,479
15,45616,556

-точный метод

Таблица 2.16 – Доверительные интервалы для СВ ,

15,74217,595
15,56117,775
15,39917,938
15,06618,270
15,08418,788

-грубый метод

Таблица 2.17 – Доверительные интервалы для СВ ,

16,01817,854
15,84318,029
15,68718,185
15,36918,503
15,11218,760

-точный метод

Таблица 2.18 – Доверительные интервалы для СВ ,

15,58316,396
15,50516,474
15,43516,544
15,29416,685
15,17716,837

-грубый метод


Таблица 2.19 – Доверительные интервалы для СВ ,

15,59616,418
15,51716,497
15,44716,567
15,30516,709
15,19016,824

-точный метод

Таблица 2.20 – Доверительные интервалы для СВ ,

15,52116,063
15,46916,115
15,42316,161
15,32916,255
15,17816,302

-грубый метод

Таблица 2.21 – Доверительные интервалы для СВ ,

15,46216,018
15,40816,072
15,36116,119
15,26416,216
15,18716,293

Длины доверительных интервалов для математического ожидания при различных уровнях доверительной вероятности приведены в таблице 2.22.

Таблица 2.22 – Длины доверительных интервалов

Длина интервала
()1,7522,0942,4023,033,546
()0,7550,9011,0311,2931,532
()0,5470,6520,7460,9351,118
()1,8532,2142,5393,2043,704
()0,8130,9691,1091,3911,66
()0,5420,6460,7380,9261,124

В таблицах 2.23 – 2.34 указаны доверительные интервалы дисперсии исследуемых выборок.

-точный метод

Таблица 2.23 – Доверительные интервалы для СВ ,

25,05932,793
24,45233,693
23,92634,524
22,91436,280
22,09537,873

-грубый метод

Таблица 2.24 – Доверительные интервалы для СВ ,

26,08430,950
25,61931,415
25,20531,829
24,36232,672
23,68133,353

-точный метод


Таблица 2.25 – Доверительные интервалы для СВ ,

23,37330,586
22,80731,426
22,31632,201
21,37233,838
20,60835,324

-грубый метод

Таблица 2.26 – Доверительные интервалы для СВ ,

24,32928,867
23,89529,301
23,50829,688
22,72230,474
22,08831,108

-точный метод

Таблица 2.27 – Доверительные интервалы для СВ ,

22,25829,128
21,71929,928
21,25230,666
20,35432,225
19,62633,640

-грубый метод

Таблица 2.28 – Доверительные интервалы для СВ ,

23,16927,491
22,75627,904
22,38828,272
21,63929,021
21,03529,625

-точный метод

Таблица 2.29 – Доверительные интервалы для СВ ,

27,34035,779
26,67836,761
26,10437,667
25,00039,582
24,10641,321

-грубый метод

Таблица 2.30 – Доверительные интервалы для СВ ,

28,45933,767
27,95134,275
27,49934,727
26,57935,647
25,83736,389

-точный метод

Таблица 2.31 – Доверительные интервалы для СВ ,

26,57534,777
25,93135,732
25,37436,613
24,30138,474
23,43140,164

-грубый метод

Таблица 2.32 – Доверительные интервалы для СВ ,

27,66232,822
27,16833,316
26,72933,755
25,83534,649
25,11435,370

-точный метод

Таблица 2.33 – Доверительные интервалы для СВ ,

25,16332,930
24,55433,834
24,02634,668
23,01036,431
22,18738,031

-грубый метод

Таблица 2.34 – Доверительные интервалы для СВ ,

26,19331,079
25,72631,546
25,31031,962
24,46332,809
23,78033,492

В таблице 2.35 показано изменение длины доверительного интервала для дисперсии в зависимости от объема выборки и величины доверительной вероятности.


Таблица 2.35 – Длины доверительных интервалов

Величина интервала
()7,7349,24110,59813,36615,778
()7,2138,6199,88512,46614,716
()4,3225,1485,8847,3828,590
()8,43910,08311,56314,58217,215
()8,2029,80111,23914,17316,733
()7,7679,28010,64213,42115,844

Анализируя полученные данные можно заметить, что при увеличении уровня доверительной вероятности увеличивается величина доверительного интервала, а при увеличении объема выборки она уменьшается. Это справедливо как для доверительных интервалов математического ожидания, так и для дисперсии. [3]

2.6 Другие точечные оценки интервального ряда (мода, медиана, коэффициент вариации, коэффициент асимметрии, эксцесс)

Модой в вариационном ряду является наиболее часто встречающееся значение признака.

Мода по интервальному ряду вычисляется по формуле (2.13):

(2.13)

где – левая граница модального интервала (модальным называется интервал, имеющий наибольшую частость);

– величина интервала группировки;

– частота модального интервала;

– частота интервала, предшествующего модальному;

– частота интервала, следующего за модальным.

Медиана – серединное наблюдение в выборке длиной n.

При нечетном n медиана в вариационном ряду есть значение ряда с номером .

При четном n медиана есть полусумма значений с номерами и . В интервальном ряду для нахождения медианы применяется формула (2.14):

(2.14)

где – нижняя граница медианного интервала (медианным называется интервал, накопленная частота которого превышает половину общей суммы частот);

– величина интервала группировки;

– частота медианного интервала;

– накопленная частота интервала, предшествующего медианному.

Коэффициент вариации вычисляется по формуле (2.15):

(2.15)

На основе момента третьего порядка (смотри формулу 2.16) выборочный коэффициент асимметрии находится по формуле (2.17):


(2.16)
(2.17)

С помощью момента четвертого порядка характеризуют свойство рядов распределения, называемое эксцессом. Показатель эксцесса для ранжированного ряда находится по формуле (2.18).

(2.18)

Вычисление точечных оценок по вариационному ряду в пакете STATISTICA происходит следующим образом:

Analysis → Descriptive statistics:

а) Categorization → Number of intervals (установитьколичествоинтервалов);

б) нажать кнопку Morestatistics → откроется окно Statistics, где можно выбрать следующие показатели:

- Mean – выборочное среднее;

- Median – медиана;

- StandardDeviation – стандартное отклонение среднего значения;

- Variance – выборочная дисперсия;

- Skewness – выборочный коэффициент асимметрии;

- Kurtosis – выборочный коэффициент эксцесса;

в) выбрать необходимые параметры и нажать ОК.

Значения медианы, коэффициента вариации, коэффициента ассиметрии и эксцесса приведены в таблице 2.36.


Таблица 2.36 - Медиана, коэффициент вариации, коэффициент ассиметрии и эксцесс

ВыборкаМедиана Коэф. ассиметрии ЭксцессКоэф. вариации
()16,587-0,009-1,0170,326
()16,501-0,058-1,1600,317
()16,1190,007-1,1920,329
()16,531-0,086-0,4490,335
()16,013-0,022-0,1380,345
()15,795-0,0800,1700,329

Анализируя полученные данные, можно сказать, что обе случайные величины имеют практически симметричное распределение, т. к. коэффициенты асимметрии всех выборок близки к нулю,

Случайная величина имеет более пологое распределение (эксцесс для всех ее выборок имеет отрицательное значение). А эксцесс выборок случайной величины практически равен нулю, т.е. "крутизна" распределения случайной величины Y близка к нормальному распределению.

2.7 Оценка однородности выборки

Любая исследуемая совокупность содержит как значения признаков, сложившихся под влиянием факторов, непосредственно характерных для анализируемой совокупности, так и значения признаков, полученных под воздействием иных факторов, не характерных для основной совокупности.

Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). [4]

Из таблицы 2.36 видно, что однородными можно считать выборки случайной величины при равном 100, 500, 1000 и при n равном 1000.

Однородность выборки можно проверить, также используя метод Ирвина, основанный на определении -статистики. При его использовании выявление аномальных наблюдений производится по формуле (2.19).

(2.19)

где – упорядоченная (по возрастанию или по убыванию) исследуемая совокупность;

– значение ряда;

– предыдущее значение ряда;

– среднеквадратическое отклонение.

Если расчетное значение превысит уровень критического, то оно признается аномальным.

Произведя соответствующие расчёты в MicrosoftExcel мы убедились, что ни одно из расчётных значений не превышает уровень критического значения. Это значит, что все выборки случайных величин и – однородны.

2.8 Проверка нормальности эмпирического распределения

2.8.1 Проверка нормальности эмпирического распределения на основе анализа точечных оценок числовых характеристик

Если среднее арифметическое, медиана и мода имеют близкие значения, это указывает на вероятное соответствие изучаемого распределения нормальному закону. Для нормального распределения коэффициент асимметрии и эксцесса равны нулю, а для равномерного эксцесс равен -1,2.

В таблице 2.37 приведены данные для проверки вышеуказанных утверждений.

Таблица 2.37 – Анализ числовых характеристик положения и вариации

равномерный закон (СВ )нормальный закон (СВ )
выборкавыборка
10016,25416,587-0,009-1,01710016,66816,531-0,449
20016,36915,8400,034-1,26420015,68815,7030,712
30016,35516,335-0,092-1,27030015,69615,6550,472
40015,65815,5810,056-1,25440016,77016,954-0,196
50016,18916,501-0,058-1,16050015,98916,013-0,138
60016,04815,897-0,022-1,15860016,04916,008-0,077
70015,96415,956-0,017-1,15970016,31916,576-0,128
80015,86715,6490,072-1,21880015,99016,0820,172
90016,13216,028-0,022-1,24390015,88515,749-0,092
100015,95016,1190,007-1,192100015,79215,7950,170

Анализируя полученные данные, можно сделать вывод о том что значения медианы и среднего арифметического для выборок случайной величины и имеют практически равное значение. Для выборки значение коэффициента ассиметрии, а для выборки случайной величины значение эксцесса практически равно 0. Для случайной величины значение эксцесса практически -1,2. Таким образом, все это свидетельствует о близости распределения случайной величины нормальному распределению, а случайной величины равномерному.

2.9 Определение закона распределения случайных величин

2.9.1 Определение закона распределения случайной величины по виду гистограммы

По виду гистограмм, приведенных на рисунках 2.19-2.21 делаем предположение о том, что случайная величина подчиняется равномерному закону распределения, а случайная величина соответствует нормальному закону распределения, что можно увидеть на рисунках 2.22-2.24.

2.9.2 Определение оценок параметров распределений

Метод моментов

Метод моментов заключается в том, что определенное количество статистических начальных и (или) центральных моментов приравнивается к соответствующим теоретическим моментам распределения случайной величины. Уравнения метода показано в формуле (2.23).

(2.23)
(2.24)
где – теоретический начальный момент -того порядка для непрерывной случайной величины, вычисляется по формуле (2.24):

.

– статистическая оценка соответствующего теоретического момента -того порядка, вычисляется по формуле (2.25):

(2.25)
.

– теоретический центральный момент s-того порядка, вычисляется по формуле (2.26):


(2.26)
.

– статистическая оценка теоретического центрального момента -того порядка, вычисляется по формуле (2.27):

(2.27)
.

Из системы (2.23) находятся параметры распределения. Число уравнений в системе зависит от количества неизвестных параметров. Для нормального и равномерного законов, система должна содержать два уравнения, для экспоненциального – одно.

Для равномерного закона распределения система (2.23) принимает вид (2.28):

(2.28)

Из системы 2.28 нужно найти параметры и .

В таблице 2.38 приведены значения этих параметров, найденные методом моментов и методом максимального правдоподобия.

Таблица 2.38 – Значения параметров и

(метод

моментов)

(метод максимального

правдоподобия)

(метод

моментов)

(метод максимального

правдоподобия)

6,9936,9960,00325,20125,5420,341
6,9847,3130,32925,11025,0650,045
6,7116,8490,13825,23725,0510,186

Из таблицы видно, что значения параметров, найденные разными методами, практически совпадают. Это подтверждает, что случайная величина распределена по равномерному закону.

Метод максимального правдоподобия

По методу максимального правдоподобия, строится так называемая функция правдоподобия (2.29):

(2.29)

где – выборка,

– вектор параметров.

Необходимо найти такие значения вектора , чтобы функция достигала максимума. Для этого строят систему правдоподобия (2.30), содержащую частные производные от функции правдоподобия по всем переменным, приравненные к нулю. Для упрощения вычислений переходят к функции , равной логарифму натуральному от :

(2.30)
.

Оценки параметров, получаемые из этой системы, называют оценками максимального правдоподобия.

Для равномерного закона функция правдоподобия будет иметь вид (2.31)


(2.31)

где и – параметры распределения.

Данная функция будет достигать максимума при условии (2.32):

Судя по полученным оценкам параметров распределения, можно сделать вывод, что наше предположение было верно изначально и случайная величина действительно распределена равномерно.

2.10 Проверка нормальности эмпирического распределения на основе критериев согласия Пирсона

Для проверки гипотезы о соответствии эмпирического распределения нормальному закону распределения необходимо ввести нулевую гипотезу, которая будет проверяться по критерию Пирсона.

: генеральная совокупность распределена по нормальному закону.

В качестве меры расхождения для критерия выбирается величина, равная взвешенной сумме квадратов отклонений статистической вероятности от соответствующей теоретической вероятности, рассчитанных по нормальному закону теоретического распределения вычисляется по формуле (2.20)

(2.20)

где – частота попадания в i-тый интервал;

– объем выборки;

– теоретическая вероятность попадания i-тый интервал:

(2.21)
.

Общая схема применения критерия :

1. Определение меры расхождения по формуле 2.20;

2. Задание уровня значимости ;

3. Определение числа степеней свободы по формуле 2.22.

, (2.22)

где – количество интервалов в интервальном ряду;

– число налагаемых связей, равное числу параметров

предполагаемого закона распределения

4. Область принятия основной гипотезы:

.

Выполнение в пакете STATISTICA.

В модуле NonparametricStatistics (непараметрическая статистика), DistributionFitting. В поле ContinuousDistributions представлены непрерывные распределения, а в поле DiscreteDistributions - дискретные распределения (закон распределения выбираем дважды щелкнув на его название мышью) ®Variable (выбрать переменную) ® в поле Plotdistribution выбираем Frequencydistribution (частоты распределения) ® в поле Kolmogorov-Smirnovtest ставим No → установим необходимые параметры числа интервалов, верхней и нижней границ, среднего и дисперсии → Graph. Результаты проверки соответствия гипотезы приведены в таблице 2.39 и показаны на рисунках 2.41-2.46

Таблица 2.39 – Значения и χ2крит для случайных величин и

ВыборкаГипотеза
()49,497,53Принимается
()49,4911,815Отвергается
()511,111,95Отвергается
()511,125,54Отвергается
()612,5945,51Отвергается
()612,5939,83Отвергается
()612,5948,77Отвергается
()714,140,81Отвергается
()714,149,97Отвергается
()714,176,75Отвергается
()49,492,04Принимается
()49,492,12Принимается
()511,12,78Принимается
()511,12,99Принимается.
()612,593,15Принимается
()612,594,61Принимается
()612,595,07Принимается
()714,15,86Принимается
()714,16,32Принимается
()714,17,16Принимается

На основе полученных данных можно сделать вывод, что случайная величина распределена по нормальному закону, а случайная величина не распределена по нормальному закону.

Анализируя получившиеся графики, делаем вывод, что случайная величина распределена по равномерному закону, а случайная величина – по нормальному.


Заключение

В ходе курсовой работы были освоены методы обработки данных статистического наблюдения, их анализа с помощью обобщающих показателей, установление теоретических законов распределения случайных величин и доказательство адекватности этих законов. Также в результате выполнения данной работы мы приобрели навыки и опыт работы в пакете STATISTICА.

В ходе анализа данных, были сделаны выводы, что основной частью статистического анализа является выявление закона распределения случайной величины, а также, выявление основных факторов, оказывающих влияние на качество оцениваемых параметров закона распределения (длина выборки, её однородность, величина доверительной вероятности). Был произведен статистический анализ каждой из полученных в ходе генерации выборок данных двух случайных величин, был найден закон их распределения. Рассмотрены основные числовые характеристики положения и вариации нормального и равномерного закона.

Полученный опыт работы со статистическими данными и методами их обработки на компьютере позволит гораздо быстрее и эффективнее применять эти методы обработки информации в повседневной жизни, в частности, для экономических исследований и разработок.


Перечень ссылок

случайный величина интервальный выборка

1. Теория статистики: Учебник / Под ред. проф. Р. А. Шмойловой. - 3-е изд., перераб. -М.: Финансы и статистика, 2000. - 560 с.

2. Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. чл.-корр. РАН И. И. Елисеевой. – М.: Финансы и статистика, 1998. – 365 с.: ил.

3. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. – М.: Наука, 1969. – 509 с.

4. Гурман В.Е. Теория вероятностей и математическая статистика. Учеб. пособие для втузов. Изд. 5-е перераб. и доп. – М.: Высш. школа, 1977. – 397 с.

5. Кремер Н.Ш. Теория вероятностей и математическая статистика. – М.: Unity, 2000. – 544 с.

6. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1969. – 576 с.

7. Боровиков В. STATISTICA: искусство анализа данных на компьютере. Для профессионалов. - СПб.: Питер, 2001. - 656 с.


Приложение А

Генерация исходных данных СВ в пакете STATISTICA

Dim ADS As Spreadsheet

Dim STBReport As Report

Dim SUM As Double

Dim LOOP_CASE As Double

Dim I As Double

Sub Main

Set ADS = ActiveDataSet

Set STBReport = Reports.New

For LOOP_CASE = 1 To NCASES(ADS)

For I = 1 To n

SUM = 0

For L = 1 To 300

SUM = SUM + Uniform(1)

Next L

ADS.Value (LOOP_CASE, 1) = N * ((1 / 15) * SUM - 9)

Next I

NEXT_CASE:

Next LOOP_CASE

End Sub


Приложение Б

Интервальные ряды для СВ и

Таблица Д.1 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,289175<x<=8,35505014,00014,0007,0007,000
8,355050<x<=11,4209334,00048,00017,00024,000
11,42093<x<=14,4868033,00081,00016,50040,500
14,48680<x<=17,5526833,000114,00016,50057,000
17,55268<x<=20,6185529,000143,00014,50071,500
20,61855<x<=23,6844323,000166,00011,50083,000
23,68443<x<=26,7503034,000200,00017,000100,000

Таблица Д.2 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,502861<x<=8,11416025,00025,0008,3338,333
8,114160<x<=10,7254637,00062,00012,33320,667
10,72546<x<=13,3367640,000102,00013,33334,000
13,33676<x<=15,9480639,000141,00013,00047,000
15,94806<x<=18,5593639,000180,00013,00060,000
18,55936<x<=21,1706641,000221,00013,66773,667
21,17066<x<=23,7819551,000272,00017,00090,667
23,78195<x<=26,3932528,000300,0009,333100,000

Таблица Д.3 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,555859<x<=8,17667433,00033,0008,2508,250
8,176674<x<=10,7974969,000102,00017,25025,500
10,79749<x<=13,4183054,000156,00013,50039,000
13,41830<x<=16,0391254,000210,00013,50052,500
16,03912<x<=18,6599351,000261,00012,75065,250
18,65993<x<=21,2807558,000319,00014,50079,750
21,28075<x<=23,9015654,000373,00013,50093,250
23,90156<x<=26,5223827,000400,0006,750100,000

Таблица Д.4 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,616825<x<=7,91809942,00042,0007,0007,000
7,918099<x<=10,2193760,000102,00010,00017,000
10,21937<x<=12,5206579,000181,00013,16730,167
12,52065<x<=14,8219278,000259,00013,00043,167
14,82192<x<=17,1231975,000334,00012,50055,667
17,12319<x<=19,4244769,000403,00011,50067,167
19,42447<x<=21,7257492,000495,00015,33382,500
21,72574<x<=24,0270170,000565,00011,66794,167
24,02701<x<=26,3282935,000600,0005,833100,000

Таблица Д.5 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,638499<x<=7,94396348,00048,0006,8576,857
7,943963<x<=10,2494380,000128,00011,42918,286
10,24943<x<=12,5548980,000208,00011,42929,714
12,55489<x<=14,86035100,000308,00014,28644,000
14,86035<x<=17,1658291,000399,00013,00057,000
17,16582<x<=19,4712883,000482,00011,85768,857
19,47128<x<=21,7767594,000576,00013,42982,286
21,77675<x<=24,0822189,000665,00012,71495,000
24,08221<x<=26,3876735,000700,0005,000100,000

Таблица Д.6 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,746050<x<=7,79407450,00050,0006,2506,250
7,794074<x<=9,84209987,000137,00010,87517,125
9,842099<x<=11,8901288,000225,00011,00028,125
11,89012<x<=13,93815110,000335,00013,75041,875
13,93815<x<=15,9861777,000412,0009,62551,500
15,98617<x<=18,0342084,000496,00010,50062,000
18,03420<x<=20,0822283,000579,00010,37572,375
20,08222<x<=22,1302577,000656,0009,62582,000
22,13025<x<=24,1782796,000752,00012,00094,000
24,17827<x<=26,2263048,000800,0006,000100,000

Таблица Д.7 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
5,747041<x<=7,79594846,00046,0005,1115,111
7,795948<x<=9,844855118,000164,00013,11118,222
9,844855<x<=11,8937693,000257,00010,33328,556
11,89376<x<=13,9426784,000341,0009,33337,889
13,94267<x<=15,99158107,000448,00011,88949,778
15,99158<x<=18,0404885,000533,0009,44459,222
18,04048<x<=20,08939108,000641,00012,00071,222
20,08939<x<=22,1383088,000729,0009,77881,000
22,13830<x<=24,18720108,000837,00012,00093,000
24,18720<x<=26,2361163,000900,0007,000100,000

Таблица Д.8 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-3,85839<x<=1,6614752,0002,0001,0001,000
1,661475<x<=7,1813367,0009,0003,5004,500
7,181336<x<=12,7012047,00056,00023,50028,000
12,70120<x<=18,2210679,000135,00039,50067,500
18,22106<x<=23,7409254,000189,00027,00094,500
23,74092<x<=29,260788,000197,0004,00098,500
29,26078<x<=34,780643,000200,0001,500100,000

Таблица Д.9 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-3,50252<x<=1,7663142,0002,0000,6670,667
1,766314<x<=7,03514413,00015,0004,3335,000
7,035144<x<=12,3039763,00078,00021,00026,000
12,30397<x<=17,57280106,000184,00035,33361,333
17,57280<x<=22,8416391,000275,00030,33391,667
22,84163<x<=28,1104621,000296,0007,00098,667
28,11046<x<=33,379293,000299,0001,00099,667
33,37929<x<=38,648121,000300,0000,333100,000

Таблица Д.10 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
1,299935<x<=5,3253105,0005,0001,2501,250
5,325310<x<=9,35068531,00036,0007,7509,000
9,350685<x<=13,3760663,00099,00015,75024,750
13,37606<x<=17,40143117,000216,00029,25054,000
17,40143<x<=21,42681109,000325,00027,25081,250
21,42681<x<=25,4521855,000380,00013,75095,000
25,45218<x<=29,4775616,000396,0004,00099,000
29,47756<x<=33,502934,000400,0001,000100,000

Таблица Д.11 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-1,98797<x<=1,7726501,0001,0000,1670,167
1,772650<x<=5,53327112,00013,0002,0002,167
5,533271<x<=9,29389254,00067,0009,00011,167
9,293892<x<=13,05451100,000167,00016,66727,833
13,05451<x<=16,81513166,000333,00027,66755,500
16,81513<x<=20,57576154,000487,00025,66781,167
20,57576<x<=24,3363888,000575,00014,66795,833
24,33638<x<=28,0970017,000592,0002,83398,667
28,09700<x<=31,857628,000600,0001,333100,000

Таблица Д.12 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-2,68355<x<=1,2451102,0002,0000,2860,286
1,245110<x<=5,17376810,00012,0001,4291,714
5,173768<x<=9,10242541,00053,0005,8577,571
9,102425<x<=13,03108149,000202,00021,28628,857
13,03108<x<=16,95974180,000382,00025,71454,571
16,95974<x<=20,88840178,000560,00025,42980,000
20,88840<x<=24,81705102,000662,00014,57194,571
24,81705<x<=28,7457131,000693,0004,42999,000
28,74571<x<=32,674377,000700,0001,000100,000

Таблица Д.13 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-1,52038<x<=2,4214834,0004,0000,5000,500
2,421483<x<=6,36334237,00041,0004,6255,125
6,363342<x<=10,3052069,000110,0008,62513,750
10,30520<x<=14,24706185,000295,00023,12536,875
14,24706<x<=18,18892231,000526,00028,87565,750
18,18892<x<=22,13078175,000701,00021,87587,625
22,13078<x<=26,0726475,000776,0009,37597,000
26,07264<x<=30,0144920,000796,0002,50099,500
30,01449<x<=33,956353,000799,0000,37599,875
33,95635<x<=37,898211,000800,0000,125100,000

Таблица Д.14 - Интервальный ряд СВ ,

ЧастотаКумул.ПроцентКумул.
-1,06170<x<=2,5783053,0003,0000,3330,333
2,578305<x<=6,21830936,00039,0004,0004,333
6,218309<x<=9,85831371,000110,0007,88912,222
9,858313<x<=13,49832171,000281,00019,00031,222
13,49832<x<=17,13832277,000558,00030,77862,000
17,13832<x<=20,77832176,000734,00019,55681,556
20,77832<x<=24,41833110,000844,00012,22293,778
24,41833<x<=28,0583347,000891,0005,22299,000
28,05833<x<=31,698337,000898,0000,77899,778
31,69833<x<=35,338342,000900,0000,222100,000

Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
159599
рейтинг
icon
3275
работ сдано
icon
1404
отзывов
avatar
Математика
Физика
История
icon
156450
рейтинг
icon
6068
работ сдано
icon
2737
отзывов
avatar
Химия
Экономика
Биология
icon
105734
рейтинг
icon
2110
работ сдано
icon
1318
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
63 457 оценок star star star star star
среднее 4.9 из 5
Тгу им. Г. Р. Державина
Реферат сделан досрочно, преподавателю понравилось, я тоже в восторге. Спасибо Татьяне за ...
star star star star star
РЭУ им.Плеханово
Альберт хороший исполнитель, сделал реферат очень быстро, вечером заказала, утром уже все ...
star star star star star
ФЭК
Маринаааа, спасибо вам огромное! Вы профессионал своего дела! Рекомендую всем ✌🏽😎
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Подогнать готовую курсовую под СТО

Курсовая, не знаю

Срок сдачи к 7 дек.

только что
только что

Выполнить задания

Другое, Товароведение

Срок сдачи к 6 дек.

1 минуту назад

Архитектура и организация конфигурации памяти вычислительной системы

Лабораторная, Архитектура средств вычислительной техники

Срок сдачи к 12 дек.

1 минуту назад

Организации профилактики травматизма в спортивных секциях в общеобразовательной школе

Курсовая, профилактики травматизма, медицина

Срок сдачи к 5 дек.

2 минуты назад

краткая характеристика сбербанка анализ тарифов РКО

Отчет по практике, дистанционное банковское обслуживание

Срок сдачи к 5 дек.

2 минуты назад

Исследование методов получения случайных чисел с заданным законом распределения

Лабораторная, Моделирование, математика

Срок сдачи к 10 дек.

4 минуты назад

Проектирование заготовок, получаемых литьем в песчано-глинистые формы

Лабораторная, основы технологии машиностроения

Срок сдачи к 14 дек.

4 минуты назад

2504

Презентация, ММУ одна

Срок сдачи к 7 дек.

6 минут назад

выполнить 3 задачи

Контрольная, Сопротивление материалов

Срок сдачи к 11 дек.

6 минут назад

Вам необходимо выбрать модель медиастратегии

Другое, Медиапланирование, реклама, маркетинг

Срок сдачи к 7 дек.

7 минут назад

Ответить на задания

Решение задач, Цифровизация процессов управления, информатика, программирование

Срок сдачи к 20 дек.

7 минут назад
8 минут назад

Все на фото

Курсовая, Землеустройство

Срок сдачи к 12 дек.

9 минут назад

Разработка веб-информационной системы для автоматизации складских операций компании Hoff

Диплом, Логистические системы, логистика, информатика, программирование, теория автоматического управления

Срок сдачи к 1 мар.

10 минут назад
11 минут назад

перевод текста, выполнение упражнений

Перевод с ин. языка, Немецкий язык

Срок сдачи к 7 дек.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно