Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Статистический анализ рядов распределения

Тип Реферат
Предмет Маркетинг
Просмотров
1483
Размер файла
2 б
Поделиться

Ознакомительный фрагмент работы:

Статистический анализ рядов распределения

Министерство образования и науки Российской Федерации

Государственное образовательное учреждение высшего

профессионального образования

«Санкт-Петербургский государственный

политехнический университет»

Факультет экономики и менеджмента

Кафедра «Предпринимательство и коммерция»

КУРСОВОЙ ПРОЕКТ

по дисциплине «Статистика»

на тему «Статистический анализ рядов распределения. Проверка гипотезы о законе распределения»

Выполнил____________

(подпись)

Принял:Магистр коммерции

____________

(подпись)

«__» _________ 2010 г.

Санкт-Петербург

2010

ДАННЫЕ, ВАРИАЦИОННЫЙ РЯД, РАНЖИРОВАНИЕ, ВЫБРОСЫ, ГИСТОГРАММА, ПОЛИГОН, КУМУЛЯТА, ИНТЕРВАЛЬНЫЕ РЯДЫ , СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ, СГЛАЖИВАНИЕ ИМПЕРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ, ГИПОТЕЗА

В курсовом проекте рассмотрена реализация анализа распределений с использованием программы STATISTICA, а также произведены расчеты основных статистических показателей.


СОДЕРЖАНИЕ

Введение…………………………………………………………………стр.4

1. Табличное и графическое представление вариационного ряда распределения………………………………………………………стр.5

2. Расчет основных характеристик вариационного ряда………...стр.17

3. Сглаживание эмпирического распределения, проверка гипотезы о законе распределения……………………………………………...стр.21

Заключение………………………………………………...……………стр.25

Список использованных источников…………………………………..стр.26

Введение

Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.

Ряды распределения могут быть вариационным, если они строятся на основе количественного признака, или атрибутивным, если они строятся на основе атрибутивного признака.

Изучение вариационных рядов распределения позволяет: определить типический уровень признака в изучаемой совокупности; определить наличие выбросов и решить вопрос о необходимости их самостоятельного изучения; оценить степень разброса значений признака вокруг типического уровня; изучить структуру совокупности; охарактеризовать форму распределения, а также подобрать теоретическое распределение, на основе которого можно моделировать поведение распределения изучаемой совокупности.

На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

Ряды распределения могут быть представлены в табличной форме и графически.

Целью проекта является освоение методики и приобретение практических навыков анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения.

В курсовом проекте рассматривается реализация анализа распределений с использованием программы STATISTICA.

STATISTICA – это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе, а также специальные методы добычи данных.

1. Табличное и графическое представление

вариационного ряда

Проект выполнен на основе исследования данных о числе собственных легковых автомобилей на 1000 человек по различным округам, республикам, краям в 2001 году.

Исходные данные приведены в Табл. 1.1.

Табл.1.1

Число собственных легковых автомобилей

на 1000 человек в 2001г.

Номер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилей
114716122,23146,646110,161158,676115,4
262,117100,33256,447118,562132,377114,1
3112,8181973396,64868,363112,578120,2
4172,91916634118,3491076481,779115,1
593,820115,735104,95097,96594,180187,7
61212192,736115,651112,86616681134,6
71052269,73734,452150,867126,182150,7
8114,7231213817253107,568120,583197,7
9132,724216,939136,854165,46950,48419,6
10183,425141,440119,355129,57010,885173,1
11119,826149,741131,256122,87114086196
1211927106,242142,857122723487124,9
13107,428127,74313458104,373117,48820,8
14135,429168,14486,759180,47494,8
15133,830147,64585,760113,275130,7

Построение ряда распределения начинается с ранжирования ряда распределения по величине соответствующего признака. Ранжирование – это расположение единиц совокупности в порядке возрастания или убывания значений признака. Для этого выбираем в меню Data опцию Sort. Далее в поле Direction выбираем тип сортировки – по возрастанию значений признака (Ascending). Получим значения признака, упорядоченные по возрастанию (см. Табл.1.2). Построение ранжированного ряда позволяет увидеть наличие в совокупности выбросов. Выбросы - значения признака, резко отличающиеся в меньшую или большую сторону от основной массы значений признака.

Табл. 1.2

Исходные данные, ранжированные по возрастанию значений признака

Номер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилей
110,81693,831112,846120,261133,876166
219,61794,132112,847120,56213477166
320,81894,833113,24812163134,678168,1
4341996,634114,14912164135,479172
534,42097,935114,75012265136,880172,9
646,621100,336115,151122,26614081173,1
750,422104,337115,452122,867141,482180,4
856,423104,938115,653124,968142,883183,4
962,12410539115,754126,16914784187,7
1068,325106,240117,455127,770147,685196
1169,72610741118,356129,571149,786197
1281,727107,442118,557130,772150,787197,7
1385,728107,54311958131,273150,888216,9
1486,729110,144119,359132,374158,6
1592,730112,545119,860132,775165,4

В данной совокупности выбросами являются значения регионов под номерами 1, 2, 3, 88, т.е. данные 10,8; 19,6; 20,8 и 216,9 резко отличаются от основной части значений признака. Поэтому при анализе совокупности в дальнейшем исключим эти значения признака. Каждое из них выделяется и стирается простым нажатием кнопки Delete на клавиатуре. Также удаление значений (выбросов) из ячеек, можно провести как удаление наблюдений, то есть строк. В итоге изучаемая совокупность будет состоять из 84 значений признака (см.Табл.1.3).

Табл.1.3

Исходные данные за исключением выбросов,

ранжированные по возрастанию значений признака

Номер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилейНомер регионаЧисло легковых автомобилей
1341696,631114,14612161135,476172
234,41797,932114,74712262136,877172,9
346,618100,333115,148122,26314078173,1
450,419104,334115,449122,864141,479180,4
556,420104,935115,650124,965142,880183,4
662,12110536115,751126,16614781187,7
768,322106,237117,452127,767147,682196
869,72310738118,353129,568149,783197
981,724107,439118,554130,769150,784197,7
1085,725107,54011955131,270150,8
1186,726110,141119,356132,371158,6
1292,727112,542119,857132,772165,4
1393,828112,843120,258133,873166
1494,129112,844120,55913474166
1594,830113,24512160134,675168,1

Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

Для построения таблицы вариационного ряда выбираем следующий путь: меню Statistics/Basic Statistic Tables. Впоявившемсядиалоговомокневыбираемпункт Frequency tables. Выбрав переменную, содержащую ранжированный ряд с учетом выбросов, переходим на закладку Advanced. Задаем параметры построения таблицы. Нажимаем кнопку Summary, и появляется расчетная таблица частот (см.Табл.1.4).

Табл.1.4

Рассчитанная таблица частот с интервалом 10 (k = 10)

Далее представлены таблицы вариационного ряда, построенные с использованием разного числа интервалов (k = 15, k = 5 и k = 8).

Табл.1.5

Рассчитанная таблица частот с интервалом 15 (k = 15)

Табл.1.6

Рассчитанная таблица частот с интервалом 5 (k = 5)

Табл.1.7

Рассчитанная таблица частот с интервалом 8 (k = 8)

Для графического представления рядов распределения используются, в основном, три вида графиков:

1. Полигон распределения.

2. Гистограмма распределения.

3. Кумулята распределения.

Наряду с этим, STATISTICA дает возможность получать графические представления эмпирического распределения, широко используемые в зарубежной статистической литературе, как учебной, так и профессиональной. Речьидетографиках Box-and- Whisker Plot, Hanging Bars.

Гистограмма (или столбиковая диаграмма) строится только для интервальных вариационных рядов. Основаниями столбиков гистограммы, являются интервалы значений варьирующего признака, а высота столбиков соответствует частоте каждого интервала.

Для построения гистограммы удобно воспользоваться кнопкой Histograms на закладке Advanced меню Frequency Tables, которым мы пользовались для построения таблиц. При этом условия построения гистограмм должны полностью соответствовать условиям построения таблиц.

На построенных графиках (рис. 1.1, 1.2, 1.3, 1.4) помимо гистограммы нанесена кривая нормального распределения (обозначена красным цветом).

Гистограмма регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2005 г. с наложенными на них кривыми нормального распределения: с числом интервалов k = 10

Рис. 1.1

Гистограмма регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2005 г. с наложенными на них кривыми нормального распределения: с числом интервалов k = 15

Рис. 1.2

Гистограмма регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2005 г. с наложенными на них кривыми нормального распределения: с числом интервалов k = 5

Рис. 1.3

Гистограмма регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2005 г. с наложенными на них кривыми нормального распределения: с числом интервалов k = 8

Рис. 1.4

При k = 10 получено много малонаполненных групп, наблюдаются две вершины и получается плосковершинное распределение (равные частоты в двух группах). Такой интервал нам не подходит.

При k = 15 получено еще больше малонаполненных групп, чем при k = 10, а также у 2, 3 и 5 групп соответственно равные частоты, что приводит в плосковершинному распределению. Интервал, равный 15, тоже не подходит.

При k = 8 наблюдаются две вершины, в двух группах равные частоты. И вообще распределение не является нормальным, т.к. частота в третьей группе ниже, чем во второй. Этот интервал также не подходит нам.

Выбирая окончательный вариант табличного представления вариационного ряда в нашем примере, следует остановиться на группировке с использованием 5 групп. Все группы вполне наполнены, наблюдается одна вершина, нет плосковершинного распределения.

Ниже представлены полигон и кумулята для вариационного ряда с использованием 5 групп.

Полигон распределения целесообразнее использовать для рядов, построенных по дискретному признаку. Если полигон строится по интервальному вариационному ряду, то в качестве значения признака берется середина интервала. По оси Х откладываются значения признака, по оси Y – частоты (частости).

Для построения полигона на основе абсолютных частот необходимо выделить столбец Count в таблице частот и щелкнуть на нем правой кнопкой мыши.

Полигон регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2001г. при k=5

Рис. 1.5

Для построения полигона по относительным частотам, кумуляты по абсолютным и относительным частотам выбираются соответственно столбцы Percent, Cumulative count , Cumulative percent в таблице частот.

Кумулята регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2001г. при k=5

Рис. 1.6

Полигон регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2001г. при k=5

Рис. 1.7

Кумулята регионов России по значению показателя «Число собственных легковых автомобилей на 1000 человек» в 2001г. при k=5

Рис. 1.8

Одним из приемов компактного изображения статистической совокупности, находящимся вне отечественной традиции, является "Box-and-Whisker Plot" — "ящик с усами". Рассматриваемая процедура обеспечивает как диагностическую, так и описательную информацию об исследуемой совокупности.

Для ее реализации запускаем процедуру Graphs/2D Graphs/Box Plots. В появившемся окне удобно сразу же выбрать интересующий нас тип графика (в поле Graph Type выбираем Box-Whiskers). Остальные свойства графика удобнее всего настроить, перейдя на закладку Advanced.

График появляется в вертикальном виде, однако, на практике принято рассматривать его горизонтально. Для того чтобы повернуть график на 90 градусов, нужно щелкнуть в поле графика правой кнопкой мыши и выбрать меню Graph Properties (All options). Далеепереходимкзакладке Graph layout: вполе Axis position вместофункции Standard выбираем Reserved, тоестьобратноеположениеосиабсцисс. НажимаемОК.

Диаграмма "Box-and-Whisker Plot" — "ящик с усами"

Рис.1.9

Метод "Box-and-Whisker Plot" также дает полезную информацию о концентрации, дисперсии и асимметрии распределения, но наряду с этим исследователь получает наглядное представление о том, что происходит на концах распределения.

В качестве дополнения отметим, что система дает также возможность получить нетрадиционное графическое представление о том, как соотносятся между собой эмпирическое распределение и его нормальная аппроксимация. Речь идет о графике "Hanging Histobars" или “Hanging Bars” (в весьма вольном переводе – «висячие полоски»). Канонизированного термина на русском языке нет, потому будем обозначать рассматриваемую процедуру как "HH-график".

Для его представления необходимо запустить процедуру Graphs/2D Graphs/Histograms и далее перейти к закладке Advanced.

Диаграмма “Hanging Bars”

Рис.1.10

HH-процедура выводит на экран изображение близкое к гистограмме, с тем только различием, что столбцы гистограммы не опираются на горизонтальную ось, а "подвешены" (Hanging) к кривой нормального распределения в точках, соответствующих серединам интервалов группировки.

2. Расчет основных характеристик вариационного ряда

Статистический анализ вариационных рядов распределения предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.

В качестве показателей центральной тенденции распределения используются: среднее арифметическое значение, мода и медиана. Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие перцентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.

В программе STATISTICA, как и в других статистических ППП, есть возможность получить все перечисленные показатели, пользуясь одной процедурой. В главном меню раздел Statistics, активизируем опцию Basic Statistics/Tables. Затем, в появившемся контекстном окне, выбирается процедура Descriptive statistics – описательные статистики. Закладка Advanced предлагает пользователю сформировать набор вычисляемых статистик, отвечающих целям анализа.

Ниже приведены результаты расчета основных статистических характеристик.

Табл.2.1

Основные характеристики распределения регионов России по значению

показателя «Число собственных легковых автомобилей на 1000 человек» в 2001 г.

Valid N – объем выборки (число единиц в совокупности). У нас 84 региона.

Mean – средняя арифметическая. ,

где n – объем совокупности (число единиц);

Хi – значение признака у I-ой единицы совокупности.

Средняя арифметическая величина – отношение объема признака к объему совокупности. Данная средняя используется для расчета средних значений абсолютных показателей по не сгруппированным данным.

Median – медиана. Это значение признака у единицы, делящий ранжированный ряд пополам.


Mode – мода определяется непосредственно по исходным данным (запись в строке Multiple означает, что распределение имеет не одну моду). Это наиболее часто встречающееся значение признаков совокупности.

Frequency – частота модального значения.

Sum – сумма значений признака в совокупности.

Variance – дисперсиия.

Показатель дисперсии в экономических исследованиях содержательно не интерпретируется, но благодаря своим свойствам широко используется для расчета многих статистических характеристик.

Standard deviation – среднее квадратическое (стандартное) отклонение.

Minimum – минимальное значение признака в совокупности: x min .

Maximum – максимальное значение признака в совокупности: x max.

Range – размах вариации.

Lower (Lower quartile)нижний (первый) квартиль.

Upper (Upper quartile)–верхний (третий) квартиль.

Quartile (Interquartile range) – межквартильныйразмах: Q3 – Q1.

Skewness–асимметрия.

Табл.2.2

Сравнение статистических показателей, рассчитанных

различными способами

№ п/пПоказатель

Значение в ППП

STATISTICA

Значение после ручного расчета
1Средняя арифметическая122,2202122,2202
2МодаMultipleMultiple
3Медиана120,0000120,0000
4Дисперсия1239,1301239,130
5Среднее квадратическое отклонение35,2012835,20128
6Частота модального значения22
7Сумма значений признака10266,5010266,50
8Верхний квартиль140,7000140,7000
9Нижний квартиль105,6000105,0000

Среди рассчитанных характеристик нет такого важного показателя вариации, как коэффициент вариации (принято рассчитывать в процентах):

В нашем случае коэффициент вариации равен:

V = (35,20128/122,2202)*100 = 28,8 %.

Заключение

В данном курсовом проекте была рассмотрена реализация анализа распределений с использованием программы STATISTICA, а также произведены расчеты основных статистических показателей.

Таким образом, по итогам курсового проекта я освоила методику и приобрела практические навыки анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения.


Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
159599
рейтинг
icon
3275
работ сдано
icon
1404
отзывов
avatar
Математика
Физика
История
icon
156450
рейтинг
icon
6068
работ сдано
icon
2737
отзывов
avatar
Химия
Экономика
Биология
icon
105734
рейтинг
icon
2110
работ сдано
icon
1318
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
63 457 оценок star star star star star
среднее 4.9 из 5
Тгу им. Г. Р. Державина
Реферат сделан досрочно, преподавателю понравилось, я тоже в восторге. Спасибо Татьяне за ...
star star star star star
РЭУ им.Плеханово
Альберт хороший исполнитель, сделал реферат очень быстро, вечером заказала, утром уже все ...
star star star star star
ФЭК
Маринаааа, спасибо вам огромное! Вы профессионал своего дела! Рекомендую всем ✌🏽😎
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Подогнать готовую курсовую под СТО

Курсовая, не знаю

Срок сдачи к 7 дек.

только что
только что

Выполнить задания

Другое, Товароведение

Срок сдачи к 6 дек.

1 минуту назад

Архитектура и организация конфигурации памяти вычислительной системы

Лабораторная, Архитектура средств вычислительной техники

Срок сдачи к 12 дек.

1 минуту назад

Организации профилактики травматизма в спортивных секциях в общеобразовательной школе

Курсовая, профилактики травматизма, медицина

Срок сдачи к 5 дек.

2 минуты назад

краткая характеристика сбербанка анализ тарифов РКО

Отчет по практике, дистанционное банковское обслуживание

Срок сдачи к 5 дек.

2 минуты назад

Исследование методов получения случайных чисел с заданным законом распределения

Лабораторная, Моделирование, математика

Срок сдачи к 10 дек.

4 минуты назад

Проектирование заготовок, получаемых литьем в песчано-глинистые формы

Лабораторная, основы технологии машиностроения

Срок сдачи к 14 дек.

4 минуты назад

2504

Презентация, ММУ одна

Срок сдачи к 7 дек.

6 минут назад

выполнить 3 задачи

Контрольная, Сопротивление материалов

Срок сдачи к 11 дек.

6 минут назад

Вам необходимо выбрать модель медиастратегии

Другое, Медиапланирование, реклама, маркетинг

Срок сдачи к 7 дек.

7 минут назад

Ответить на задания

Решение задач, Цифровизация процессов управления, информатика, программирование

Срок сдачи к 20 дек.

7 минут назад
8 минут назад

Все на фото

Курсовая, Землеустройство

Срок сдачи к 12 дек.

9 минут назад

Разработка веб-информационной системы для автоматизации складских операций компании Hoff

Диплом, Логистические системы, логистика, информатика, программирование, теория автоматического управления

Срок сдачи к 1 мар.

10 минут назад
11 минут назад

перевод текста, выполнение упражнений

Перевод с ин. языка, Немецкий язык

Срок сдачи к 7 дек.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно