Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Описательные статистика

Тип Реферат
Предмет Маркетинг
Просмотров
1325
Размер файла
43 б
Поделиться

Ознакомительный фрагмент работы:

Описательные статистика

Лабораторная работа 2.

описательная статистика и графики

Описательные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода и т.д.

Идея этих статистик очень проста: вместо того чтобы рассматривать все значения переменной, а их может быть очень много (тысячи и миллионы), вначале стоит просмотреть описательные статистики. Они дают общее представление о значениях, которые принимает переменная.

В программе STATISTICA (Statistics - Basic Statistics/Tables - Descriptive Statistics) можно посчитать:

· Количество значений (Valid N)

· Сумма всех значений (Sum)

· Минимум и максимум (Minimum & Maximum) — это минимальное и максимальное значения переменной.

· Среднее (Mean) — сумма значений переменной, деленная на N (число значений переменной).

· Дисперсия (Variance) и стандартное отклонение (Standard deviation) наиболее часто используемые меры изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны. Стандартное отклонение вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего. Часто стандартное отклонение — более удобная характеристика, т. к измерена в тех же единицах, что исходная величина.

· Медиана (Median) разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например, при описании доходов населения, медиана более удобна, чем среднее.

· Мода (Mode) представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д. Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды — выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-либо, то мультимодальность может означать, что существует несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями.

· Доверительный интервал (95% confidence limits of mean) для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия находится «истинное» (неизвестное) среднее генеральной совокупности. Заметим, что ширина доверительного интервала зависит от объема или размера выборки, а также от разброса (изменчивости) данных. Увеличение размера выборки делает оценку среднего более надежной. Увеличение разброса наблюдаемых значений уменьшает надежность оценки. Вычисление доверительных интервалов основывается на предположении нормальности наблюдаемых величин. Если это предположение не выполнено, то оценка может оказаться плохой, особенно для малых выборок. При увеличении объема выборки, скажем, до 100 или более, качество оценки улучшается и без предположения нормальности выборки.

· Стандартная ошибка среднего значения (Standard error of mean) – это стандартное отклонение, деленное на квадратный корень из объема выборки. В интервале шириной, равной удвоенной стандартной ошибке, отложенному вокруг среднего значения, располагается среднее значение генеральной совокупности с вероятностью примерно 67%. Стандартная ошибка, как и стандартное отклонение, может использоваться в качестве меры разброса переменной. По так называемому правилу кулака, в одном диапазоне стандартного отклонения (охватывающем ширину стандартного отклонения в обе стороны от среднего значения) располагается примерно 67% значений, в диапазоне удвоенного стандартного отклонения – примерно 95%, а в диапазоне утроенного стандартного отклонения – примерно 99% значений. С другой стороны, стандартная ошибка позволяет задать доверительный интервал для среднего значения. В диапазоне удвоенной стандартной ошибки по обе стороны от среднего значения с вероятностью примерно 95% находится среднее значение генеральной совокупности. С вероятностью примерно 99% оно лежит в диапазоне утроенной стандартной ошибки. Часто указывают только одну из мер разброса, обычно – стандартную ошибку, так как ее значение меньше. Но у нас на факультете почти всегда используется стандартное отклонение.

· Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам. Таким образом, медиана и квартили делят диапазон значений переменной на четыре равные части. Различают верхний квартиль, который больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижний квартиль, который меньше медианы и делит пополам нижнюю часть выборки (Lower and Upper quartiles). Нижний квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижнего квартиля. Верхний квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхнего квартиля.

· Размах (Range) – разница между наибольшим и наименьшим значением переменной

· Квартильный (внутриквартильный) размах (Quartile Range) – равен разности значений верхнего и нижнего квартиля. Таким образом, это интервал, содержащий медиану, в который попадает 50% наблюдений.

· Асимметрия (Skewness), или коэффициент асимметрии, является мерой несимметричности распределения. Если этот коэффициент значительно отличается от 0, распределение является асимметричным, т.е. несимметричным. Формально имеем:

А =,

где - среднее, s — стандартное отклонение (сигма), n — число наблюдений.

· Эксцесс (Kurtosis), или коэффициент эксцесса измеряет остроту пика распределения. Оценка эксцесса вычисляется по формуле:

E=

Коэффициент эксцесса равен нулю, если наблюдения подчиняются нормальному распределению. Если он значительно отличается от нулю, гипотезу о том, что данные взяты из нормального распределенной генеральной совокупности, следует отвергнуть.

· Стандартные ошибки асимметрии и эксцесса (Standard error of skewness, Standard error of kurtosis) – это и есть стандартные ошибки асимметрии и эксцесса, аналогичные стандартной ошибке среднего.

Задание 2: данные о стаже и зарплате

1. Загрузите файл данных.

1.1. Скопируйте файл Empl_Data.sta в свою рабочую папку.

1.2. Загрузите файл Empl_Data.sta: File - Open Data -

В файле приведены следующие данные

ID – номер испытуемого;

Gender – пол испытуемого;

Educ – образование испытуемого (количество лет, которые бедняга потратил на учебу);

JCAT – вид профессиональной деятельности (job category: 1 - клерк, 2 - охранник, 3 - менеджер);

Salary – зарплата в настоящий момент (тыс. долларов в год);

SAL_BEG – начальная зарплата на этой работе (тыс. долларов в год);

JTIME – трудовой стаж на данном рабочем месте (число месяцев);

PREVEX – предыдущий опыт – стаж до поступления на данную работу (число месяцев);

MINORITY – принадлежит ли испытуемый к национальному меньшинству (0 – нет, 1 – да).

2. Посчитайте всю ту описательную статистику, которую можно считать, для всех переменных.

2.1. Загружаем модуль описательной статистики:

Statistics - Basic Statistics/Tables - Descriptive Statistics - OK

и выбираем переменные - Variables (кнопка слева вверху) -….

2.2. В разделе Advanced выбираем те статистики, которые нам нужны. Если надо посчитать все, можно нажать на кнопку Select all stats. В том же разделе можно выбрать доверительный интервал (Conf. limits for means, Interval), если не устраивает 95%, заданный по умолчанию.

2.3. Чтобы посчитать описательную статистику можно нажать кнопку Summary или кнопку Summary: Descriptive Statistics. Получится таблица для всех переменных со всеми статистиками.

3. Теперь посчитайте описательную статистику отдельно для группы мужчин и для группы женщин.

Для этого есть кнопочка Select cases – выбрать строки (справа посередине). Нажмите ее. Задайте условие Enable selection condition (включить условия выбора), а затем Include cases - Specific, selected by. В окне By expression введите условия выбора, например, GENDER=’м’. Обратите внимание на одиночные кавычки, в которые следует заключать строковые значения!

Должно получиться что-то вроде этого:

Посчитайте описательную статистику для мужчин. Затем поменяйте условия выбора и посчитайте описательную статистику для женщин. Ответьте на вопросы:

3.1. С вероятностью 0,95 в каких пределах находится средняя зарплата женщин? А мужчин?

3.2. У кого в среднем выше зарплата?

3.3. Кто больше лет посвятил учебе?

3.4. Кто больше проработал на последнем рабочем месте? У кого больше общий стаж?

Не забудьте отключить условия выбора после выполнения задания!


4. Проверка на нормальность. Можно проверить, нормально ли распределена переменная, в разделе Normality. Для этого пометьте птичками K-S and Lilliefors test for normality и Shapiro-Wilk’s W test и нажмите на кнопку Histograms. Верху каждой гистограммы будут приведены результаты трех критериев и уровни статистической значимости для них.

K-S test – это критерий Колмогорова-Смирнова, который знают все преподаватели на факультете и на который можно смело ссылаться.

Кроме того, на гистограмме приведена кривая нормального распределения. Можно оценить нормальность распределения переменной просто визуально.

Проверьте, нормально ли распределены переменные: образование испытуемого; вид профессиональной деятельности; зарплата в настоящий момент; начальная зарплата на этой работе, трудовой стаж на данном рабочем месте и предыдущий опыт работы.

5. Ящик с усами. Находится в разделе Quick. Обратите внимание на кнопку Box & whisker plot for all variables. Выберите одну переменную (например, зарплата) и нажмите на эту кнопку. Если вы хотите построить разные ящики с усами, то можно менять условия в разделе Options - Options for Box-Whisker Plots. Понажимайте различные условия, постройте разные ящики и догадайтесь, зачем они.

6. Для наглядного представления переменных часто используются графики. Построим некоторые из них для изучения возможностей программы.

6.1. Постройте круговую диаграмму для переменной GENDER (файл Empl_Data.sta):

Graphs - 2D Graphs -Pie Charts. Нажав на кнопку Variables, выберите переменную GENDER и нажмите кнопки ОК - ОК. Получите пирог. Правда, красота? Попробуйте сделать пирог толстым, поменять цвет графика, шрифты и все остальное, чтобы график стал еще симпатичнее.

6.2. Постройте трехмерное распределение для двух переменных сразу.

Graphs - 3D Sequential Graphs -Bivariate Histograms

Теперь выберите переменные GENDER в одном из окошек и JCAT в другом. Нажмите кнопки ОК - ОК. Вы увидите распределение мужчин и женщин по различным видам работы. Чтобы лучше рассмотреть график, щелкните два раза кнопкой мыши по фону и в появившемся окне выберите Point of View. Положение графика можно регулировать, пользуясь специальными полосами прокрутки. Добейтесь наглядного изображения распределения мужчин и женщин по видам работы и проанализируйте ситуацию. Кто захватил лучшие места?

Теперь постройте такое же трехмерное распределение для двух других переменных – JCAT и MINORITY. Вращая график, рассмотрите то, что получилось, и проанализируйте ситуацию. Кому живется лучше – неграм или женщинам? Попробуйте поменять цвет, шрифты, вид графика и т.д.

7. Сравните положение мужчин и женщин и напишите отчет в MS Word, используя таблицы и графики, которые считаете нужными. Представьте, что это курсовая работа, в которой вы изучали положение мужчин, женщин и национальных меньшинств в Штатах. Если отчет будет написан плохо – больше в Штаты не попадете!


Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
159599
рейтинг
icon
3275
работ сдано
icon
1404
отзывов
avatar
Математика
Физика
История
icon
156450
рейтинг
icon
6068
работ сдано
icon
2737
отзывов
avatar
Химия
Экономика
Биология
icon
105734
рейтинг
icon
2110
работ сдано
icon
1318
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
63 457 оценок star star star star star
среднее 4.9 из 5
СПбГУТ
Оформил заказ 14 мая с сроком до 16 мая, сделано было уже через пару часов. Качественно и ...
star star star star star
Красноярский государственный аграрный университет
Все сделано хорошо, а самое главное быстро, какие либо замечания отсутствуют
star star star star star
РЭУ им. Г. В. Плеханова
Алексей пошел на встречу, и сделал работу максимально быстро и качественно! Огромное спасибо!
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Подогнать готовую курсовую под СТО

Курсовая, не знаю

Срок сдачи к 7 дек.

только что
только что

Выполнить задания

Другое, Товароведение

Срок сдачи к 6 дек.

1 минуту назад

Архитектура и организация конфигурации памяти вычислительной системы

Лабораторная, Архитектура средств вычислительной техники

Срок сдачи к 12 дек.

1 минуту назад

Организации профилактики травматизма в спортивных секциях в общеобразовательной школе

Курсовая, профилактики травматизма, медицина

Срок сдачи к 5 дек.

2 минуты назад

краткая характеристика сбербанка анализ тарифов РКО

Отчет по практике, дистанционное банковское обслуживание

Срок сдачи к 5 дек.

2 минуты назад

Исследование методов получения случайных чисел с заданным законом распределения

Лабораторная, Моделирование, математика

Срок сдачи к 10 дек.

4 минуты назад

Проектирование заготовок, получаемых литьем в песчано-глинистые формы

Лабораторная, основы технологии машиностроения

Срок сдачи к 14 дек.

4 минуты назад

2504

Презентация, ММУ одна

Срок сдачи к 7 дек.

6 минут назад

выполнить 3 задачи

Контрольная, Сопротивление материалов

Срок сдачи к 11 дек.

6 минут назад

Вам необходимо выбрать модель медиастратегии

Другое, Медиапланирование, реклама, маркетинг

Срок сдачи к 7 дек.

7 минут назад

Ответить на задания

Решение задач, Цифровизация процессов управления, информатика, программирование

Срок сдачи к 20 дек.

7 минут назад
8 минут назад

Все на фото

Курсовая, Землеустройство

Срок сдачи к 12 дек.

9 минут назад

Разработка веб-информационной системы для автоматизации складских операций компании Hoff

Диплом, Логистические системы, логистика, информатика, программирование, теория автоматического управления

Срок сдачи к 1 мар.

10 минут назад
11 минут назад

перевод текста, выполнение упражнений

Перевод с ин. языка, Немецкий язык

Срок сдачи к 7 дек.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно