Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Всесторонний анализ данных пассажиров «Титаника» с применением классических методов машинного обучения

Тип Курсовая
Предмет Информатика и программирование

ID (номер) заказа
6291156

500 руб.

Просмотров
372
Размер файла
1.03 Мб
Поделиться

Ознакомительный фрагмент работы:

Содержание

Введение. 2

1. РАЗВЕДОЧНЫЙ АНАЛИЗ ДАННЫХ.. 4

1.1 Постановка задачи. 4

1.2 Загрузка датасета. 5

1.3 Описание датасета. 6

1.4 Корректировка типов данных. 7

1.5 Удаление пропусков, Nan и одинаковых значений. 8

1.6 Корреляции и зависимости. 10

1.7 Выводы.. 13

2. Предварительная обработка данных. 14

2.1 Обработка пропусков. Как было установлено в EDA, наиболее значимые пропуски – в признаках Age, Cabin и Embarked. 14

2.2 Кодирование категориальных признаков. 16

2.3 Масштабирование признаков. 18

3. Линейная регрессия (оценка возраста) 20

3.1 Постановка задачи. 20

3.2 Модель. 21

3.3 Результаты регрессии. 23

3.4 Выводы.. 24

4. Логистическая регрессия (прогноз выживаемости) 25

4.1 Признаки для модели. 25

4.2 Обучение модели. 27

4.3 Оценка качества классификации. 28

ЗАКЛЮЧЕНИЕ. 31

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.. 32

ПРИЛОЖЕНИЕ А.. 33

 

 

Введение

Катастрофа «Титаник» – одно из самых известных кораблекрушений XX века. «Титаник» был крупнейшим пассажирским судном 1912 года; в ночь с 14 на 15 апреля 1912 года, во время своего первого рейса, он столкнулся с айсбергом и затонул в северной Атлантике. В результате погибло 1502 человека из 2224 пассажиров и членов экипажа. Данные о пассажирах, находившихся на борту, были собраны в таблицы. Эти данные стали классическим учебным примером для анализа данных и задач машинного обучения. Цель данной курсовой работы – провести всесторонний анализ данных пассажиров «Титаника» с применением классических методов машинного обучения. Мы последовательно выполним разведочный анализ данных, подготовим данные (очистка, кодирование категориальных признаков, нормализация), построим и обучим модели линейной регрессии (для решения задачи регрессии – оценки возраста) и логистической регрессии (для решения задачи классификации – прогноз выживаемости пассажира).

Для моделей будут рассчитаны соответствующие метрики качества, а результаты проанализированы. В заключении подведём итоги проделанной работы. В ходе исследования используются открытые данные соревнования Titanic: Machine Learning from Disaster с портала Kaggle (файлы train.csv, test.csv и gender_submission.csv). Датасет train.csv содержит информацию о 891 пассажире, включая признак Survived (факт спасения), который будет выступать целевой переменной для модели классификации. Датасет test.csv включает сведения о 418 пассажирах, для которых необходимо предсказать выживаемость (в этой выборке поле Survived отсутствует). Файл gender_submission.csv представляет собой бейслайн-решение: в нём для каждого пассажира из тестовой выборки предсказано выживание исходя только из пола (всем женщинам – выживание, всем мужчинам – гибель).

В работе используются классические методы машинного обучения: линейная регрессия и логистическая регрессия, реализованные с помощью библиотеки scikit-learn. Эти методы выбраны из-за их интерпретируемости и базового характера – они позволяют продемонстрировать основной цикл анализа данных (EDA, предобработка, обучение моделей, оценка качества) без привлечения сложных ансамблевых или нейросетевых алгоритмов.

 

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

  1. Маккинни, У. Python и анализ данных / У. Маккинни ; перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с.
  2. MIPT Statistics – Примеры работы с pandas и seaborn на данных Титаника. Учебный ноутбук с начальным анализом датасета Titanic.

— 228 с.

  1. Loginom Blog – Логистическая регрессия и ROC-анализ – математический аппарат. Статья (2020) с описанием логистической регрессии и ROC-кривой, их применения и интерпретации результатов.
  2. Предварительная обработка данных [Электронный ресурс]. – Режим доступа: https://pythobyte.com/data-preprocessing-0cb9135c/ .
  3. Habr (mzinin) – Простыми словами про метрики в ИИ. Регрессия. MSE, RMSE.... Статья (2019) с простым объяснением метрик качества регрессии (MSE, RMSE, MAE).
  4. Открытый курс по машинному обучению [Электронный ресурс]. – Режим                 доступа:                         https://notebook.community/andreyf/machine-learning- examples/numpy_and_pandas/part1_pandas_intro.

Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
История
Экономика
icon
159599
рейтинг
icon
3275
работ сдано
icon
1404
отзывов
avatar
Математика
Физика
История
icon
156804
рейтинг
icon
6076
работ сдано
icon
2739
отзывов
avatar
Химия
Экономика
Биология
icon
105734
рейтинг
icon
2110
работ сдано
icon
1318
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
56 817 оценок star star star star star
среднее 4.9 из 5
УГЛТУ
Спасибо, курсовой проект выполнен качественно и быстро, всем рекомендую данного исполнителя!!!
star star star star star
ИРНИТУ
Спасибо за качественный подход к выполнению работы. Раньше срока, без замечаний. Исполните...
star star star star star
НГПУ
Приятно было сотрудничать, работа выполнена досрочно, в полном объёме.Рекомендую!
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Решить лабораторную работу

Лабораторная, Теория информации и кодирования

Срок сдачи к 21 апр.

только что

Нужна отличная статья

Статья, Генетика животных

Срок сдачи к 19 апр.

только что

Исмаилов Асеф Асиф оглы Левел мти 4 семестр

Отчет по практике, Технологическая (проектно-технологическая) практика | У.О | Учебная практика

Срок сдачи к 29 апр.

1 минуту назад

Изучить лекции, рп, выполнить самостоятельную и практическую работу, а также ответить на контрольные вопросы.

Другое, Логопедическая работа в системе здравоохранения

Срок сдачи к 10 мая

2 минуты назад

тест по психологии

Тест дистанционно, Психология

Срок сдачи к 22 апр.

3 минуты назад

Изучить лекции и по ним выполнить задания. Сделать презентацию или доклад, сделать самостоят работу, ответить на контрольные вопросы, сделать реферат.

Реферат, Логопед-дефектолог. Методика преподавания математики в специальной (коррекционной) школе

Срок сдачи к 3 мая

5 минут назад

Тест по программированию

Тест дистанционно, Технологии и методы программирования

Срок сдачи к 22 апр.

7 минут назад

Решить примеры

Контрольная, Высшая математика

Срок сдачи к 20 апр.

8 минут назад

Контрольная по предмету «алгебра»

Контрольная, алгебра

Срок сдачи к 19 апр.

10 минут назад

«Расчет переходных процессов в линейных и нелинейных электрических цепях».

Курсовая, Теоретические основы электротехники

Срок сдачи к 22 апр.

11 минут назад

Изучение личности школьника

Отчет по практике, Психология

Срок сдачи к 24 апр.

11 минут назад

Диплом

Курсовая, Управление человеческими ресурсами

Срок сдачи к 21 апр.

11 минут назад

"Развитие системы общей физической подготовки фигуристов на...

Диплом, Теория и методика физического воспитания, физическая культура и спорт

Срок сдачи к 22 апр.

11 минут назад
11 минут назад

Решить задание по биомеханики

Тест дистанционно, Фитнес, физическая культура

Срок сдачи к 30 апр.

11 минут назад

Эйвазова айгюн рафаэль кызы азмир 2 семестр мти

Отчет по практике, Ознакомительная практика | У.О | Учебная практика

Срок сдачи к 28 апр.

11 минут назад

Гулиев Гусейн Салех оглы Левел 4 семестр мти

Отчет по практике, Технологическая (проектно-технологическая) практика | П.В | Производственная практика

Срок сдачи к 28 апр.

11 минут назад

Есть методичка

Курсовая, Теория государства и права

Срок сдачи к 27 апр.

11 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно
    Введите ваш e-mail
    Файл с работой придёт вам на почту после оплаты заказа
    Успешно!
    Работа доступна для скачивания 🤗.