Построение и оценка производительности дерева принятия решений. Логистическая регрессия
Лабораторная работа
в среде программирования Python
Среда программирования: Python
Название работы: Построение и оценка производительности дерева принятия решений. Логистическая регрессия
Вид работы: Лабораторная работа
Описание: Задание на Лабораторную работу №1.
По курсу «Введение в ИС».
Часть 0. Установить Python, Jupyter NoteBook, подготовить среду.
Часть 1. Подготовка данных для задачи классификации.
1.1. Выбрать датасет. Допускается как выбор собственного, так и одного из предложенных.
1.2. Загрузить датасет.
1.3. Вывести на экран информацию о размерности данных (количество наблюдений и
количество переменных).
1.4. Удалить строки содержащие пропущенные данные.
1.5. Удалить выбросы, попробуйте применить трансформацию данных (rescale)
1.6. Перевести категориальные переменные из формата строки в бинарный (подготовка к
задачи классификации).
1.7. Вывести на экран первые 5 наблюдений.
1.8. Разделить датасет на две подвыборки в пропорции 0.75 и 0.25. 75% наблюдений должно оказаться в первой подвыборке, а остальные 25% во второй.
Часть 2. Построение и оценка производительности дерева принятия решений
2.1. Выбранный и подготовленный к работе набор данных должен быть разделен на
подвыборки для обучения и валидации. Допускается использование кросс-валидации.
2.2. Реализовать/вызвать алгоритм для построения дерева решений с использование gini index.
2.3. Обучить алгоритм на тренировочной выборке и оценить производительность на
тестовой.
2.4. Вывести на экран количество листьев, глубину (depth), значение метрики (gini по
умолчанию).
2.5. Рассчитать и вывести на экран точность для тренировочной и тестовой подвыборок.
2.6. Провести несколько экспериментов, варьирую глубину дерева. Сравнить результаты точности классификации. Постарайтесь упростить дерева без потери в точности.
2.7. Повторите пункты 2.2 – 2.6. с использование коэффициента энтропии (entropy) вместо gini.
2.8. Выбрать лучшее дерево принятия решения.
2.6. Отобразить обученную модель графически.
Часть 3. Логистическая регрессия
2.1. Выбранный и подготовленный к работе набор данных должен быть разделен на
подвыборки для обучения и валидации. Допускается использование кросс-валидации.
2.2. Реализовать/вызвать алгоритм для обучения модели логистической регрессии
2.3. Обучить алгоритм на тренировочной выборке и оценить производительность на
тестовой.
2.4. Вывести на экран параметры модели (коэффициенты и свободный член).
2.5. Рассчитать и вывести на экран точность для тренировочной и тестовой подвыборок.
Часть 4.
4.1. Сравнить результаты построенных моделей с помощью логистической регрессии и дерева принятия решения. Сделать выбор в пользу лучшей модели.
4.2. Оформить отчет. Все пункты задания должны быть задокументированы в отчете с примерами программной реализации и полученными результатами.
Год: 2022
Данный заказ (лабораторная работа) выполнялся нашим сайтом в 2022-м году, в рамках этого заказа была разработана программа в среде программирования Python. Если у Вас похожее задание на программу, которую нужно написать на Python, либо на другом языке программирования, пожалуйста заполните форму, приведённую ниже, после чего Ваше задание в первую очередь рассмотрит наш программист, выполнявший в 2022-м году этот заказ, если он откажется, то Ваше задание оценят другие наши программисты в течение 48-и часов, если оценка нужна срочно, просим Вас оставить пометку об этом - напишите в тексте задания фразу "СРОЧНЫЙ ЗАКАЗ".
Viber:
+79374242235
Telegram: kursovikcom ВКонтакте: kursovikcom WhatsApp +79374242235 E-mail: info@kursovik.com Skype: kursovik.com |