Регистрация
Среда программирования: Без программирования
Название работы: Выполнить анализ в программе RapidMiner и написать отчет. Произвести кластеризацию документов
Вид работы: Лабораторная работа
Тематика работы: Алгоритмы, Прочие
Объем программы: 4 (по десятибалльной шкале)
Уровень сложности: 4 (по десятибалльной шкале)
Разработчик (автор): Программист сайта kursovik.com (письмо автору)
Ключевые слова: RapidMiner, кластеризация документов, подготовка данных, Process Dociment from files, инструментальные средства анализа данных
Функции программы:
Цель работы: научиться пользоваться инструментальными средствами анализа данных
Задача: Произвести кластеризацию документов (можно использовать любые документы, сайты и т.д.)
Скачать последнюю версию RapidMiner.
Ход выполнения работы:
1) Подготовка данных
2) Установка RapidMiner. Установка компонентов textProcessing
3) Использование компоненты - Process Dociment from files и различных фильтров (минимум-3).
4) Проведение кластеризации документов (документов должно быть минимум 20) разными методами (минимум - 2).
5) Оценить алгоритмы (точность, полнота, F-мера)
6) Анализ полученных результатов (полноценный анализ работы)
ОТЧЕТ:
Содержит скриншоты экрана каждого действия с комментариями, подсчеты метрик оценки алгоритмов, вывод по полученному результату.
В ходе выполнения практического задания по анализам данных были подготовлены данные в виде текстовых документов, содержащих различную информацию, установлен соответствующий программный продукт RapidMiner. В нем были использованы четыре различных фильтра для анализа данных, а также была проведена кластеризация документов двумя методами k-Means и X-Means.
В результате полученных значений меры двух алгоритмов, которые близки по значениям, сделан вывод, что для выполнения данной работы могут использоваться как k-Means алгоритм, так и X-Means для анализа данных.
Описание (отчет): Есть на 12 страниц, посмотреть оглавление
Перед покупкой готовой работы не забудьте проверить её оригинальность. Запросить у администратора проверку текущей оригинальности работы по версии системы Антиплагиат.РУ
Задание. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2 1 Подготовка данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 2 Создание нового проекта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4 Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .