-
Notifications
You must be signed in to change notification settings - Fork 17
MMO_RK_1
Необходимо подготовить отчет по рубежному контролю и разместить его в Вашем репозитории. Вы можете использовать титульный лист, или в начале ноутбука в текстовой ячейке указать Ваши Ф.И.О. и группу.
Номер варианта | Номер задачи №1 | Номер задачи №2 |
---|---|---|
1 | 1 | 21 |
2 | 2 | 22 |
3 | 3 | 23 |
4 | 4 | 24 |
5 | 5 | 25 |
6 | 6 | 26 |
7 | 7 | 27 |
8 | 8 | 28 |
9 | 9 | 29 |
10 | 10 | 30 |
11 | 11 | 31 |
12 | 12 | 32 |
13 | 13 | 33 |
14 | 14 | 34 |
15 | 15 | 35 |
16 | 16 | 36 |
17 | 17 | 37 |
18 | 18 | 38 |
19 | 19 | 39 |
20 | 20 | 40 |
21 | 5 | 23 |
22 | 7 | 33 |
Для студентов групп ИУ5-21М, ИУ5-22М, ИУ5-23М, ИУ5-24М номер варианта = номер в списке группы.
Для студентов групп ИУ5И-21М, ИУ5И-22М, ИУ5И-23М, ИУ5И-24М номер варианта = 15 + номер в списке группы.
Дополнительные требования по группам:
- Для студентов групп ИУ5-21М, ИУ5И-21М - для пары произвольных колонок данных построить график "Диаграмма рассеяния".
- Для студентов групп ИУ5-22М, ИУ5И-22М - для произвольной колонки данных построить гистограмму.
- Для студентов групп ИУ5-23М, ИУ5И-23М - для произвольной колонки данных построить график "Ящик с усами (boxplot)".
- Для студентов группы ИУ5-24М, ИУ5И-24М - для произвольной колонки данных построить график "Скрипичная диаграмма (violin plot)".
Каждая задача предполагает использование набора данных. Набор данных выбирается Вами произвольно с учетом следующих условий:
- Вы можете использовать один набор данных для решения всех задач, или решать каждую задачу на своем наборе данных.
- Набор данных должен отличаться от набора данных, который использовался в лекции для решения рассматриваемой задачи.
- Вы можете выбрать произвольный набор данных (например тот, который Вы использовали в лабораторных работах) или создать собственный набор данных (что актуально для некоторых задач, например, для задач удаления псевдоконстантных или повторяющихся признаков).
- Выбранный или созданный Вами набор данных должен удовлетворять условиям поставленной задачи. Например, если решается задача устранения пропусков, то набор данных должен содержать пропуски.
Для набора данных проведите кодирование одного (произвольного) категориального признака с использованием метода "count (frequency) encoding".
Для набора данных проведите кодирование одного (произвольного) категориального признака с использованием метода "target (mean) encoding".
Для набора данных проведите кодирование одного (произвольного) категориального признака с использованием метода "weight of evidence (WoE) encoding".
Для набора данных проведите кодирование одного (произвольного) категориального признака с использованием метода "label encoding".
Для набора данных проведите кодирование одного (произвольного) категориального признака с использованием метода "one-hot encoding".
Для набора данных проведите устранение пропусков для одного (произвольного) числового признака с использованием метода заполнения средним значением.
Для набора данных проведите устранение пропусков для одного (произвольного) числового признака с использованием метода заполнения медианой.
Для набора данных проведите устранение пропусков для одного (произвольного) числового признака с использованием метода заполнения модой.
Для набора данных проведите устранение пропусков для одного (произвольного) числового признака с использованием метода заполнения "хвостом распределения".
Для набора данных проведите устранение пропусков для одного (произвольного) категориального признака с использованием метода заполнения наиболее распространенным значением.
Для набора данных проведите устранение пропусков для одного (произвольного) категориального признака с использованием метода заполнения отдельной категорией для пропущенных значений.
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием функции "логарифм - np.log(X)".
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием функции "обратная зависимость - 1 / X".
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием функции "квадратный корень".
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием функции "возведение в степень".
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием преобразования Бокса-Кокса (Box-Cox transformation).
Для набора данных проведите нормализацию для одного (произвольного) числового признака с использованием преобразования Йео-Джонсона (Yeo-Johnson transformation).
Для набора данных проведите масштабирование данных для одного (произвольного) числового признака на основе Z-оценки.
Для набора данных проведите масштабирование данных для одного (произвольного) числового признака с использованием метода "Mean Normalisation".
Для набора данных проведите масштабирование данных для одного (произвольного) числового признака с использованием MinMax-масштабирования.
Для набора данных проведите масштабирование данных для одного (произвольного) числового признака с использованием масштабирования по медиане.
Для набора данных проведите масштабирование данных для одного (произвольного) числового признака с использованием масштабирования по максимальному значению.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и удаление выбросов на основе правила трех сигм.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и удаление выбросов на основе 5% и 95% квантилей.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и удаление выбросов на основе межквартильного размаха.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и замену (найденными верхними и нижними границами) выбросов на основе правила трех сигм.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и замену (найденными верхними и нижними границами) выбросов на основе 5% и 95% квантилей.
Для набора данных для одного (произвольного) числового признака проведите обнаружение и замену (найденными верхними и нижними границами) выбросов на основе межквартильного размаха.
Для набора данных проведите удаление константных и псевдоконстантных признаков.
Для набора данных проведите удаление повторяющихся признаков.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод обертывания (wrapper method), прямой алгоритм (sequential forward selection).
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод обертывания (wrapper method), обратный алгоритм (sequential backward selection).
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод обертывания (wrapper method), алгоритм полного перебора (exhaustive feature selection).
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод вложений (embedded method). Используйте подход на основе линейной или логистической регрессии (в зависимости от того, на решение какой задачи ориентирован выбранный Вами набор данных - задачи регрессии или задачи классификации).
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод вложений (embedded method). Используйте подход на основе дерева решений.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте класс SelectKBest для 5 лучших признаков, и метод, основанный на взаимной информации.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте класс SelectPercentile для 5% лучших признаков, и метод, основанный на взаимной информации.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте класс SelectKBest для 10 лучших признаков, и метод, основанный на взаимной информации.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте класс SelectPercentile для 10% лучших признаков, и метод, основанный на взаимной информации.
Для набора данных проведите процедуру отбора признаков (feature selection). Используйте метод на основе корреляции признаков.