-
Notifications
You must be signed in to change notification settings - Fork 17
TMO_RK_2
ugapanyuk edited this page Apr 25, 2022
·
3 revisions
Необходимо подготовить отчет по рубежному контролю и разместить его в Вашем репозитории. Вы можете использовать титульный лист, или в начале ноутбука в текстовой ячейке указать Ваши Ф.И.О. и группу.
Задание. Для заданного набора данных (по Вашему варианту) постройте модели классификации или регрессии (в зависимости от конкретной задачи, рассматриваемой в наборе данных). Для построения моделей используйте методы 1 и 2 (по варианту для Вашей группы). Оцените качество моделей на основе подходящих метрик качества (не менее двух метрик). Какие метрики качества Вы использовали и почему? Какие выводы Вы можете сделать о качестве построенных моделей? Для построения моделей необходимо выполнить требуемую предобработку данных: заполнение пропусков, кодирование категориальных признаков, и т.д.
- Для студентов групп ИУ5-61Б, ИУ5-62Б, ИУ5-63Б, ИУ5-64Б, ИУ5-65Б, РТ5-61Б номер варианта = номер в списке группы.
- Для студентов групп ИУ5Ц-81Б, ИУ5Ц-82Б, ИУ5Ц-83Б, ИУ5Ц-84Б номер варианта = 25 + номер в списке группы.
- Для студентов группы ИУ5И-61Б номер варианта = 30 + номер в списке группы.
- При решении задач можно выбирать любое подмножество признаков из приведенного набора данных.
- Для сокращения времени построения моделей можно использовать фрагмент набора данных (например, первые 200-500 строк).
- Методы 1 и 2 для каждой группы приведены в следующей таблице:
Группа | Метод №1 | Метод №2 |
---|---|---|
ИУ5-61Б, ИУ5Ц-81Б, ИУ5И-61Б | Линейная/логистическая регрессия | Случайный лес |
ИУ5-62Б, ИУ5Ц-82Б | Метод опорных векторов | Случайный лес |
ИУ5-63Б, ИУ5Ц-83Б | Дерево решений | Случайный лес |
ИУ5-64Б, ИУ5Ц-84Б | Линейная/логистическая регрессия | Градиентный бустинг |
ИУ5-65Б | Метод опорных векторов | Градиентный бустинг |
РТ5-61Б | Дерево решений | Градиентный бустинг |
- Варианты наборов данных приведены в следующем списке:
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html#sklearn.datasets.load_boston
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html#sklearn.datasets.load_iris
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_wine.html#sklearn.datasets.load_wine
- https://www.kaggle.com/carlolepelaars/toy-dataset
- https://www.kaggle.com/datasets/johnsmith88/heart-disease-dataset
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict.csv)
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict_Ver1.1.csv)
- https://www.kaggle.com/lava18/google-play-store-apps
- https://www.kaggle.com/rubenssjr/brasilian-houses-to-rent
- https://www.kaggle.com/jessemostipak/hotel-booking-demand
- https://www.kaggle.com/karangadiya/fifa19
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл dc-wikia-data.csv)
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл marvel-wikia-data.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all_extended.csv)
- https://www.kaggle.com/san-francisco/sf-restaurant-scores-lives-standard
- https://www.kaggle.com/mathan/fifa-2018-match-statistics
- https://www.kaggle.com/rhuebner/human-resources-data-set
- https://www.kaggle.com/arindam235/startup-investments-crunchbase
- https://www.kaggle.com/fmejia21/trump-impeachment-polls
- https://www.kaggle.com/oreojam/formula-e-world-championship-race-results
- https://www.kaggle.com/atmcfarland/historical-us-president-physical-data-more
- https://www.kaggle.com/ajaypalsinghlo/world-happiness-report-2021
- https://www.kaggle.com/datasets/kamilpytlak/personal-key-indicators-of-heart-disease
- https://www.kaggle.com/prachi13/customer-analytics
- https://www.kaggle.com/brsdincer/star-type-classification
- https://www.kaggle.com/fedesoriano/company-bankruptcy-prediction
- https://www.kaggle.com/roysouravcu/forbes-billionaires-of-2021
- https://www.kaggle.com/dhruvildave/currency-exchange-rates
- https://www.kaggle.com/paytonfisher/sp-500-companies-with-financial-information
- https://www.kaggle.com/kmldas/loan-default-prediction
- https://www.kaggle.com/rashikrahmanpritom/disney-movies-19372016-total-gross