Реализовать задание из предыдущей работы на SQL (запросы)
Задания по обработке данных. SQL Поскольку установка Hive выходит за рамки курса, предлагается реализовать запросы на SQL в одной из распространенных СУБД (MySQL, Oracle и т.д.) Необходимо на основе данных из предыдущей работы (№8) реализовать таблицы БД и написать запросы, позволяющие получить следующие данные.
- Используя данные о переписи и предварительной переписи получить:
- Расхождения в значениях между предварительной и финальной переписью
- Посчитать по каждому региону процентное соотношение женщин и мужчин и городского и сельского населения, составить топы 3 по регионам с преобладанием тех или иных критериев(мужчин, женщин, городского, сельского населения)
- Получить аналогичные данные по Пермскому краю и его субъектам, используя соответствующие данные. Сравнить данные полученые на этом этапе с данными из переписи(Пермский край). Сравнить пермский край со средними значениями по Российской федерации.
- Посчитать по Пермскому краю естественный прирост населения за каждый год.
- Дополнительно сравнить прирост среди мужчин и женщин.
- Можно выполнить расчет по районам, в случае затруднений по Перми и по области.
- (альтернативное) Используя данные по криминогенности регионов посчитать среднюю криминогенность за период и вывести топ 5 криминогенных районов
UPD: Решение UPD: Скрипт создания БД
В качестве инструмента использовалась СУБД MySQL Community Edition (GPL) и инструменты:
- MySQL Community Server 5.7.20 - в качестве сервера;
- MySQL Workbench 6.3.10 - в качестве клиента и визуального редактора БД.
Для установки на Linux Mint использовалась инструкция с офф.сайта MySQL APT Repository
Затем в MySQL Workbench в визуальном редакторе была создана структура БД:
После этого плученная модель была экспортирована в СУБД, сформирован создающий скрипт, в который были добавлены строки внесения данных в БД. INSERT-команды сформированы в LibreOffice Calc на основе имеющихся данных путем групповой конкатенации командой CONCAT(x;y;...;w) - см. файл
Затем настала очередь написания запросов:
UPD: Решение UPD: Скрипт создания БД