Skip to content

Latest commit

 

History

History
51 lines (34 loc) · 4.56 KB

09.md

File metadata and controls

51 lines (34 loc) · 4.56 KB

Материалы BigData 2017

Проект №9

(задание на дом: Перепись населения, криминогенность и SQL)

Реализовать задание из предыдущей работы на SQL (запросы)

Задания по обработке данных. SQL Поскольку установка Hive выходит за рамки курса, предлагается реализовать запросы на SQL в одной из распространенных СУБД (MySQL, Oracle и т.д.) Необходимо на основе данных из предыдущей работы (№8) реализовать таблицы БД и написать запросы, позволяющие получить следующие данные.

  1. Используя данные о переписи и предварительной переписи получить:
  • Расхождения в значениях между предварительной и финальной переписью
  • Посчитать по каждому региону процентное соотношение женщин и мужчин и городского и сельского населения, составить топы 3 по регионам с преобладанием тех или иных критериев(мужчин, женщин, городского, сельского населения)
  1. Получить аналогичные данные по Пермскому краю и его субъектам, используя соответствующие данные. Сравнить данные полученые на этом этапе с данными из переписи(Пермский край). Сравнить пермский край со средними значениями по Российской федерации.
  2. Посчитать по Пермскому краю естественный прирост населения за каждый год.
  • Дополнительно сравнить прирост среди мужчин и женщин.
  • Можно выполнить расчет по районам, в случае затруднений по Перми и по области.
  1. (альтернативное) Используя данные по криминогенности регионов посчитать среднюю криминогенность за период и вывести топ 5 криминогенных районов

UPD: Решение UPD: Скрипт создания БД


Трекинг и описание

2017-11-16

Добавлено решение Перепись населения, криминогенность и SQL

Задание:

В качестве инструмента использовалась СУБД MySQL Community Edition (GPL) и инструменты:

Для установки на Linux Mint использовалась инструкция с офф.сайта MySQL APT Repository

Затем в MySQL Workbench в визуальном редакторе была создана структура БД:

Структура БД

После этого плученная модель была экспортирована в СУБД, сформирован создающий скрипт, в который были добавлены строки внесения данных в БД. INSERT-команды сформированы в LibreOffice Calc на основе имеющихся данных путем групповой конкатенации командой CONCAT(x;y;...;w) - см. файл

Затем настала очередь написания запросов:

Запросы в Workbench

UPD: Решение UPD: Скрипт создания БД