Skip to content

Latest commit

 

History

History
33 lines (23 loc) · 2.46 KB

08.md

File metadata and controls

33 lines (23 loc) · 2.46 KB

Материалы BigData 2017

Проект №8

(задание на дом: Перепись населения, криминогенность и Apache Spark)

Задание:

Задания по обрботке данных. Spark

  1. Используя данные о переписи и предварительной переписи получить:
  • Расхождения в значениях между предварительной и финальной переписью
  • Посчитать по каждому региону процентное соотношение женщин и мужчин и городского и сельского населения, составить топы 3 по регионам с преобладанием тех или иных критериев(мужчин, женщин, городского, сельского населения)
  1. Получить аналогичные данные по Пермскому краю и его субъектам, используя соответствующие данные. Сравнить данные полученые на этом этапе с данными из переписи(Пермский край). Сравнить пермский край со средними значениями по Российской федерации.
  2. Посчитать по Пермскому краю естественный прирост населения за каждый год.
  • Дополнительно сравнить прирост среди мужчин и женщин.
  • Можно выполнить расчет по районам, в случае затруднений по Перми и по области.
  1. (альтернативное) Используя данные по криминогенности регионов посчитать среднюю криминогенность за период и вывести топ 5 криминогенных районов

UPD: Решение UPD: Выходные файлы


Трекинг и описание

2017-11-12

Добавлено решение Перепись населения, криминогенность и Apache Spark

Задание:

UPD: Решение UPD: Выходные файлы