Задания по обрботке данных. Spark
- Используя данные о переписи и предварительной переписи получить:
- Расхождения в значениях между предварительной и финальной переписью
- Посчитать по каждому региону процентное соотношение женщин и мужчин и городского и сельского населения, составить топы 3 по регионам с преобладанием тех или иных критериев(мужчин, женщин, городского, сельского населения)
- Получить аналогичные данные по Пермскому краю и его субъектам, используя соответствующие данные. Сравнить данные полученые на этом этапе с данными из переписи(Пермский край). Сравнить пермский край со средними значениями по Российской федерации.
- Посчитать по Пермскому краю естественный прирост населения за каждый год.
- Дополнительно сравнить прирост среди мужчин и женщин.
- Можно выполнить расчет по районам, в случае затруднений по Перми и по области.
- (альтернативное) Используя данные по криминогенности регионов посчитать среднюю криминогенность за период и вывести топ 5 криминогенных районов
UPD: Решение UPD: Выходные файлы
UPD: Решение UPD: Выходные файлы