-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathtugas.py
84 lines (68 loc) · 2.45 KB
/
tugas.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
data = pd.read_csv("tips.csv")
print(data.head())
# Membaca dataset
restaurant_data = pd.read_csv("tips.csv")
# 1. Cek tipe variabel
print("1. Tipe variabel:")
print(restaurant_data.dtypes)
print()
# 2. Distribusi normal
print("2. Distribusi normal:")
print(restaurant_data.describe())
print()
# 3. Cek outlier, noise, missing values, dan duplikasi data
print("3. Penanganan data:")
print("Jumlah missing values:")
print(restaurant_data.isnull().sum())
print()
print("Jumlah duplikasi data:")
print(restaurant_data.duplicated().sum())
print()
# 4. Proporsi pelanggan pria dan wanita
print("4. Proporsi pelanggan pria dan wanita:")
sex_counts = restaurant_data["sex"].value_counts()
print(sex_counts)
print()
# 5. Kecenderungan tips lebih besar untuk pria atau wanita
print("5. Kecenderungan tips lebih besar untuk pria atau wanita:")
tips_by_sex = restaurant_data.groupby("sex")["tip"].mean()
print(tips_by_sex)
print()
# 6. Kecenderungan tips lebih besar di hari-hari tertentu
print("6. Kecenderungan tips lebih besar di hari-hari tertentu:")
tips_by_day = restaurant_data.groupby("day")["tip"].mean()
print(tips_by_day)
print()
# 7. Kecenderungan tips lebih besar dari pelanggan perokok atau bukan
print("7. Kecenderungan tips lebih besar dari pelanggan perokok atau bukan:")
tips_by_smoker = restaurant_data.groupby("smoker")["tip"].mean()
print(tips_by_smoker)
print()
# 8. Pengaruh hari pada kecenderungan tips
print("8. Pengaruh hari pada kecenderungan tips:")
tips_by_sex_day = restaurant_data.groupby(["sex", "day"])["tip"].mean()
print(tips_by_sex_day)
print()
tips_by_smoker_day = restaurant_data.groupby(["smoker", "day"])["tip"].mean()
print(tips_by_smoker_day)
print()
# 9. Pola lain yang dapat ditemukan
print("9. Pola lain yang dapat ditemukan:")
size_vs_total_bill = restaurant_data.groupby("size")["total_bill", "tip"].mean()
print(size_vs_total_bill)
print()
# 10. Saran untuk pemilik restoran
print("10. Saran untuk pemilik restoran:")
print(
"Berdasarkan analisis, saran dapat berupa menyesuaikan harga makanan atau menawarkan promosi pada hari-hari tertentu serta menyesuaikan staf pelayanan berdasarkan kecenderungan pelanggan."
)
print()
# 11. Skills/kompetensi yang diperlukan
print("11. Skills/kompetensi yang diperlukan:")
print(
"Pemahaman statistik deskriptif, penggunaan alat visualisasi data, dan kemampuan interpretasi untuk membuat rekomendasi bisnis."
)