-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathtimeanalysis.py
124 lines (92 loc) · 4.11 KB
/
timeanalysis.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
import timecalc as z
#تعداد خرید بلیت بر حسب روز میلادی
def DAYOFWEEKbyusercount(data):
data=z.dayofweek(data)
G1 = data.groupby(['day_of_the_week']).count().sort_values(['id'],ascending=False)['id']
return G1
#تعداد خرید بلیت بر حسب روز شمسی
def DAYOFWEEKpersianbyusercount(data):
data=z.rooz(data)
G1 = data.groupby(['rooz']).count().sort_values(['id'],ascending=False)['id']
return G1
#تعداد خرید بلیت بر حسب ماه میلادی
def MONTHbyusercount(data):
data=z.month(data)
G1 = data.groupby(['month']).count().sort_values(['id'],ascending=False)['id']
return G1
#تعداد خرید بلیت بر حسب ماه شمسی
def MONTHpersianbyusercount(data):
data=z.mah(data)
G1 = data.groupby(['mah']).count().sort_values(['id'],ascending=False)['id']
return G1
#تعداد خرید بلیت بر حسب ساعت خرید
def TIMEbyusercount(data):
data=z.time(data)
G1 = data.groupby(['time_intervals']).count().sort_values(['id'],ascending=False)['id']
return G1
#میانگین قیمت خرید بلیت بر حسب روز میلادی
def DAYOFWEEKbypriceaverage(data):
data=z.dayofweek(data)
G1 = data.groupby(['day_of_the_week']).mean().sort_values(['price'],ascending=False)['price']
return G1
#میانگین قیمت خرید بلیت بر حسب روز شمسی
def DAYOFWEEKpersianbypriceaverage(data):
data=z.rooz(data)
G1 = data.groupby(['rooz']).mean().sort_values(['price'],ascending=False)['price']
return G1
#مجموع قیمت خرید بلیت بر حسب روز شمسی
def DAYOFWEEKpersianbypricesum(data):
data=z.rooz(data)
G1 = data.groupby(['rooz']).sum().sort_values(['price'],ascending=False)['price']
return G1
#میانگین قیمت خرید بلیت بر حسب ماه میلادی
def MONTHbypriceaverage(data):
data=z.month(data)
G1 = data.groupby(['month']).mean().sort_values(['price'],ascending=False)['price']
return G1
#میانگین قیمت خرید بلیت بر حسب ماه شمسی
def MONTHpersianbypriceaverage(data):
data=z.mah(data)
G1 = data.groupby(['mah']).mean().sort_values(['price'],ascending=False)['price']
return G1
#مجموع قیمت خرید بلیت بر حسب ماه شمسی
def MONTHpersianbypricesum(data):
data=z.mah(data)
G1 = data.groupby(['mah']).sum().sort_values(['price'],ascending=False)['price']
return G1
#میانگین قیمت خرید بلیت بر حسب ساعت خرید
def TIMEbypriceaverage(data):
data=z.time(data)
G1 = data.groupby(['time_intervals']).mean().sort_values(['price'],ascending=False)['price']
return G1
#مجموع قیمت خرید بلیت بر حسب ساعت خرید
def TIMEbypricesum(data):
data=z.time(data)
G1 = data.groupby(['time_intervals']).sum().sort_values(['price'],ascending=False)['price']
return G1
#فاصله زمان خرید بلیت و زمان پرواز در ماه های میلادی
def timedeltawithmonth(data):
data=z.timedelta(data)
data=z.month(data)
f = data.isnull().groupby(data['month']).sum()
f1=list(f['timedelta'])
f2=list(data.groupby(['month']).count()['timedelta'])
f3=list(data.groupby(['month']).sum()['timedelta'])
length = [i - j for i, j in zip(f2, f1)]
mean = [i / j for i, j in zip(f3, length)]
f['mean'] = mean
g = f.sort_values(['mean'],ascending=False)['mean']
return g
#فاصله زمان خرید بلیت و زمان پرواز در ماه های شمسی
def timedeltawithmonthpersian(data):
data=z.timedelta(data)
data=z.mah(data)
f = data.isnull().groupby(data['mah']).sum()
f1=list(f['timedelta'])
f2=list(data.groupby(['mah']).count()['timedelta'])
f3=list(data.groupby(['mah']).sum()['timedelta'])
length = [i - j for i, j in zip(f2, f1)]
mean = [i / j for i, j in zip(f3, length)]
f['mean'] = mean
g = f.sort_values(['mean'],ascending=False)['mean']
return g