In [1]:
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
In [1]:
!head data/iris.scale
1 1:-0.555556 2:0.25 3:-0.864407 4:-0.916667
1 1:-0.666667 2:-0.166667 3:-0.864407 4:-0.916667
1 1:-0.777778 3:-0.898305 4:-0.916667
1 1:-0.833333 2:-0.0833334 3:-0.830508 4:-0.916667
1 1:-0.611111 2:0.333333 3:-0.864407 4:-0.916667
1 1:-0.388889 2:0.583333 3:-0.762712 4:-0.75
1 1:-0.833333 2:0.166667 3:-0.864407 4:-0.833333
1 1:-0.611111 2:0.166667 3:-0.830508 4:-0.916667
1 1:-0.944444 2:-0.25 3:-0.864407 4:-0.916667
1 1:-0.666667 2:-0.0833334 3:-0.830508 4:-1
In [3]:
raw_data = pd.read_csv("data/iris.scale", header=None)
In [4]:
raw_data = raw_data[0].apply(lambda x : x.split(' '))
In [5]:
label = raw_data.apply(lambda x:x[0])
In [6]:
label
Out[6]:
0 1
1 1
2 1
3 1
4 1
5 1
6 1
7 1
8 1
9 1
10 1
11 1
12 1
13 1
14 1
15 1
16 1
17 1
18 1
19 1
20 1
21 1
22 1
23 1
24 1
25 1
26 1
27 1
28 1
29 1
..
120 3
121 3
122 3
123 3
124 3
125 3
126 3
127 3
128 3
129 3
130 3
131 3
132 3
133 3
134 3
135 3
136 3
137 3
138 3
139 3
140 3
141 3
142 3
143 3
144 3
145 3
146 3
147 3
148 3
149 3
Name: 0, dtype: object
In [20]:
def data_format(s):
dataSet = [0]*5
for i in s:
ret = i.split(":")
if len(ret) == 2:
dataSet[int(ret[0])] = float(ret[1])
return pd.Series(dataSet[1:])
raw_data2 = raw_data.apply(data_format)
raw_data2.columns = ['A', 'B', 'C', 'D']
In [24]:
raw_data2['label'] = label
raw_data2
Out[24]:
A
B
C
D
label
0
-5.555560e-01
0.250000
-0.864407
-0.916667
1
1
-6.666670e-01
-0.166667
-0.864407
-0.916667
1
2
-7.777780e-01
0.000000
-0.898305
-0.916667
1
3
-8.333330e-01
-0.083333
-0.830508
-0.916667
1
4
-6.111110e-01
0.333333
-0.864407
-0.916667
1
5
-3.888890e-01
0.583333
-0.762712
-0.750000
1
6
-8.333330e-01
0.166667
-0.864407
-0.833333
1
7
-6.111110e-01
0.166667
-0.830508
-0.916667
1
8
-9.444440e-01
-0.250000
-0.864407
-0.916667
1
9
-6.666670e-01
-0.083333
-0.830508
-1.000000
1
10
-3.888890e-01
0.416667
-0.830508
-0.916667
1
11
-7.222220e-01
0.166667
-0.796610
-0.916667
1
12
-7.222220e-01
-0.166667
-0.864407
-1.000000
1
13
-1.000000e+00
-0.166667
-0.966102
-1.000000
1
14
-1.666670e-01
0.666667
-0.932203
-0.916667
1
15
-2.222220e-01
1.000000
-0.830508
-0.750000
1
16
-3.888890e-01
0.583333
-0.898305
-0.750000
1
17
-5.555560e-01
0.250000
-0.864407
-0.833333
1
18
-2.222220e-01
0.500000
-0.762712
-0.833333
1
19
-5.555560e-01
0.500000
-0.830508
-0.833333
1
20
-3.888890e-01
0.166667
-0.762712
-0.916667
1
21
-5.555560e-01
0.416667
-0.830508
-0.750000
1
22
-8.333330e-01
0.333333
-1.000000
-0.916667
1
23
-5.555560e-01
0.083333
-0.762712
-0.666667
1
24
-7.222220e-01
0.166667
-0.694915
-0.916667
1
25
-6.111110e-01
-0.166667
-0.796610
-0.916667
1
26
-6.111110e-01
0.166667
-0.796610
-0.750000
1
27
-5.000000e-01
0.250000
-0.830508
-0.916667
1
28
-5.000000e-01
0.166667
-0.864407
-0.916667
1
29
-7.777780e-01
0.000000
-0.796610
-0.916667
1
...
...
...
...
...
...
120
4.444440e-01
0.000000
0.593220
0.833333
3
121
-2.777780e-01
-0.333333
0.322034
0.583333
3
122
8.888890e-01
-0.333333
0.932203
0.583333
3
123
1.111110e-01
-0.416667
0.322034
0.416667
3
124
3.333330e-01
0.083333
0.593220
0.666667
3
125
6.111110e-01
0.000000
0.694915
0.416667
3
126
5.555540e-02
-0.333333
0.288136
0.416667
3
127
-1.324550e-07
-0.166667
0.322034
0.416667
3
128
1.666670e-01
-0.333333
0.559322
0.666667
3
129
6.111110e-01
-0.166667
0.627119
0.250000
3
130
7.222220e-01
-0.333333
0.728813
0.500000
3
131
1.000000e+00
0.500000
0.830508
0.583333
3
132
1.666670e-01
-0.333333
0.559322
0.750000
3
133
1.111110e-01
-0.333333
0.389830
0.166667
3
134
-1.324550e-07
-0.500000
0.559322
0.083333
3
135
8.888890e-01
-0.166667
0.728813
0.833333
3
136
1.111110e-01
0.166667
0.559322
0.916667
3
137
1.666670e-01
-0.083333
0.525424
0.416667
3
138
-5.555560e-02
-0.166667
0.288136
0.416667
3
139
4.444440e-01
-0.083333
0.491525
0.666667
3
140
3.333330e-01
-0.083333
0.559322
0.916667
3
141
4.444440e-01
-0.083333
0.389830
0.833333
3
142
-1.666670e-01
-0.416667
0.389830
0.500000
3
143
3.888890e-01
0.000000
0.661017
0.833333
3
144
3.333330e-01
0.083333
0.593220
1.000000
3
145
3.333330e-01
-0.166667
0.423729
0.833333
3
146
1.111110e-01
-0.583333
0.355932
0.500000
3
147
2.222220e-01
-0.166667
0.423729
0.583333
3
148
5.555540e-02
0.166667
0.491525
0.833333
3
149
-1.111110e-01
-0.166667
0.389830
0.416667
3
150 rows × 5 columns
In [ ]:
Content source: iYefeng/traits
Similar notebooks: