In [1]:
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [1]:
!head data/iris.scale


1 1:-0.555556 2:0.25 3:-0.864407 4:-0.916667 
1 1:-0.666667 2:-0.166667 3:-0.864407 4:-0.916667 
1 1:-0.777778 3:-0.898305 4:-0.916667 
1 1:-0.833333 2:-0.0833334 3:-0.830508 4:-0.916667 
1 1:-0.611111 2:0.333333 3:-0.864407 4:-0.916667 
1 1:-0.388889 2:0.583333 3:-0.762712 4:-0.75 
1 1:-0.833333 2:0.166667 3:-0.864407 4:-0.833333 
1 1:-0.611111 2:0.166667 3:-0.830508 4:-0.916667 
1 1:-0.944444 2:-0.25 3:-0.864407 4:-0.916667 
1 1:-0.666667 2:-0.0833334 3:-0.830508 4:-1 

In [3]:
raw_data = pd.read_csv("data/iris.scale", header=None)

In [4]:
raw_data = raw_data[0].apply(lambda x : x.split(' '))

In [5]:
label = raw_data.apply(lambda x:x[0])

In [6]:
label


Out[6]:
0      1
1      1
2      1
3      1
4      1
5      1
6      1
7      1
8      1
9      1
10     1
11     1
12     1
13     1
14     1
15     1
16     1
17     1
18     1
19     1
20     1
21     1
22     1
23     1
24     1
25     1
26     1
27     1
28     1
29     1
      ..
120    3
121    3
122    3
123    3
124    3
125    3
126    3
127    3
128    3
129    3
130    3
131    3
132    3
133    3
134    3
135    3
136    3
137    3
138    3
139    3
140    3
141    3
142    3
143    3
144    3
145    3
146    3
147    3
148    3
149    3
Name: 0, dtype: object

In [20]:
def data_format(s):
    dataSet = [0]*5
    for i in s:
        ret = i.split(":")
        if len(ret) == 2:
            dataSet[int(ret[0])] = float(ret[1])
    return pd.Series(dataSet[1:])

raw_data2 = raw_data.apply(data_format)
raw_data2.columns = ['A', 'B', 'C', 'D']

In [24]:
raw_data2['label'] = label

raw_data2


Out[24]:
A B C D label
0 -5.555560e-01 0.250000 -0.864407 -0.916667 1
1 -6.666670e-01 -0.166667 -0.864407 -0.916667 1
2 -7.777780e-01 0.000000 -0.898305 -0.916667 1
3 -8.333330e-01 -0.083333 -0.830508 -0.916667 1
4 -6.111110e-01 0.333333 -0.864407 -0.916667 1
5 -3.888890e-01 0.583333 -0.762712 -0.750000 1
6 -8.333330e-01 0.166667 -0.864407 -0.833333 1
7 -6.111110e-01 0.166667 -0.830508 -0.916667 1
8 -9.444440e-01 -0.250000 -0.864407 -0.916667 1
9 -6.666670e-01 -0.083333 -0.830508 -1.000000 1
10 -3.888890e-01 0.416667 -0.830508 -0.916667 1
11 -7.222220e-01 0.166667 -0.796610 -0.916667 1
12 -7.222220e-01 -0.166667 -0.864407 -1.000000 1
13 -1.000000e+00 -0.166667 -0.966102 -1.000000 1
14 -1.666670e-01 0.666667 -0.932203 -0.916667 1
15 -2.222220e-01 1.000000 -0.830508 -0.750000 1
16 -3.888890e-01 0.583333 -0.898305 -0.750000 1
17 -5.555560e-01 0.250000 -0.864407 -0.833333 1
18 -2.222220e-01 0.500000 -0.762712 -0.833333 1
19 -5.555560e-01 0.500000 -0.830508 -0.833333 1
20 -3.888890e-01 0.166667 -0.762712 -0.916667 1
21 -5.555560e-01 0.416667 -0.830508 -0.750000 1
22 -8.333330e-01 0.333333 -1.000000 -0.916667 1
23 -5.555560e-01 0.083333 -0.762712 -0.666667 1
24 -7.222220e-01 0.166667 -0.694915 -0.916667 1
25 -6.111110e-01 -0.166667 -0.796610 -0.916667 1
26 -6.111110e-01 0.166667 -0.796610 -0.750000 1
27 -5.000000e-01 0.250000 -0.830508 -0.916667 1
28 -5.000000e-01 0.166667 -0.864407 -0.916667 1
29 -7.777780e-01 0.000000 -0.796610 -0.916667 1
... ... ... ... ... ...
120 4.444440e-01 0.000000 0.593220 0.833333 3
121 -2.777780e-01 -0.333333 0.322034 0.583333 3
122 8.888890e-01 -0.333333 0.932203 0.583333 3
123 1.111110e-01 -0.416667 0.322034 0.416667 3
124 3.333330e-01 0.083333 0.593220 0.666667 3
125 6.111110e-01 0.000000 0.694915 0.416667 3
126 5.555540e-02 -0.333333 0.288136 0.416667 3
127 -1.324550e-07 -0.166667 0.322034 0.416667 3
128 1.666670e-01 -0.333333 0.559322 0.666667 3
129 6.111110e-01 -0.166667 0.627119 0.250000 3
130 7.222220e-01 -0.333333 0.728813 0.500000 3
131 1.000000e+00 0.500000 0.830508 0.583333 3
132 1.666670e-01 -0.333333 0.559322 0.750000 3
133 1.111110e-01 -0.333333 0.389830 0.166667 3
134 -1.324550e-07 -0.500000 0.559322 0.083333 3
135 8.888890e-01 -0.166667 0.728813 0.833333 3
136 1.111110e-01 0.166667 0.559322 0.916667 3
137 1.666670e-01 -0.083333 0.525424 0.416667 3
138 -5.555560e-02 -0.166667 0.288136 0.416667 3
139 4.444440e-01 -0.083333 0.491525 0.666667 3
140 3.333330e-01 -0.083333 0.559322 0.916667 3
141 4.444440e-01 -0.083333 0.389830 0.833333 3
142 -1.666670e-01 -0.416667 0.389830 0.500000 3
143 3.888890e-01 0.000000 0.661017 0.833333 3
144 3.333330e-01 0.083333 0.593220 1.000000 3
145 3.333330e-01 -0.166667 0.423729 0.833333 3
146 1.111110e-01 -0.583333 0.355932 0.500000 3
147 2.222220e-01 -0.166667 0.423729 0.583333 3
148 5.555540e-02 0.166667 0.491525 0.833333 3
149 -1.111110e-01 -0.166667 0.389830 0.416667 3

150 rows × 5 columns


In [ ]: