In [1]:
%pylab inline
import pandas as pd
Populating the interactive namespace from numpy and matplotlib
In [2]:
specs = pd.read_csv('./competition_data/specs.csv')
In [4]:
print specs.shape
print specs.dtypes
print specs.sample(10, random_state=0)
(21198, 11)
tube_assembly_id object
spec1 object
spec2 object
spec3 object
spec4 object
spec5 object
spec6 object
spec7 object
spec8 object
spec9 object
spec10 object
dtype: object
tube_assembly_id spec1 spec2 spec3 spec4 spec5 spec6 spec7 \
9258 TA-09259 NaN NaN NaN NaN NaN NaN NaN
6255 TA-06256 SP-0007 SP-0058 SP-0070 SP-0080 NaN NaN NaN
5653 TA-05654 NaN NaN NaN NaN NaN NaN NaN
449 TA-00450 SP-0058 SP-0070 NaN NaN NaN NaN NaN
14694 TA-14695 NaN NaN NaN NaN NaN NaN NaN
19962 TA-19964 SP-0012 SP-0026 SP-0063 SP-0080 NaN NaN NaN
12335 TA-12336 NaN NaN NaN NaN NaN NaN NaN
15664 TA-15665 NaN NaN NaN NaN NaN NaN NaN
14435 TA-14436 NaN NaN NaN NaN NaN NaN NaN
15108 TA-15109 NaN NaN NaN NaN NaN NaN NaN
spec8 spec9 spec10
9258 NaN NaN NaN
6255 NaN NaN NaN
5653 NaN NaN NaN
449 NaN NaN NaN
14694 NaN NaN NaN
19962 NaN NaN NaN
12335 NaN NaN NaN
15664 NaN NaN NaN
14435 NaN NaN NaN
15108 NaN NaN NaN
Content source: timmyshen/Cat_Tube
Similar notebooks: