In [1]:
%pylab inline
import pandas as pd


Populating the interactive namespace from numpy and matplotlib

In [2]:
specs = pd.read_csv('./competition_data/specs.csv')

In [4]:
print specs.shape
print specs.dtypes
print specs.sample(10, random_state=0)


(21198, 11)
tube_assembly_id    object
spec1               object
spec2               object
spec3               object
spec4               object
spec5               object
spec6               object
spec7               object
spec8               object
spec9               object
spec10              object
dtype: object
      tube_assembly_id    spec1    spec2    spec3    spec4 spec5 spec6 spec7  \
9258          TA-09259      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
6255          TA-06256  SP-0007  SP-0058  SP-0070  SP-0080   NaN   NaN   NaN   
5653          TA-05654      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
449           TA-00450  SP-0058  SP-0070      NaN      NaN   NaN   NaN   NaN   
14694         TA-14695      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
19962         TA-19964  SP-0012  SP-0026  SP-0063  SP-0080   NaN   NaN   NaN   
12335         TA-12336      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
15664         TA-15665      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
14435         TA-14436      NaN      NaN      NaN      NaN   NaN   NaN   NaN   
15108         TA-15109      NaN      NaN      NaN      NaN   NaN   NaN   NaN   

      spec8 spec9 spec10  
9258    NaN   NaN    NaN  
6255    NaN   NaN    NaN  
5653    NaN   NaN    NaN  
449     NaN   NaN    NaN  
14694   NaN   NaN    NaN  
19962   NaN   NaN    NaN  
12335   NaN   NaN    NaN  
15664   NaN   NaN    NaN  
14435   NaN   NaN    NaN  
15108   NaN   NaN    NaN