notebook.community

Edit and run



In [3]:

    
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import csv

#Opening up a csv file in a python object
csv_file_object = csv.reader(open('Desktop/titanic/train.csv','rb'))
header = csv_file_object.next()
data=[]
for row in csv_file_object:
    data.append(row)
data=np.array(data)
print data









    



[['1' '0' '3' ..., '7.25' '' 'S']
 ['2' '1' '1' ..., '71.2833' 'C85' 'C']
 ['3' '1' '3' ..., '7.925' '' 'S']
 ..., 
 ['889' '0' '3' ..., '23.45' '' 'S']
 ['890' '1' '1' ..., '30' 'C148' 'C']
 ['891' '0' '3' ..., '7.75' '' 'Q']]



In [4]:

    
print data[0]
print data[-1]
print data[0,3]









    



['1' '0' '3' 'Braund, Mr. Owen Harris' 'male' '22' '1' '0' 'A/5 21171'
 '7.25' '' 'S']
['891' '0' '3' 'Dooley, Mr. Patrick' 'male' '32' '0' '0' '370376' '7.75' ''
 'Q']
Braund, Mr. Owen Harris



In [5]:

    
number_passengers = np.size(data[0::,1].astype(np.float))
number_survived = np.sum(data[0::,1].astype(np.float))
proportion_survivors = number_survived / number_passengers
print number_passengers
print number_survived
print proportion_survivors









    



891
342.0
0.383838383838



In [6]:

    
women_only_stats = data[0::,4] == "female"
men_only_stats = data[0::,4] != "female"
print women_only_stats
print men_only_stats









    



[False  True  True  True False False False False  True  True  True  True
 False False  True  True False False  True  True False False  True False
  True  True False False  True False False  True  True False False False
 False False  True  True  True  True False  True  True False False  True
 False  True False False  True  True False False  True False  True False
 False  True False False False False  True False  True False False  True
 False False False False False False False  True False False  True False
  True  True False False  True False False False False False False False
 False False  True False  True False False False False False  True False
 False  True False  True False  True  True False False False False  True
 False False False  True False False False False  True False False False
  True  True False False  True False False False  True  True  True False
 False False False  True False False False  True False False False False
  True False False False False  True False False False False  True  True
 False False False False  True False False False False  True False False
  True False False False  True False  True False False False  True False
  True False  True  True False False  True  True False False False False
 False  True False False  True False False  True False False False  True
  True False  True False False False False False False False False False
 False  True  True False False  True False  True False  True False False
  True  True False False False False  True  True False False False  True
 False False  True  True  True  True  True  True False False False False
  True False False False  True  True False False  True False  True  True
  True False False  True False False False False False False False False
 False  True  True  True False  True False False False  True False  True
  True False False  True False False  True  True False  True  True  True
  True False False  True  True False  True  True False False  True  True
 False  True False  True  True  True  True False False False  True False
 False  True False False False  True False False False  True  True  True
 False False False False False False False False  True  True  True  True
 False False  True False False False  True  True  True  True False False
 False False  True  True  True False False False  True  True False  True
 False False False  True False  True False False False  True  True False
  True False False  True False False  True False  True False False False
 False  True False False  True False False  True  True  True False  True
 False False False  True False False  True  True False False False  True
  True False False  True  True  True False False  True False False  True
 False False  True False  True False False False False False False False
 False  True  True False False False False False False False False False
 False  True False False  True  True  True False False False False  True
 False False False  True False  True  True False False False False False
 False False False False  True False  True False False  True  True  True
  True False  True False False False False False False  True False False
  True False  True False  True False False  True False False  True False
 False False  True False False  True  True  True False  True False  True
  True  True  True False False False  True False False False False False
 False False  True False  True False  True  True False False False False
  True False False  True False False False  True False  True False False
  True  True  True False  True  True False False False  True False False
 False False False  True False  True False False  True False False False
  True False False False False False False False  True  True  True False
  True False False  True False  True  True False False False False False
 False False False  True False False False False False False  True  True
 False False  True False False  True  True False  True False False False
 False  True False  True False  True  True False False  True False False
 False False False False False False False False False  True  True False
 False False False False False  True  True False  True False False False
 False False False False False  True False  True False False False False
 False  True False False  True False  True False False False  True False
  True False  True False False False False False  True  True False False
  True False False False False False  True  True False  True  True False
 False False False False  True False False False False False  True False
 False False False  True False False  True False False False  True False
 False False False  True False False False  True False  True False  True
 False False False False  True False  True False False  True False  True
  True  True False False False False  True False False False False False
  True False False False  True  True False  True False  True False False
 False False False  True False  True False False False  True False False
  True False False False  True False False  True False False False False
 False  True  True False False False False  True False False False False
 False False  True False False False False False False  True False False
  True  True  True  True  True False  True False False False  True  True
 False  True  True False False False False  True False False  True  True
 False False False  True  True False  True False False  True False  True
  True False False]
[ True False False False  True  True  True  True False False False False
  True  True False False  True  True False False  True  True False  True
 False False  True  True False  True  True False False  True  True  True
  True  True False False False False  True False False  True  True False
  True False  True  True False False  True  True False  True False  True
  True False  True  True  True  True False  True False  True  True False
  True  True  True  True  True  True  True False  True  True False  True
 False False  True  True False  True  True  True  True  True  True  True
  True  True False  True False  True  True  True  True  True False  True
  True False  True False  True False False  True  True  True  True False
  True  True  True False  True  True  True  True False  True  True  True
 False False  True  True False  True  True  True False False False  True
  True  True  True False  True  True  True False  True  True  True  True
 False  True  True  True  True False  True  True  True  True False False
  True  True  True  True False  True  True  True  True False  True  True
 False  True  True  True False  True False  True  True  True False  True
 False  True False False  True  True False False  True  True  True  True
  True False  True  True False  True  True False  True  True  True False
 False  True False  True  True  True  True  True  True  True  True  True
  True False False  True  True False  True False  True False  True  True
 False False  True  True  True  True False False  True  True  True False
  True  True False False False False False False  True  True  True  True
 False  True  True  True False False  True  True False  True False False
 False  True  True False  True  True  True  True  True  True  True  True
  True False False False  True False  True  True  True False  True False
 False  True  True False  True  True False False  True False False False
 False  True  True False False  True False False  True  True False False
  True False  True False False False False  True  True  True False  True
  True False  True  True  True False  True  True  True False False False
  True  True  True  True  True  True  True  True False False False False
  True  True False  True  True  True False False False False  True  True
  True  True False False False  True  True  True False False  True False
  True  True  True False  True False  True  True  True False False  True
 False  True  True False  True  True False  True False  True  True  True
  True False  True  True False  True  True False False False  True False
  True  True  True False  True  True False False  True  True  True False
 False  True  True False False False  True  True False  True  True False
  True  True False  True False  True  True  True  True  True  True  True
  True False False  True  True  True  True  True  True  True  True  True
  True False  True  True False False False  True  True  True  True False
  True  True  True False  True False False  True  True  True  True  True
  True  True  True  True False  True False  True  True False False False
 False  True False  True  True  True  True  True  True False  True  True
 False  True False  True False  True  True False  True  True False  True
  True  True False  True  True False False False  True False  True False
 False False False  True  True  True False  True  True  True  True  True
  True  True False  True False  True False False  True  True  True  True
 False  True  True False  True  True  True False  True False  True  True
 False False False  True False False  True  True  True False  True  True
  True  True  True False  True False  True  True False  True  True  True
 False  True  True  True  True  True  True  True False False False  True
 False  True  True False  True False False  True  True  True  True  True
  True  True  True False  True  True  True  True  True  True False False
  True  True False  True  True False False  True False  True  True  True
  True False  True False  True False False  True  True False  True  True
  True  True  True  True  True  True  True  True  True False False  True
  True  True  True  True  True False False  True False  True  True  True
  True  True  True  True  True False  True False  True  True  True  True
  True False  True  True False  True False  True  True  True False  True
 False  True False  True  True  True  True  True False False  True  True
 False  True  True  True  True  True False False  True False False  True
  True  True  True  True False  True  True  True  True  True False  True
  True  True  True False  True  True False  True  True  True False  True
  True  True  True False  True  True  True False  True False  True False
  True  True  True  True False  True False  True  True False  True False
 False False  True  True  True  True False  True  True  True  True  True
 False  True  True  True False False  True False  True False  True  True
  True  True  True False  True False  True  True  True False  True  True
 False  True  True  True False  True  True False  True  True  True  True
  True False False  True  True  True  True False  True  True  True  True
  True  True False  True  True  True  True  True  True False  True  True
 False False False False False  True False  True  True  True False False
  True False False  True  True  True  True False  True  True False False
  True  True  True False False  True False  True  True False  True False
 False  True  True]



In [7]:

    
women_onboard = data[women_only_stats,1].astype(np.float)
men_onboard = data[men_only_stats,1].astype(np.float)
proportion_women_survived = np.sum(women_onboard) / np.size(women_onboard)  
proportion_men_survived = np.sum(men_onboard) / np.size(men_onboard) 
print 'Proportion of women who survived is %s' % proportion_women_survived
print 'Proportion of men who survived is %s' % proportion_men_survived









    



Proportion of women who survived is 0.742038216561
Proportion of men who survived is 0.188908145581



In [9]:

    
test_file = open('Desktop/titanic/test.csv', 'rb')
test_file_object = csv.reader(test_file)
header = test_file_object.next()



In [10]:

    
prediction_file = open("Desktop/titanic/genderbasedmodel.csv", "wb")
prediction_file_object = csv.writer(prediction_file)



In [11]:

    
prediction_file_object.writerow(["PassengerId","Survived"])
for row in test_file_object:
    if row[3] == "female" :
        prediction_file_object.writerow([row[0],'1'])
    else:
        prediction_file_object.writerow([row[0],'0'])
test_file.close()
prediction_file.close()



In [72]:

    
fare_ceiling = 40
data[data[0::,9].astype(np.float) >= fare_ceiling , 9] = fare_ceiling - 1.0

fare_bracket_size = 10
price_brackets = fare_ceiling / fare_bracket_size
number_classes = 3
number_of_classes = len(np.unique(data[0::,2]))
survival_table = np.zeros((2,number_of_classes,number_of_price_brackets))
print number_of_classes
print survival_table









    



3
[[[ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]]

 [[ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]]]



In [73]:

    
for i in xrange(number_of_classes):       #loop through each class
  for j in xrange(number_of_price_brackets):   #loop through each price bin
    
    women_only_stats = data[ (data[0::,4] == "female")&(data[0::,2].astype(np.float) == i+1)&
                            (data[0:,9].astype(np.float)>= j*fare_bracket_size)& \
                            (data[0:,9].astype(np.float)< (j+1)*fare_bracket_size) , 1]
    men_only_stats = data[ (data[0::,4] != "female")&(data[0::,2].astype(np.float) == i+1)&
                            (data[0:,9].astype(np.float)>= j*fare_bracket_size)& \
                            (data[0:,9].astype(np.float)< (j+1)*fare_bracket_size) , 1]
    
    survival_table[0,i,j] = np.mean(women_only_stats.astype(np.float)) 
    survival_table[1,i,j] = np.mean(men_only_stats.astype(np.float))









    



[]
['0' '0' '0' '0' '0' '0']
[]
[]
['1' '1' '0' '1' '1' '1']
['0' '0' '0' '1' '0' '0' '0' '0' '0' '1' '1' '0' '0' '1' '0' '0' '1' '1'
 '0' '0' '0' '1' '1' '0' '0' '1' '1' '0' '1' '1']
['1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1'
 '1' '1' '0' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1'
 '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '0' '1' '1' '1' '1' '1' '1' '1'
 '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1'
 '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1']
['0' '1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '0' '1' '1' '0' '1' '0' '0' '1' '1' '0' '0' '0' '0' '1' '0'
 '0' '1' '0' '0' '1' '1' '1' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '0'
 '0' '1' '1' '0' '1' '1' '0' '1' '1' '1' '1' '0' '1' '0' '1' '1' '1' '0'
 '1' '1' '1' '1' '0' '0' '0' '0' '0' '0' '0' '1' '0' '1']
[]
['0' '0' '0' '0' '0' '0']
['1' '1' '1' '1' '1' '1' '1' '0' '1' '1' '1' '1' '1' '1' '1' '0' '1' '1'
 '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '0' '1' '1']
['1' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0'
 '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1'
 '0' '1' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '0' '0'
 '0' '0' '0' '1' '0' '0' '0' '0' '0']
['0' '1' '1' '1' '1' '1' '1' '1' '0' '1' '1' '1' '1' '1' '1' '1' '1' '1'
 '1' '1' '1' '1' '1' '1' '1' '1' '1' '0' '1' '1']
['0' '1' '0' '0' '0' '1' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '1'
 '0' '0' '0' '0' '0' '0' '0']
['1' '1' '1' '1' '1' '1' '1' '1' '1' '1' '1']
['0' '0' '0' '0' '1' '0' '1' '0' '0' '0' '0' '0' '1' '0']
['1' '0' '1' '1' '1' '1' '0' '1' '1' '1' '1' '0' '1' '0' '1' '1' '1' '1'
 '1' '1' '0' '0' '0' '1' '0' '1' '0' '1' '1' '1' '1' '1' '1' '1' '0' '0'
 '0' '0' '0' '1' '0' '0' '0' '0' '1' '0' '1' '0' '1' '1' '0' '1' '0' '1'
 '1' '0' '0' '1' '1' '1' '0' '0' '1' '1']
['0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0'
 '0' '1' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '0' '0' '1' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '1' '1' '0' '0' '0' '1' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0'
 '0' '1' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '1' '0' '0' '0' '1'
 '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1'
 '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '1'
 '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0'
 '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '1' '0' '0'
 '0' '0' '1' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '0' '0' '0' '0' '0']
['1' '1' '0' '0' '1' '0' '1' '1' '0' '0' '0' '0' '1' '1' '1' '0' '0' '1'
 '0' '1' '1' '0' '1' '1' '0' '1' '1' '1' '1' '1' '0' '1' '0' '1' '0' '1'
 '0' '1' '1' '1' '0' '1' '0']
['0' '1' '0' '1' '0' '0' '0' '0' '1' '0' '0' '1' '0' '0' '0' '0' '1' '0'
 '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '1' '0' '0' '0' '0' '1' '0'
 '0' '1']
['0' '1' '1' '0' '1' '0' '0' '1' '1' '1' '0' '0' '0' '0' '1' '0' '0' '0'
 '0' '0' '0']
['0' '0' '0' '0' '0' '1' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0'
 '0' '0' '0' '1' '0' '0']
['1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0']
['0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1' '1' '0'
 '0' '1' '0' '0' '1' '0' '0']



In [74]:

    
survival_table[ survival_table != survival_table ] = 0
print survival_table









    



[[[ 0.          0.          0.83333333  0.97727273]
  [ 0.          0.91428571  0.9         1.        ]
  [ 0.59375     0.58139535  0.33333333  0.125     ]]

 [[ 0.          0.          0.4         0.38372093]
  [ 0.          0.15873016  0.16        0.21428571]
  [ 0.11153846  0.23684211  0.125       0.24      ]]]



In [75]:

    
survival_table[ survival_table < 0.5 ] = 0
survival_table[ survival_table >= 0.5 ] = 1 
print survival_table









    



[[[ 0.  0.  1.  1.]
  [ 0.  1.  1.  1.]
  [ 1.  1.  0.  0.]]

 [[ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]
  [ 0.  0.  0.  0.]]]



In [76]:

    
test_file = open('Desktop/titanic/test.csv', 'rb')
test_file_object = csv.reader(test_file)
header = test_file_object.next()
predictions_file = open("Desktop/titanic/genderclassmodel.csv", "wb")
p = csv.writer(predictions_file)
p.writerow(["PassengerId", "Survived"])



In [77]:

    
#Populating the new
for row in test_file_object:
    set
    for j in xrange(number_of_price_brackets):
        try:
            row[8]=float(row[8])
        except:
            bin_fare= 3-float(row[1])
            break
        if(row[8]>fare_ceiling):
            bin_fare=number_of_price_brackets -1
            break
        if row[8] >= j * fare_bracket_size and row[8] < (j+1) * fare_bracket_size:  
            bin_fare = j
            break
            
        if row[3] == 'female':  
            p.writerow([row[0], "%d" % int(survival_table[0, float(row[1])-1, bin_fare])])
        else:                                       
            p.writerow([row[0], "%d" % int(survival_table[1, float(row[1])-1, bin_fare])])
     
# Close out the files.
test_file.close() 
predictions_file.close()









    



/home/tarzilams/anaconda2/lib/python2.7/site-packages/ipykernel/__main__.py:17: DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
/home/tarzilams/anaconda2/lib/python2.7/site-packages/ipykernel/__main__.py:19: DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future



In [ ]: