[3-1] NumPy, matplotlibに加えて、pandasをインポートします。


In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

[3-2] タイタニック号のデータを読み込んで、データフレーム data に格納します。


In [2]:
data = pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.csv')

[3-3] 年齢(age)と運賃(fare)を散布図に表示します。


In [3]:
df = data[['age','fare']].dropna()
df.plot(kind='scatter', x='age', y='fare')


Out[3]:
<matplotlib.axes._subplots.AxesSubplot at 0x556fb50>

[3-4] 社会的地位(pclass)と運賃(fare)の関係を箱ひげ図で示します。


In [4]:
df = data[['fare','pclass']].dropna()
df.boxplot(column='fare', by='pclass')


Out[4]:
<matplotlib.axes._subplots.AxesSubplot at 0x5579850>

[3-5] 性別(sex)と生存(survived)の関係をクロス集計表に表します。


In [5]:
df = data[['sex','survived']].dropna()
pd.crosstab(df.sex, df.survived)


Out[5]:
survived 0 1
sex
female 127 339
male 682 161

[3-6] クロス集計表を棒グラフに表示します。


In [6]:
pd.crosstab(data.sex ,data.survived).plot(kind='bar')


Out[6]:
<matplotlib.axes._subplots.AxesSubplot at 0x53c1f50>