[3-1] NumPy, matplotlibに加えて、pandasをインポートします。
In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
[3-2] タイタニック号のデータを読み込んで、データフレーム data に格納します。
In [2]:
data = pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.csv')
[3-3] 年齢(age)と運賃(fare)を散布図に表示します。
In [3]:
df = data[['age','fare']].dropna()
df.plot(kind='scatter', x='age', y='fare')
Out[3]:
[3-4] 社会的地位(pclass)と運賃(fare)の関係を箱ひげ図で示します。
In [4]:
df = data[['fare','pclass']].dropna()
df.boxplot(column='fare', by='pclass')
Out[4]:
[3-5] 性別(sex)と生存(survived)の関係をクロス集計表に表します。
In [5]:
df = data[['sex','survived']].dropna()
pd.crosstab(df.sex, df.survived)
Out[5]:
[3-6] クロス集計表を棒グラフに表示します。
In [6]:
pd.crosstab(data.sex ,data.survived).plot(kind='bar')
Out[6]: