[1-1] NumPy, matplotlibに加えて、pandasをインポートします。
In [1]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
[1-2] タイタニック号のデータを読み込んで、データフレームに格納します。
In [2]:
data = pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic3.csv')
[1-3] 先頭の3行分を表示します。
In [3]:
data[:3]
Out[3]:
[1-4] 性別(sex)と生存(survived)の列だけを取り出したデータフレームを作成する例です。
In [4]:
df = data[['sex','survived']]
df[:3]
Out[4]: