In [1]:
import numpy as np
import pandas as pd
In [2]:
from rcm import rcm_model
モデルの説明:$y_i=x_ib_i+\epsilon_i$
地域ごとに異なる(物件iごとに異なる)係数を推定する.
従来のモデルだと$y_i=x_ib+\epsilon_i$
具体的には
$$y_i=x_ib_i+\epsilon_i$$
$$b_i = b_1 + 緯度_i*b_2 + 経度_i*b_3 + \nu_i $$
In [3]:
datas = pd.read_csv("data2.csv")
In [4]:
y, X, reg, params = rcm_model(datas)
In [6]:
params.head()
Out[6]:
は、 $$y_i=x_i(b_1 + 緯度_i*b_2 + 経度_i*b_3 + \nu_i) +\epsilon_i$$ となるので、xを用いてyを予測したいときは、内挿と外挿に関わらず、以下のように行う.
In [12]:
np.exp((reg.params*X).T.sum().head())
Out[12]:
In [ ]: