该指标对应平方对数(二次)差或损失的预估值风险度量.
如果$\hat{y}_i$是$i-th$样本的预测值,并且$y_i$是对应的真实值,则均方误差对数(MSLE)预估的$n_{\text{samples}}$定义如下:
$$\text{MSLE}(y, \hat{y}) = \frac{1}{n_\text{samples}} \sum_{i=0}^{n_{samples^-1}} (\log_e (1 + y_i) - \log_e (1 + \hat{y}_i) )^2$$其中$\log_e (x)$表示$x$的自然对数.当目标具有指数增长的趋势时,该指标最适合使用,例如人口数量,跨年度商品的平均销售额等.需注意,该指标会对低于预测的估计值进行估计.
可决系数反映将来样本如何可能被模型预测的估量.最佳分数为1.0,可以为负数(因为模型可能会更糟).总是预测y的预期值,不考虑输入特征的常数模型将得到$R^2$得分为0.
如果$\hat{y}_i$是$i-th$样本的预测值,并且$y_i$是对应的真实值,则$R^2$得分预估的$n_{\text{samples}}$定义如下:
$$ R^2(y, \hat{y}) = 1 - \frac{\sum_{i=0}^{n_{samples^{-1}}} (y_i - \hat{y}_i)^2}{\sum_{i=0}^{n_{samples^{-1}}} (y_i - \bar{y})^2} $$其中$\bar{y} = \frac{1}{n_{\text{samples}}} \sum_{i=0}^{n_{samples^{-1}}} y_i$
除了上面的这些指标,sklearn还提供了一些其他接口来做分类模型的评估
接口 | 说明 |
---|---|
metrics.explained_variance_score(y_true, y_pred) |
解释方差得分 |
metrics.mean_absolute_error(y_true, y_pred) |
平均绝对误差 |
metrics.mean_squared_error(y_true, y_pred[, …]) |
均方误差 |
metrics.mean_squared_log_error(y_true, y_pred) |
均方误差对数 |
metrics.median_absolute_error(y_true, y_pred) |
中位绝对误差 |
metrics.r2_score(y_true, y_pred[, …]) |
R² score可决系数 |
In [ ]: