F'(x) = (1 / (1 + exp(−(x−μ)/σ)))'
设:m = 1 + exp(−(x−μ)/σ)
则:F'(x) = (1'm - 1m') / (m^2)
= (0 - m') / (m^2)
= -m' / (m^2)
解:m' =(1 + exp(−(x−μ)/σ))'
= (0 + exp(−(x−μ)/σ)) * (−(x−μ)/σ))'
= exp(−(x−μ)/σ) * (-1 / σ)
那么F'(x) = -(-1 / σ) * exp(−(x−μ)/σ) / ((1 + exp(−(x−μ)/σ))^2)
参考求导公式:y=u/v => y'=(u'v-uv')/v^2)
y=a^x => y'=a^xlna
y=e^x => y'=e^x
由于logistic分布的分布函数(S型)的良好的数学性质,使得它的概率密度函数具有对称性,从而,经常使用logistic分布区近似其他具有对称概率密度函数的分布
logistic分布的这种S-shapesd的分布,称为Logistic regression model,其用来对某个输入最可能的输出进行预测
logistic CDF(分布函数、cumulative distribution function)的S-shaped曲线,实际上可以描述了某一个事件发生的可能性
假设我们要解决的问题为一个二分类问题,那么,可以利用逻辑斯蒂分布来对二分类模型建模,即对于一个样本x,它的类别要么为1,要么为0,我们设定它为1的概率为逻辑斯蒂分布中的概率分布形式,那么,它为0的概率也就是1-P(y=0)
这里的“二项”一词,与二项分布的意义相同(一次试验的结果要么为1要么为0),一个样本类别要么为1要么为0
两类分类问题,期Y∈{1,0}
另:样本x具有n个特征,即x∈Rn
P(Y = 1|x) = exp(w⋅x + b) / (1 + exp(w⋅x + b))
P(Y = 0|x) = 1 / (1 + exp(w⋅x + b))
注1:P(Y=1|x) + P(Y=0|x) = 1
注2:上面的二项逻辑斯蒂回归模型其实就是一个二项分布的形式,即一次试验的结果要么为1、要么为0,其中,结果为1的概率利用逻辑斯蒂分布给出。
对于给定的样本x,利用二项逻辑斯蒂回归模型计算该样本类别为1和0的概率,然后,将样本x分类到概率较大的那一类
对输入向量进行扩充,添加一个1,从而,可以将参数向量w和偏移量b写在一起,仍记为w,此时,逻辑回归模型为:
P(Y=1|x) = exp(w⋅x) / (1+exp(w⋅x))
P(Y=0|x) = 1 / (1+exp(w⋅x))
注:w⋅x + b = w1x1 + ⋯ + wnxn + b
= w1x1 + ⋯ + wnxn + w0x0 (记w0=b, x0=1)
= (w1,⋯,wn,b)T(x1,⋯,xn,1)
= w⋅x (w与x从0开始)
二项逻辑斯蒂回归模型具有一个位置的参数向量w,那么如何能够利用训练数据集求得该参数向量?最直观的方式就是利用极大似然估计:即给定N个样本,最优的参数应该是使得这给定的N个样本的联合概率密度∏Pi(1<=i<=N, w)(即似然函数)取得最大的参数w^*,即