Skip to content

Logistic回归

Logistic分布函数

sigmoid函数:S(x)=11+ex

基于sigmoid函数,得到服从Logistic分布的连续随机变量X的概率分布函数和概率密度函数:

F(x)=P(Xx)=11+e(xμ)/γf(x)=F(x)=e(xμ)/γγ(1+e(xμ)/γ)2

分布函数F(x)满足以点(μ,12)中心对称:

F(x+μ)12=F(x+μ)+12

二项Logistic回归模型

P(Y=1|x)=exp(ωx+b)1+exp(ωx+b)P(Y=0|x)=11+exp(ωx+b)

事件的几率表示为事件发生的概率与不发生的概率的比值p1p,其对数几率表示为:

logit(p)=logp1p

将Logistic回归的公式代入,得到他的对数几率:

logP(Y=1|x)1P(Y=1|x)=logP(Y=1|x)P(Y=0|x)=log[exp(ωx+b)1+exp(ωx+b)×1+exp(ωx+b)]=logexp(ωx)=ωx

模型参数估计

设:P(Y=1|x)=π(x),P(Y=0|x)=1π(x)

似然函数为:i=1N[π(xi)]yi×[1π(xi)]1yi

对数似然函数:

L(ω)=i=1N[yilogπ(xi)+(1yi)log(1π(xi))]=i=1N[yilogπ(xi)1π(xi)+log(1π(xi))]=i=1N[yi(ωxi)log(1+exp(ωxi))]

L(ω)求极大值,得到ω的估计值ω^,学习到的模型为:

P(Y=1|x)=exp(ω^x+b)1+exp(ωx+b)P(Y=0|x)=11+exp(ω^x+b)