PCA
样本矩阵
设一个随机变量有
样本集合有
那么就形成了
对每一列求均值,第
进行样本中心化,每一列的值减去该列的平均值,得到新矩阵:
协方差矩阵
协方差计算公式为:
对于
协方差矩阵的每个值
把协方差公式展开后,提出公共的
上述矩阵中的每个值:
整个矩阵可以最终化简得到:
主成分1
求第一主成分PC1的问题可转化为计算每个样本向量在
式子中的
这时公共项可以提出求和式:
用
根据上文的推导,最终样本方差
求极大值问题
最终将问题转变为已知条件下的最大值问题,可以利用拉格朗日乘数法求解:
构造拉格朗日函数:
对函数求偏导:
最后就得到了:
这说明,
最大化目标函数就等价于最大化特征值