数学建模-主成分分析(PCA)
本文最后更新于 2025年1月17日 中午
PCA是什么?
找新的坐标轴
- 去中心化
- 找坐标系
关键概念
协方差:
\(cov(x,y)=\dfrac{\sum^n_{i=1}(x_i-\bar x)(y_i-\bar y)}{n-1}\)
协方差矩阵:
\(\begin{aligned}C&=\begin{vmatrix}cov(x,x)&cov(x,y)\\cov(x,y)&cov(y,y)\end{vmatrix}\\&=\dfrac{1}{n-1}\begin{bmatrix}x_1&x_2&x_3&x_4\\y_1&y_2&y_3&y_4\end{bmatrix}\begin{bmatrix}x_1&y_1\\x_2&y_2\\x_3&y_3\\x_4&y_4\\\end{bmatrix}\\&=\dfrac{1}{n-1}DD^T\end{aligned}\) \[ \begin{aligned} C'&=\dfrac{1}{n-1}D'D'^T\\ &=\dfrac{1}{n-1}RSD(RSD)^T\\ &=RS\dfrac{1}{n-1}S^TR^T\\ &=RSS^TR^T\\ &=RLR^{-1}\\ L&=SS^T=\begin{bmatrix}a^2&0\\0&b^2\end{bmatrix} \end{aligned} \]
基本过程
从二维数据入手:
- 求出点的中心,将中心移动至坐标原点
- 找到一条有着最大投影点到原点距离平方和的线
- PC的特征值为最佳拟合线距离的平方和
- PC奇异值为PC的特征值的平方根
MATLAB代码
1 |
|
数学建模-主成分分析(PCA)
https://meteor041.git.io/2025/01/15/数学建模-主成分分析/