当前位置:网站首页>PCA主成分分析(降维)过程推导
PCA主成分分析(降维)过程推导
2022-07-17 00:10:00 【elkluh】
主成分分析的作用是降维。当数据量有多个维度时,有些维度对于数据的贡献大,有些维度对数据的贡献小。通过主成分分析,找到重要的维度,能大大减少计算量。
PCA的中心思想:
一个中心:原始特征空间的重构。
两个基本点:最大投影方差,最小重构距离。
---------------------------------------------------------------------------------------------------------------------------------
最小重构距离通过下面的式子来构建。
重构前:(xn是去中心化的每个样本)

表示原始的点,能表示成d个向量(d个维度)的和。通过分解,它能够分解到两组向量上,PCA保留了一部分,舍弃了一部分,舍弃了
这部分,保留了
这部分。a是每个分解的向量u上的长度,相乘后求和就可以重构原样本。
一个点投影到u_m上的效果,和所有点投影到紫色的线上的效果(二维转化为一维)


重构后:

重构的代价就是使重构前后的距离最小:(两个式子相减后剩下后面这部分)

这里的S是协方差矩阵。
则损失函数为:

使用拉格朗日乘子约束优化,式子变成:
(1)拉格朗日优化后

(2)求导

则:
(3)结果:

表示S的特征向量,
表示特征值 。
---------------------------------------------------------------------------------------------------------------------------------
则PCA的步骤为:
1.求平均值,去中心化


2.计算协方差矩阵
![\mathbf{S}=\frac{1}{N} \sum_{n=1}^{N} \mathbf{x}_{n}^{\text {norm }}\left[\mathbf{x}_{n}^{\text {norm }}\right]^{T}](http://img.inotgo.com/imagesLocal/202207/19/202207170006024996_7.gif)
3.特征分解

矩阵分解的过程就像下面这样子
![\mathbf{S}=\left[\begin{array}{ccc}\sigma_{11}^{2} & \ldots & \sigma_{1 M}^{2} \\ \vdots & \ddots & \vdots \\ \sigma_{M 1}^{2} & \cdots & \sigma_{M M}^{2}\end{array}\right]=\mathbf{U} \boldsymbol{\Lambda} \mathbf{U}^{T}=\left[\begin{array}{lll}\mathbf{U}_{s} & \mid & \mathbf{U}_{\mathbf{n}}\end{array}\right]\left[\begin{array}{c|c}\boldsymbol{\Lambda}_{s} & \mathbf{0} \\ \hline \mathbf{0} & \boldsymbol{\Lambda}_{n}\end{array}\right]\left[\begin{array}{c}\mathbf{U}_{s}^{T} \\ \hline \mathbf{U}_{\mathbf{n}}{ }^{T}\end{array}\right]](http://img.inotgo.com/imagesLocal/202207/19/202207170006024996_14.gif)
4.用特征值
对U的列进行排序
5.选择M个特征向量,形成
6.进行投影


边栏推荐
猜你喜欢

【文献阅读】Small-Footprint Keyword Spotting with Multi-Scale Temporal Convolution

CheckPoint and DataNode

Redis suddenly slowed down?

Solve the problem that Scala cannot initialize the class of native

touchID 和 FaceID~2

动手学深度学习---从全连接层到卷积层篇

【文献阅读】MCUNet: Tiny Deep Learning on IoT Devices
![[translation] transformers in computer vision](/img/94/a6b8fdddca0e3042e1da7f945aeebe.png)
[translation] transformers in computer vision

apt-get update报错:Hash 校验和不符

What is "digital collection"?
随机推荐
【文献阅读】Multi-state MRAM cells for hardware neuromorphic computing
The interviewer asked: how to check if redis suddenly slows down?
Laravel之文件上传
bais mintigation post-processing for individual and group fairness
Fair Attribute Classification through Latent Space De-biasing
uniapp打包H5 空白页面 报错 Uncaught SyntaxError: Unexpected token ‘<‘
MapReduce
js数组处理【splice 实现数组的删除、插入、替换】
Fairness in Deep Learning: A Computational Perspective
mysql innodb 事务相关记录
【pycharm】Cannot find reference ‘XXX‘ in ‘__ init__. Py 'solution
golang编译的常见错误
WKWebView 设置自定义UserAgent正确姿势
组合键截图分析
CABasicAnimation暂停\企动
[literature reading] counting integer points in parametric polymers using barvinok's rational functions
Handling Conditional Discrimination(可解释歧视和确切的歧视)
爭奪存量用戶關鍵戰,助力企業構建完美標簽體系丨01期直播回顧
感通融合系统中保障公平度的时间与功率分配方法
网络安全新架构:零信任安全