怎样用PCA技术简化数据,你造吗?

初商 2019-08-04

天池大数据科研平台

文章转载自ApacheCN
作者:片刻


1、降维技术

一 场景

我们正通过电视观看体育比赛,在电视的显示器上有一个球。

显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点。

人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给出运动场上球的位置。

这个过程中,人们已经将百万像素点的数据,降至为三维。这个过程就称为降维(dimensionality reduction)。

二 数据显示

数据显示并非大规模特征下的唯一难题,对数据进行简化还有如下一系列的原因:

使得数据集更容易使用

降低很多算法的计算开销

去除噪音

使得结果易懂

三 适用范围

在已标注与未标注的数据上都有降维技术。

这里我们将主要关注未标注数据上的降维技术,将技术同样也可以应用于已标注的数据。

四 PCA降维技术

在以下3种降维技术中, PCA的应用目前

登录 后评论
下一篇
云攻略小攻
2147人浏览
2019-10-21
相关推荐
数据量你造吗-JAVA分页
1188人浏览
2016-04-28 15:03:55
0
0
0
234