Unsupervised Learning 无监督学习
对应视频BV13x411v7US P24
- 化繁为简
输入比较复杂的input,得到比较简单的output
拥有的训练data,只有input,不知道output - 无中生有
训练某种function,训练集里只有function的output
Clustering 聚类
化繁为简的好方法
K-means(K均值):将X集合里的元素聚类为K个类别。
HAC(hierarchical Agglomerative Clustering)凝聚层次聚类:
利用树的结构表示Data
在树的不同层次划分,可以得到不同数量的class。
Dimension Reduction 降维
从比较高维的空间变为比较低维的空间。
实质是输入一个x,经过某一function,得到输出z,z的维度小于x的维度。
方法:
- Feature selection 特征选择
- Principle component analysis(PCA) 主成分分析
(未完待续)