Unsupervised Learning 无监督学习

对应视频BV13x411v7US P24

  • 化繁为简
    输入比较复杂的input,得到比较简单的output
    拥有的训练data,只有input,不知道output
  • 无中生有
    训练某种function,训练集里只有function的output

Clustering 聚类

化繁为简的好方法

  • K-means(K均值):将X集合里的元素聚类为K个类别。

  • HAC(hierarchical Agglomerative Clustering)凝聚层次聚类:
    利用树的结构表示Data
    在树的不同层次划分,可以得到不同数量的class。

Dimension Reduction 降维

从比较高维的空间变为比较低维的空间。
实质是输入一个x,经过某一function,得到输出z,z的维度小于x的维度。

方法:

  • Feature selection 特征选择
  • Principle component analysis(PCA) 主成分分析

(未完待续)

评论