第一章 绪论

基本概念一览

人工智能

人工智能就是让机器人具有人类的智能。

就是要让机器的行为看起来就像是人所表现出的智能的行为一样。

因为“智能”较难定义,判断机器是否智能的方式则采用“图灵测试”。

人工智能主要领域划分:

  • 感知(语音信息处理、计算机视觉等)
  • 学习(监督学习、半监督、无监督学习等)
  • 认知(知识表示、自然语言理解、推理等)

人工智能发展历程:
推理期(规律较简单) — 知识期(知识库、专家系统)— 学习期(计算机从数据中自主学习)

人工智能流派(主要):符号主义与连接主义。

机器学习(Machine Learning)

机器学习是指从有限的观测数据中学习出具有一般性的规律,并利用这些规律对未知的数据进行预测的方法。

机器学习模型一般包括以下步骤:
数据预处理 – 特征提取 – 特征转换 – 预测
其中预测是机器学习的核心部分,机器需要自主学习到一个函数(模型),来进行未知数据的预测

传统的机器学习,实际操作过程中,数据预处理、特征提取、特征转换反而需要人类干预,好的特征影响着最终模型,所以有时机器学习的主要工作量在特征问题上。这其实是一种“浅层学习”

表示学习(Representation Learning)

表示,或称之为特征
表示学习指可以自动的学习出有效的特征,并提高最终机器学习模型的性能的学习。

表示学习两个核心问题:什么是好的表示? 如何学习到好的表示?

好的表示的优点:

  • 很强的表示能力
  • 使后续的学习任务变得简单
  • 具有一般性,可以比较容易迁移到其他任务上
常用表示
  1. 局部表示

    用一个很长的向量表示特征,有则为1,无则为0

    优点:很好的解释性;稀疏的二值向量,计算效率很高

    不足:向量的维数很高,不易扩展(扩展就要增维);不同特征之间的相关性都相同,不能很好表示特征间的关系。

  2. 分布式表示

    向量维度低,方便扩展,相似度也可以计算

其他

嵌入:将一个度量空间中的一些对象映射到另一个低维的度量空间中,并尽可能保持不同对象之间的拓扑关系。(由高维空间映射到低维空间)

深度学习(Deep Learning)

“深度”:指原始数据进行非线性特征转换的次数

深度学习的目的是从数据中自动学习到有效的特征表示(之前都是人工设计特征偏多)

深度学习需要解决问题:贡献度分配
即一个系统中不同的组间或其参数对最终系统输出结果的贡献或影响。

端到端学习

端到端学习指在学习过程中,不进行分模块或分阶段训练,直接优化任务的总目标,端到端学习的中间过程不需要人为干预。训练数据为“输入-输出”对的形式而不需要提供其他信息。

深度学习算是一种端到端学习

神经网络( Neural Network)

神经网络是指由很多人工神经元构成的网络结构模型,这些人工神经元之间的连接强度是可学习的参数。

详细内容还需要通过后面的学习认识。

发展历史:
模型提出 – 冰河期(反向传播算法提出被忽略)– 反向传播算法引起复兴(梯度消失问题出现)
– 流行度降低 – 深度学习的崛起(以神经网络为基础)

评论