引言
经验通常以数据形式存在
机器学习是研究关于学习算法的学问
模型指全局性结果,模式指局部性结果。
基本术语
记录的集合称为一个数据集(data set)
特征张成的空间称为特征空间(feature space)
一个样本(sample)称为一个特征向量(feature vector)
训练样本组成的集合称为训练集(training set)
拥有了标记(label)信息的样本,称为样例(example)。
学习任务:
- 二分类任务(binary classification)
- 多分类任务(multi-class classfication)
- 回归任务(regression)