Lesson 3.线性回归的手动建模实验¶

  在此前的两节课程中,我们已经介绍了关于线性回归模型的基本概念,并且介绍了一个多元线性回归的损失函数求解方法——最小二乘法。在有了这一些列理论推导之后,本节我们将结合Lesson 1中所介绍的机器学习一般建模流程,并首先尝试在一个手动构建的数据集上进行完整的线性回归模型建模。

  不过,在进行线性回归的手动建模实验过程中,一如既往我们需要补充很多关于机器学习的基础理论以及一些常用技巧,同时,我们也需要搭建一个更加完善的建模实验环境,因此本节内容总共分为四个小节,分别是:

Lesson 3.1 变量相关性基础理论¶

  • 相关系数基本概念;
  • 相关系数计算公式及实现方法;
  • 相关系数解读;
  • 利用相关性,构建具备一定规律数据集;

Lesson 3.2 数据生成器与Python模块编写¶

  • 手动生成规律可控的实验数据;
  • 创建回归类数据集生成器;
  • 随机数种子的基本使用方法;
  • Python模块编写方法;

Lesson 3.3 线性回归的手动实现与模型局限¶

  • 根据机器学习建模流程构建线性回归;
  • 线性回归模型局限与解决思路;

Lesson 3.4 机器学习模型结果可信度理论与交叉验证基础¶

  • 结果可信度基本理论;
  • 数据集划分方法;
  • 测试集悖论;
  • 交叉验证基本概念;