本文已收录到:九天菜菜机器学习实战训练营 专题
课件
课件:
Lesson 3.4 机器学习模型结果可信度理论与交叉验证基础
本节关键词
Lesson 3.1 变量相关性基础理论
概率论与数理统计:变量之间相关性、相关性系数、皮尔逊相关系数、相关系数矩阵
Lesson 3.2 数据生成器与Python模块编写
手动生成规律可控的实验数据;
创建回归类数据集生成器;
随机数种子的基本使用方法;
Python模块编写方法;
Lesson 3.3 线性回归的手动实现与模型局限
手动建模构建线性回归;
线性回归模型的局限性(非线性拟合不佳、白噪声影响较大)与解决思路;
最小二乘法条件限制(多重共线性)与解决思路
对数据进行降维处理
修改求解损失函数的方法、广义逆矩阵
修改损失函数、岭回归、1-范数、弹性网模型、Lasso、L1范数、L1正则化、L2正则化、添加正则项、添加惩罚函数
线性回归的决定系数
决定系数、R-square、拟合优度检验、SST
Lesson 3.4 机器学习模型结果可信度理论与交叉验证基础
结果可信度基本理论、评估指标可信度
数据集划分方法;
测试集的“不可知”悖论、训练集和验证集、测试集
交叉验证基本概念;