课件 课件: Lesson 3.线性回归的手动建模实验 Lesson 3.1 变量相关性基础理论 Lesson 3.2 数据生成器与Python模块编写 Lesson 3.3 线性回归手动实现与模型局限 Lesson 3.4 机器学习模型结果可信度理论与交叉验证基础 本节关键词 Lesson 3.1 …

阅读全文 »

课件 这里看课件:Lesson 2.矩阵运算基础、矩阵求导与最小二乘法 本节关键词 numpy语法和常用方法 方程组求解 线性代数:非齐次线性方程组的求解 线性代数:判断矩阵是否可逆(用秩或行列式判断) 线性代数:求逆矩阵 矩阵方程求解 矩阵论:将求偏导的函数组改写为矩阵形式、向量变元 矩阵论:矩阵 …

阅读全文 »

课件 这里看课件:Lesson 1.机器学习基本概念与建模流程 本节关键词 经典统计分析方法与机器学习 数据与数据集 特征与标签 连续变量和离散变量 模型类型(分类问题与回归问题) 线性回归模型 模型评估指标(SSE) 损失函数 利用最优化方法求解损失函数 求解凸函数的最小值有很多种方法,其中最为基 …

阅读全文 »

Python中模块和包的区别 Python中众多模块可以组成一个包,有很多包组成的我们用pip管理的环境中所有的包称之为库。具体看这篇文章,讲的很清楚:(21条消息) python中模块和包的区别_python包和模块的区别_白小斗的博客-CSDN博客 如何判断引用的是模块还是包? 因为python …

阅读全文 »

什么是数据科学? 出人意料的是,可视化技能并未出现在头部技能中。作者认为这是因为可视化被看作一种工具(比如 Tableau),或者被看为一种软技能,是不属于数据科学中所研究的东西(更加类似于Office文员的扩展技能)。 什么是数据分析? 在工作中只写 SQL 提取数据,呈现分析报表人员,是「数据分 …

阅读全文 »

Numpy是以矩阵为基础的数学计算模块,纯数学。 Scipy基于Numpy,科学计算库,用于数学、科学、工程领域。可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。有一些高阶抽象和物理模型。比方说做个傅立叶变换,这是纯数学的,用Numpy;做个滤波器,这属于信号处理模型了, …

阅读全文 »

  1、功能不同 Scikit-learn(sklearn)的定位是通用机器学习库,而TensorFlow(tf)的定位主要是深度学习库。 一个显而易见的不同:tf并未提供sklearn那种强大的特征工程,如维度压缩、特征选择等。究其根本,我认为是因为机器学习模型的两种不同的处理数据的方式: 传统机 …

阅读全文 »

一切技术的出现都是为了解决现实问题,而现实问题分为简单问题和复杂问题。简单问题,需要简单分析,我们使用数据分析。复杂问题,需要复杂分析,我们使用机器学习。 1、什么是简单问题? 比如公司领导想知道每周的销售情况,这种就是简单问题。简单问题可以用数据分析来处理,通过分析数据来分析出有用的信息。 最简单 …

阅读全文 »

本文已收录于 清华大学操作系统课程笔记 系列,共计 9 篇,本篇是第 9 篇

文件系统和文件 打开文件和文件描述符 文件描述符是打开的文件在内存中维护的相关信息。 文件描述符 只读、可读可写。 文件的用户视图和系统视图:文件从用户、系统的角度来看是什么样的 通常是几个扇区构成一个数据块。 用户视图 系统视图的转换 磁盘的最小访问单元是块。 文件系统最小的访问单位是数据块。 即 …

阅读全文 »