文章目录 隐藏

协方差

用途：衡量两个或两个以上数据间的独立性、相关性。

结论：

如果x和y的联合分布多分布在一三象限，x ⋅ y多为正数，则协方差为正，x和y正相关。

如果x和y的联合分布多分布在二四象限，x ⋅ y 多为负数，则协方差为负，x和y负相关。

如果x和y的几乎均匀地分散在所有象限中，则x ⋅ y 有正有负，均值接近于0，说明x和y之间没有相关性（只是说没有线性相关）。

协方差与方差

协方差本质就是不同维度数据间衡量其相关性，例如x与y之间数据相关性。

如果是x与x本身，都在同一纬度衡量相关性，这就是方差。

所以方差是特殊的协方差。

明白了协方差，协方差矩阵很好理解，其实就是2个或两个以上的维度交织在一起产生的多种相关关系，用矩阵的方式记录下来而已。他们数值之间的意义与协方差相同。

观察下面动图：

下图，x与x、y与y自身的协方差都是1。——这个我们暂时不研究。

但是，x与y之间的协方差为0，表示两者之间相互独立。

x与y的协方差>0，表示正相关。<0表示负相关。

为了克服协方差的缺陷而诞生的， $\rho(X,Y)=\frac{Cov(X,Y)}{s(X)s(Y)}$

任何两个数变量的相关系数，必然是一个 -1 到 1 之间的值（证明略）。

相关系数为 1 ，说明两个变量完美正相关；

相关系数为-1 ，说明两个变量完美负相关；

相关系数为 0 ，说明两个变量完美不相关。

转载自：

https://blog.csdn.net/hustqb/article/details/90264432