协方差(covariance)是指两个变量的变化趋势是否相似的一种度量。协方差的计算公式是:
cov(X,Y) = E((X-E(X))(Y-E(Y)))
其中,E 表示数学期望,X 和 Y 分别表示两个随机变量。这个公式看起来很抽象,下面我们用实际例子来说明。
假设有一组数据如下:
X | Y |
---|---|
1 | 5 |
2 | 6 |
3 | 7 |
4 | 8 |
首先,我们需要计算出 X 和 Y 的平均值,分别为:
E(X) = (1 2 3 4) / 4 = 2.5
E(Y) = (5 6 7 8) / 4 = 6.5
然后,我们将每个数据点与其对应的平均值进行差值计算,得到:
X-E(X) | Y-E(Y) | (X-E(X))(Y-E(Y)) |
---|---|---|
-1.5 | -1.5 | 2.25 |
-0.5 | -0.5 | 0.25 |
0.5 | 0.5 | 0.25 |
1.5 | 1.5 | 2.25 |
最后,将每个数据点的差值乘起来,并求和,得到协方差:
cov(X,Y) = E((X-E(X))(Y-E(Y)))
= (2.25 0.25 0.25 2.25) / 4
= 1.25
通过这个例子,我们可以看出,协方差越大,说明两个变量的变化趋势越相似;协方差越小,说明变化趋势越不相似。