【相关系数r的计算公式怎么算】在统计学中,相关系数(r)是用来衡量两个变量之间线性关系的强弱和方向的一种指标。它通常介于 -1 和 1 之间,其中:
- r = 1 表示完全正相关;
- r = -1 表示完全负相关;
- r = 0 表示无线性相关。
本文将详细介绍相关系数 r 的计算公式,并通过一个简单的表格形式展示计算过程。
一、相关系数 r 的计算公式
相关系数 r 的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是数据对的数量;
- $ x $ 和 $ y $ 分别是两组数据;
- $ \sum xy $ 是每对数据乘积之和;
- $ \sum x $ 和 $ \sum y $ 分别是 x 和 y 的总和;
- $ \sum x^2 $ 和 $ \sum y^2 $ 分别是 x 和 y 的平方和。
二、计算步骤总结
1. 收集两组数据 (x, y)。
2. 计算每对数据的乘积 $ xy $。
3. 计算所有 x 值的总和 $ \sum x $、y 值的总和 $ \sum y $。
4. 计算所有 $ x^2 $ 和 $ y^2 $ 的总和。
5. 代入公式计算 r。
三、示例计算(表格形式)
以下是一个简单的数据集,用于演示如何计算相关系数 r。
序号 | x | y | xy | x² | y² |
1 | 2 | 3 | 6 | 4 | 9 |
2 | 4 | 5 | 20 | 16 | 25 |
3 | 6 | 7 | 42 | 36 | 49 |
4 | 8 | 9 | 72 | 64 | 81 |
5 | 10 | 11 | 110 | 100 | 121 |
计算结果:
- $ n = 5 $
- $ \sum x = 2 + 4 + 6 + 8 + 10 = 30 $
- $ \sum y = 3 + 5 + 7 + 9 + 11 = 35 $
- $ \sum xy = 6 + 20 + 42 + 72 + 110 = 250 $
- $ \sum x^2 = 4 + 16 + 36 + 64 + 100 = 220 $
- $ \sum y^2 = 9 + 25 + 49 + 81 + 121 = 285 $
代入公式:
$$
r = \frac{5 \times 250 - (30 \times 35)}{\sqrt{[5 \times 220 - 30^2][5 \times 285 - 35^2]}}
$$
$$
r = \frac{1250 - 1050}{\sqrt{[1100 - 900][1425 - 1225]}} = \frac{200}{\sqrt{200 \times 200}} = \frac{200}{200} = 1
$$
结论: 此数据集中 x 与 y 完全正相关,r = 1。
四、注意事项
- 相关系数仅衡量线性关系,不适用于非线性关系;
- 数据应为连续型变量,且分布接近正态;
- 异常值可能显著影响相关系数的计算结果。
通过以上方法,我们可以准确地计算出两个变量之间的相关系数 r,从而判断它们之间的相关程度。