皮尔逊相关系数(公式,示例)|计算皮尔逊R
皮尔逊相关系数定义
Pearson相关系数,也称为Pearson R统计检验,用于测量不同变量及其关系之间的强度。每当在两个变量之间进行任何统计检验时,对于进行分析的人员来说,知道两个变量之间的关系有多强,计算相关系数的值始终是一个好主意。
皮尔逊的相关系数返回值介于-1和1之间。相关系数的解释如下:
- 如果相关系数为-1,则表示强负相关。这意味着变量之间存在完美的负相关关系。
- 如果相关系数为0,则表示没有关系。
- 如果相关系数为1,则表示强正相关。它暗示了变量之间的完美正关系。
相关系数的绝对值越高,表示变量之间的关系越强。因此,与例如0.36的值相比,0.78的相关系数表示更强的正相关。同样,相关系数为-0.87表示负相关性比相关系数为-0.40更大。
换句话说,如果该值在正范围内,则表明变量之间的关系呈正相关,并且两个值一起减小或增大。另一方面,如果该值在负范围内,则表明变量之间的关系呈负相关,并且两个值都将朝相反的方向发展。
皮尔逊相关系数公式
培生的相关系数公式如下:
在哪里,
- r =皮尔逊系数
- n =股票对的数量
- ∑xy =配对股票的乘积之和
- ∑x = x分数之和
- ∑y = y分数之和
- ∑x2 = x分数的平方和
- ∑y2 = y值平方的总和
解释
步骤1: 找出变量对的数量,用n表示。让我们假设x包含3个变量– 6,8,10。让我们假设y由相应的3个变量12、10、20组成。
第2步: 在两列中列出变量。
第三步: 在第三列中找出x和y的乘积。
第4步: 找出所有x变量和所有y变量的值之和。将结果写在第一列和第二列的底部。将x * y的总和写在第三栏中。
步骤5: 在第4列和第5列中找出x2和y2,并在列底部找到它们的总和。
步骤6: 将上面找到的值插入公式中并求解。
r = 3 * 352-24 * 42 /√(3 * 200-242)*(3 * 644-422)
= 0.7559
皮尔逊相关系数R的示例
您可以在此处下载此Pearson相关系数Excel模板– Pearson相关系数Excel模板例子1
在本示例中,借助以下详细信息表中的以下六个人,这些人具有以下不同年龄和不同权重,用于计算Pearson R的值
解决方案:
对于皮尔逊相关系数的计算,我们将首先计算以下值:
这里的总人数是6 n = 6
现在,Pearson R的计算如下:
- r =(n(∑xy)-(∑x)(∑y))/(√[n ∑x2-(∑x)2] [n ∑y2–(∑y)2)
- r =(6 *(13937)-(202)(409))/(√[6 * 7280-(202)2] * [6 * 28365-(409)2)
- r =(6 *(13937)-(202)*(409))/(√[6 * 7280-(202)2] * [6 * 28365-(409)2)
- r =(83622- 82618)/(√[43680 -40804] * [170190-167281)
- r = 1004 /(√[2876] * [2909)
- r = 1004 /(√8366284)
- r = 1004 / 2892.452938
- r = 0.35
因此,皮尔逊相关系数的值为 0.35
范例#2
有2只股票-A和B。在特定日期的股价如下:
从以上数据中找出皮尔逊相关系数。
解决方案:
首先,我们将计算以下值。
皮尔逊系数的计算如下:
- r = (5*1935-266*37)/((5*14298-(266)^2)*(5*283-(37)^2))^0.5
- = -0.9088
因此,两只股票之间的皮尔逊相关系数为-0.9088。
好处
- 它有助于了解两个变量之间的关系。不仅使用皮尔逊相关系数指示了两个变量之间是否存在相关性,而且还确定了这些变量相关的确切程度。
- 使用这种方法,可以确定相关方向,即两个变量之间的相关是负还是正。
缺点
- 皮尔逊相关系数R不足以分辨因变量和自变量之间的差异,因为变量之间的相关系数是对称的。例如,如果一个人试图了解高压力和血压之间的相关性,那么人们可能会发现该高相关性值,这表明高压力会导致血压升高。现在,如果将变量切换到那个位置,那么在那种情况下,结果也将是相同的,这表明压力是由血压引起的,这毫无意义。因此,研究人员应了解自己用于进行分析的数据。
- 使用这种方法,由于只能说明两个变量之间是否存在任何关系,因此无法获得有关线的斜率的信息。
- 皮尔逊相关系数可能会被误解,尤其是在均质数据的情况下。
- 与其他计算方法相比,此方法要花费大量时间才能得出结果。
重要事项
- 值的范围可以从值+1到值-1,其中+1表示所考虑的变量之间的完全正相关,-1表示所考虑的变量之间的完全负相关,0表示没有关系存在于所考虑的变量之间。
- 它与变量的度量单位无关。例如,如果一个变量的计量单位是年,而第二变量的计量单位是千克,那么即使这样,该系数的值也不会改变。
- 变量之间的相关系数是对称的,这意味着Y和X或X和Y之间的相关系数的值将保持不变。
结论
皮尔逊相关系数是相关系数的类型,它表示两个变量之间的关系,这些变量以相同的间隔或相同的比例尺进行测量。它测量两个连续变量之间关系的强度。
它不仅说明了两个变量之间相关性的存在与否,而且还确定了这些变量相关的确切程度。它与变量的度量单位无关,其中相关系数的值可以在值+1到值-1的范围内。但是,仅仅说出因变量和自变量之间的差异是不够的。