皮尔逊相关系数(公式,示例)|计算皮尔逊R

皮尔逊相关系数定义

Pearson相关系数,也称为Pearson R统计检验,用于测量不同变量及其关系之间的强度。每当在两个变量之间进行任何统计检验时,对于进行分析的人员来说,知道两个变量之间的关系有多强,计算相关系数的值始终是一个好主意。

皮尔逊的相关系数返回值介于-1和1之间。相关系数的解释如下:

  • 如果相关系数为-1,则表示强负相关。这意味着变量之间存在完美的负相关关系。
  • 如果相关系数为0,则表示没有关系。
  • 如果相关系数为1,则表示强正相关。它暗示了变量之间的完美正关系。

相关系数的绝对值越高,表示变量之间的关系越强。因此,与例如0.36的值相比,0.78的相关系数表示更强的正相关。同样,相关系数为-0.87表示负相关性比相关系数为-0.40更大。

换句话说,如果该值在正范围内,则表明变量之间的关系呈正相关,并且两个值一起减小或增大。另一方面,如果该值在负范围内,则表明变量之间的关系呈负相关,并且两个值都将朝相反的方向发展。

皮尔逊相关系数公式

培生的相关系数公式如下:

在哪里,

  • r =皮尔逊系数
  • n =股票对的数量
  • ∑xy =配对股票的乘积之和
  • ∑x = x分数之和
  • ∑y = y分数之和
  • ∑x2 = x分数的平方和
  • ∑y2 = y值平方的总和

解释

步骤1: 找出变量对的数量,用n表示。让我们假设x包含3个变量– 6,8,10。让我们假设y由相应的3个变量12、10、20组成。

第2步: 在两列中列出变量。

第三步: 在第三列中找出x和y的乘积。

第4步: 找出所有x变量和所有y变量的值之和。将结果写在第一列和第二列的底部。将x * y的总和写在第三栏中。

步骤5: 在第4列和第5列中找出x2和y2,并在列底部找到它们的总和。

步骤6: 将上面找到的值插入公式中并求解。

r = 3 * 352-24 * 42 /√(3 * 200-242)*(3 * 644-422)

= 0.7559

皮尔逊相关系数R的示例

您可以在此处下载此Pearson相关系数Excel模板– Pearson相关系数Excel模板

例子1

在本示例中,借助以下详细信息表中的以下六个人,这些人具有以下不同年龄和不同权重,用于计算Pearson R的值

解决方案:

对于皮尔逊相关系数的计算,我们将首先计算以下值:

这里的总人数是6 n = 6

现在,Pearson R的计算如下:

  • r =(n(∑xy)-(∑x)(∑y))/(√[n ∑x2-(∑x)2] [n ∑y2–(∑y)2)
  • r =(6 *(13937)-(202)(409))/(√[6 * 7280-(202)2] * [6 * 28365-(409)2)
  • r =(6 *(13937)-(202)*(409))/(√[6 * 7280-(202)2] * [6 * 28365-(409)2)
  • r =(83622- 82618)/(√[43680 -40804] * [170190-167281)
  • r = 1004 /(√[2876] * [2909)
  • r = 1004 /(√8366284)
  • r = 1004 / 2892.452938
  • r = 0.35

因此,皮尔逊相关系数的值为 0.35

范例#2

有2只股票-A和B。在特定日期的股价如下:

从以上数据中找出皮尔逊相关系数。

解决方案:

首先,我们将计算以下值。

皮尔逊系数的计算如下:

  • r = (5*1935-266*37)/((5*14298-(266)^2)*(5*283-(37)^2))^0.5
  • = -0.9088

因此,两只股票之间的皮尔逊相关系数为-0.9088。

好处

  • 它有助于了解两个变量之间的关系。不仅使用皮尔逊相关系数指示了两个变量之间是否存在相关性,而且还确定了这些变量相关的确切程度。
  • 使用这种方法,可以确定相关方向,即两个变量之间的相关是负还是正。

缺点

  • 皮尔逊相关系数R不足以分辨因变量和自变量之间的差异,因为变量之间的相关系数是对称的。例如,如果一个人试图了解高压力和血压之间的相关性,那么人们可能会发现该高相关性值,这表明高压力会导致血压升高。现在,如果将变量切换到那个位置,那么在那种情况下,结果也将是相同的,这表明压力是由血压引起的,这毫无意义。因此,研究人员应了解自己用于进行分析的数据。
  • 使用这种方法,由于只能说明两个变量之间是否存在任何关系,因此无法获得有关线的斜率的信息。
  • 皮尔逊相关系数可能会被误解,尤其是在均质数据的情况下。
  • 与其他计算方法相比,此方法要花费大量时间才能得出结果。

重要事项

  • 值的范围可以从值+1到值-1,其中+1表示所考虑的变量之间的完全正相关,-1表示所考虑的变量之间的完全负相关,0表示没有关系存在于所考虑的变量之间。
  • 它与变量的度量单位无关。例如,如果一个变量的计量单位是年,而第二变量的计量单位是千克,那么即使这样,该系数的值也不会改变。
  • 变量之间的相关系数是对称的,这意味着Y和X或X和Y之间的相关系数的值将保持不变。

结论

皮尔逊相关系数是相关系数的类型,它表示两个变量之间的关系,这些变量以相同的间隔或相同的比例尺进行测量。它测量两个连续变量之间关系的强度。

它不仅说明了两个变量之间相关性的存在与否,而且还确定了这些变量相关的确切程度。它与变量的度量单位无关,其中相关系数的值可以在值+1到值-1的范围内。但是,仅仅说出因变量和自变量之间的差异是不够的。