测定系数(定义,示例)|解释

决定系数是多少?

确定系数(也称为R平方)确定因变量的方差程度,该因变量可以由自变量解释。通过查看R ^ 2值,可以判断回归方程是否足够好以致可以使用。系数越高,回归方程越好,因为它暗示为确定因变量而选择的自变量已正确选择。

详细说明

在哪里

  • R =相关
  • R ^ 2 =回归方程的确定系数
  • N =回归方程式中的观察数
  • Xi =回归方程的自变量
  • X =回归方程自变量的均值
  • Yi =回归方程的因变量
  • Y =回归方程因变量的平均值
  • σx=自变量的标准偏差
  • σy=因变量的标准偏差

系数的值介于0到1之间,其中值0表示自变量不能解释因变量的变化,而值1表示自变量可以完美地解释因变量的变化。

例子

您可以在此处下载此确定系数公式Excel模板–确定系数公式Excel模板

范例#1

让我们尝试通过一个示例来理解确定系数公式。让我们尝试找出卡车司机所覆盖的距离与卡车司机的年龄之间的关系。有人实际上做了回归方程,以验证他对两个变量之间关系的看法是否也被回归方程所验证。在此特定示例中,我们将看到哪个变量是因变量,哪个变量是自变量。

该回归方程式中的因变量是卡车驾驶员的行驶距离,自变量是卡车驾驶员的年龄。我们可以在公式和平方的帮助下找到相关性,以获得回归方程的系数。数据集和变量在随附的excel工作表中显示。

解决方案:

以下给出用于计算确定系数的数据。

因此,确定系数的计算如下:

R = -424520 /√(683696 * 81071100)

R将是–

R = -0.057020839

R ^ 2为–

R ^ 2 = 0.325%

范例#2

让我们尝试在另一个示例的帮助下理解确定系数的概念。让我们尝试找出班级学生的身高与这些学生的GPA成绩之间的关系。在此特定示例中,我们将看到哪个变量是因变量,哪个变量是自变量。

该回归方程中的因变量是学生的GPA,自变量是学生的身高。我们可以在公式和平方的帮助下找到相关性,以获得回归方程的R ^ 2。数据集和变量在随附的excel工作表中显示。

解决方案:

以下给出用于计算确定系数的数据。

因此,计算如下

R = 34.62 /√(169204 * 3245)

R = 0.000467045

R ^ 2 = 0.000000218

解释

为了确定数据集是否合适,确定系数是非常重要的输出。有人实际上进行了回归分析,以验证他对两个变量之间关系的看法是否也通过回归方程式得到了验证。系数越高,回归方程越好,因为它暗示为确定因变量而选择的自变量已正确选择。理想情况下,研究人员将寻找最接近100%的确定系数。