偏度-含义,类型和示例

偏度含义

偏度描述了多少统计数据分布与正态分布不对称,正态分布在两侧均分。如果分布不对称或不呈正态分布,则它会偏斜,即频率分布偏向左侧或右侧。

偏度类型

如果分布是对称的,则其偏度为0,其均值=中位数=模式。

因此,基本上有两种类型-

  • 积极的:当大多数分配频率位于分配的右侧且右尾较长且较肥大时,分配呈正偏。分布的均值>中位数>模式。
  • 消极的:当大多数分布频率位于分布的左侧且左尾较长且较肥大时,分布呈负偏斜。分布的均值<中位数<模式。

公式

偏度公式如下所示–

有几种方法可以计算数据分布的偏斜度。皮尔森的第一个和第二个系数就是其中之一。

  • 皮尔逊(Pearson)的第一个系数(模式偏度):它基于分布的均值,众数和标准偏差。

公式:(均值-模式)/标准偏差。

  • 皮尔逊(Pearson)的第二个系数(中值偏度):它基于分布的均值,中值和标准差。

公式:(均值-中位数)/标准差。

正如您在上面看到的那样,Pearson的第一个偏度系数使用模式作为其计算的一个变量,并且仅当数据中的数据具有更多重复数时才有用,就像数据集中只有几个重复数据属于到模式,则Pearson的第二偏度系数是中心趋势的更可靠度量,因为它考虑的是数据集的中位数而不是模式。

例如:

数据集(a):7、8、9、4、5、6、1、2、2、3。

数据集(b):7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3。

对于这两个数据集,我们都可以得出模式为2的结论。但是对数据集(a)使用Pearson的第一个偏度系数是没有意义的,因为它的2号仅在数据集中出现两次,但可以用来对于数据集(b),因为它具有更重复的模式。

使用以下公式来计算偏度的另一种方法:

  • =随机变量。
  • X =分布平均值。
  • N =进入分配的总变量。
  • α=标准偏差。

偏度示例

为了更详细地了解这个概念,让我们看下面的示例:

您可以在此处下载此偏斜度Excel模板–偏斜度Excel模板

在XYZ管理学院中,有30名最后一年的学生正在考虑将其安置到QPR研究公司,其报酬是根据学生的学习成绩和过去的工作经验而定。以下是PQR研究公司的学生补偿数据。

解决方案

使用以下数据

分布均值的计算

  • = ($400*12+$500*8+$700*5+$850*3+$1000*2)/30
  • 分布平均值= 561.67

标准偏差的计算

  • 标准偏差=√{(偏差平方和*学生人数)/ N}。
  • 标准偏差= 189.16

偏度的计算可以如下进行:

  • 偏度:(偏差立方体的总和)/(N-1)*标准偏差的立方体。
  • = (106374650.07) / (29 * 6768161.24)
  • = 0.54

因此,值0.54告诉我们分布数据与正态分布略有偏差。

好处

  • 偏度更好地衡量投资回报的绩效。
  • 投资者在分析数据集时会用到这一点,因为它考虑了分布的极端性,而不是仅仅依赖于
  • 它是统计数据中广泛使用的工具,因为它有助于了解正态分布中有多少数据是不对称的。

缺点

  • 偏度范围从负无穷大到正无穷大,有时投资者很难预测数据集中的趋势。
  • 分析师使用财务模型预测资产的未来绩效,该模型通常假设数据是正态分布的,但是如果数据分布存在偏差,则该模型将无法在其假设中反映实际结果。

重要性

在统计中,当分发数据不是正态分布时,它起着重要的作用。极端数据点进入数据集可导致数据分布向左偏斜(即极端数据点进入数据集较小,偏斜数据集为负值,这意味着模式)。它可以帮助拥有短期持有期的投资者分析数据以识别趋势,该趋势正处于分布的极端。

结论

偏度就是数据集偏离其正态分布的数量。数据集中较大的负值表示分布是负偏斜的,数据集中较大的正值表示分布是正分布的。这是一个很好的统计方法,可以帮助投资者预测分配的收益。