偏度-含义,类型和示例
偏度含义
偏度描述了多少统计数据分布与正态分布不对称,正态分布在两侧均分。如果分布不对称或不呈正态分布,则它会偏斜,即频率分布偏向左侧或右侧。
偏度类型
如果分布是对称的,则其偏度为0,其均值=中位数=模式。
因此,基本上有两种类型-
- 积极的:当大多数分配频率位于分配的右侧且右尾较长且较肥大时,分配呈正偏。分布的均值>中位数>模式。
- 消极的:当大多数分布频率位于分布的左侧且左尾较长且较肥大时,分布呈负偏斜。分布的均值<中位数<模式。
公式
偏度公式如下所示–
有几种方法可以计算数据分布的偏斜度。皮尔森的第一个和第二个系数就是其中之一。
- 皮尔逊(Pearson)的第一个系数(模式偏度):它基于分布的均值,众数和标准偏差。
公式:(均值-模式)/标准偏差。
- 皮尔逊(Pearson)的第二个系数(中值偏度):它基于分布的均值,中值和标准差。
公式:(均值-中位数)/标准差。
正如您在上面看到的那样,Pearson的第一个偏度系数使用模式作为其计算的一个变量,并且仅当数据中的数据具有更多重复数时才有用,就像数据集中只有几个重复数据属于到模式,则Pearson的第二偏度系数是中心趋势的更可靠度量,因为它考虑的是数据集的中位数而不是模式。
例如:
数据集(a):7、8、9、4、5、6、1、2、2、3。
数据集(b):7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3。
对于这两个数据集,我们都可以得出模式为2的结论。但是对数据集(a)使用Pearson的第一个偏度系数是没有意义的,因为它的2号仅在数据集中出现两次,但可以用来对于数据集(b),因为它具有更重复的模式。
使用以下公式来计算偏度的另一种方法:
- =随机变量。
- X =分布平均值。
- N =进入分配的总变量。
- α=标准偏差。
偏度示例
为了更详细地了解这个概念,让我们看下面的示例:
您可以在此处下载此偏斜度Excel模板–偏斜度Excel模板
在XYZ管理学院中,有30名最后一年的学生正在考虑将其安置到QPR研究公司,其报酬是根据学生的学习成绩和过去的工作经验而定。以下是PQR研究公司的学生补偿数据。
解决方案
使用以下数据
分布均值的计算
- = ($400*12+$500*8+$700*5+$850*3+$1000*2)/30
- 分布平均值= 561.67
标准偏差的计算
- 标准偏差=√{(偏差平方和*学生人数)/ N}。
- 标准偏差= 189.16
偏度的计算可以如下进行:
- 偏度:(偏差立方体的总和)/(N-1)*标准偏差的立方体。
- = (106374650.07) / (29 * 6768161.24)
- = 0.54
因此,值0.54告诉我们分布数据与正态分布略有偏差。
好处
- 偏度更好地衡量投资回报的绩效。
- 投资者在分析数据集时会用到这一点,因为它考虑了分布的极端性,而不是仅仅依赖于
- 它是统计数据中广泛使用的工具,因为它有助于了解正态分布中有多少数据是不对称的。
缺点
- 偏度范围从负无穷大到正无穷大,有时投资者很难预测数据集中的趋势。
- 分析师使用财务模型预测资产的未来绩效,该模型通常假设数据是正态分布的,但是如果数据分布存在偏差,则该模型将无法在其假设中反映实际结果。
重要性
在统计中,当分发数据不是正态分布时,它起着重要的作用。极端数据点进入数据集可导致数据分布向左偏斜(即极端数据点进入数据集较小,偏斜数据集为负值,这意味着结论
偏度就是数据集偏离其正态分布的数量。数据集中较大的负值表示分布是负偏斜的,数据集中较大的正值表示分布是正分布的。这是一个很好的统计方法,可以帮助投资者预测分配的收益。