偏度-含义，类型和示例

偏度含义

偏度描述了多少统计数据分布与正态分布不对称，正态分布在两侧均分。如果分布不对称或不呈正态分布，则它会偏斜，即频率分布偏向左侧或右侧。

偏度类型

如果分布是对称的，则其偏度为0，其均值=中位数=模式。

因此，基本上有两种类型-

积极的：当大多数分配频率位于分配的右侧且右尾较长且较肥大时，分配呈正偏。分布的均值>中位数>模式。
消极的：当大多数分布频率位于分布的左侧且左尾较长且较肥大时，分布呈负偏斜。分布的均值<中位数<模式。

公式

偏度公式如下所示–

有几种方法可以计算数据分布的偏斜度。皮尔森的第一个和第二个系数就是其中之一。

皮尔逊（Pearson）的第一个系数（模式偏度）：它基于分布的均值，众数和标准偏差。

公式：（均值-模式）/标准偏差。

皮尔逊（Pearson）的第二个系数（中值偏度）：它基于分布的均值，中值和标准差。

公式：（均值-中位数）/标准差。

正如您在上面看到的那样，Pearson的第一个偏度系数使用模式作为其计算的一个变量，并且仅当数据中的数据具有更多重复数时才有用，就像数据集中只有几个重复数据属于到模式，则Pearson的第二偏度系数是中心趋势的更可靠度量，因为它考虑的是数据集的中位数而不是模式。

例如：

数据集（a）：7、8、9、4、5、6、1、2、2、3。

数据集（b）：7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3。

对于这两个数据集，我们都可以得出模式为2的结论。但是对数据集（a）使用Pearson的第一个偏度系数是没有意义的，因为它的2号仅在数据集中出现两次，但可以用来对于数据集（b），因为它具有更重复的模式。

使用以下公式来计算偏度的另一种方法：

=随机变量。
X =分布平均值。
N =进入分配的总变量。
α=标准偏差。

偏度示例

为了更详细地了解这个概念，让我们看下面的示例：

您可以在此处下载此偏斜度Excel模板–偏斜度Excel模板

在XYZ管理学院中，有30名最后一年的学生正在考虑将其安置到QPR研究公司，其报酬是根据学生的学习成绩和过去的工作经验而定。以下是PQR研究公司的学生补偿数据。

解决方案

使用以下数据

分布均值的计算

= ($400*12+$500*8+$700*5+$850*3+$1000*2)/30
分布平均值= 561.67

标准偏差的计算

标准偏差=√{（偏差平方和*学生人数）/ N}。
标准偏差= 189.16

偏度的计算可以如下进行：

偏度：（偏差立方体的总和）/（N-1）*标准偏差的立方体。
= (106374650.07) / (29 * 6768161.24)
= 0.54

因此，值0.54告诉我们分布数据与正态分布略有偏差。

好处

偏度更好地衡量投资回报的绩效。
投资者在分析数据集时会用到这一点，因为它考虑了分布的极端性，而不是仅仅依赖于
它是统计数据中广泛使用的工具，因为它有助于了解正态分布中有多少数据是不对称的。

缺点

偏度范围从负无穷大到正无穷大，有时投资者很难预测数据集中的趋势。
分析师使用财务模型预测资产的未来绩效，该模型通常假设数据是正态分布的，但是如果数据分布存在偏差，则该模型将无法在其假设中反映实际结果。

重要性

在统计中，当分发数据不是正态分布时，它起着重要的作用。极端数据点进入数据集可导致数据分布向左偏斜（即极端数据点进入数据集较小，偏斜数据集为负值，这意味着模式）。它可以帮助拥有短期持有期的投资者分析数据以识别趋势，该趋势正处于分布的极端。

结论

偏度就是数据集偏离其正态分布的数量。数据集中较大的负值表示分布是负偏斜的，数据集中较大的正值表示分布是正分布的。这是一个很好的统计方法，可以帮助投资者预测分配的收益。

photosdematures.com