均值与中位数|统计中使用的方法之间的差异

中位数和中位数之间的差异

中位数和中位数 是数学中的两个常用术语,均值就像给定数字的平均值,将它们相加并除以数字计数即可得出平均值,而中位数则从整个数据集中返回中间数,如果数据集是偶数,则中位数将两个中间数字相加并除以2,得到中位数。

它们是集中趋势的度量,通常用于测量需要绘制分析和解释结果的大型数据集。平均值,中位数和众数是平均值的三个度量,显示数据来自平均值或平均值的离散度。这些方法广泛用于统计中,而数据的平均值是这三种方法中使用最广泛的方法。

什么意思

平均值是阵列中观察值的简单总和,然后除以观察值。例如,如果我们谈论由5个人组成的组的平均身高或平均身高。平均身高的计算方法是将5个人的身高除以人数即5。

公式

平均值=(所有观测值的总和/观测值的数量)

中位数是多少?

另一方面,中位数是数据数组集中的中间数字,该中间数字将较高的数据集与较低的数据集分开。首先需要按升序排列数据,以计算数据的中位数。当数据集具有基数时,需要获取数据集中的中间两个数字的平均值。但是,这两种方法经常互换使用。

公式

中值公式 =(n + 1)/ 2

当n是奇数时

中位数= [(n / 2)+ {(n / 2)+1}] / 2

当n是偶数时

平均值与中位数信息图表

让我们来看看平均值与中位数之间的最大差异。

均值与中位数关键差异

  • Mean易于使用和应用,并且可以应用于任何数据数组,无论是偶数还是奇数。另一方面,中位数的使用有点复杂,在计算之前,数据集需要先按升序或降序排列。
  • 平均值通常用于正态分布,而中位数用于偏斜分布数据集。
  • 平均值很简单,但并不稳健,因为它可能包含分布中的异常值,有时无法为用户提供正确的解释结果。另一方面,中位数方法是健壮的,并且更适合用于偏斜分布以得出日期集的集中趋势,并且与均值相比将为用户提供许多准确的结果
  • 平均值只有一个公式,即所有观测值的总和除以观测值的数量。而中位数有两个公式之一,即奇数,只有数据集中的中间数成为中位数。但是,当我们拥有偶数数据集时,将选择两个值的中间值并将它们除以2,这将为我们提供偶数数据集的中值。

平均值与中位数比较表

意思是中位数
通过将数据数组中的所有值相加得出平均值,然后除以观察数中位数是数据集的确切中间值。可以通过按升序排列数据集,然后从数据集中查找或挑选出中间值来进行计算
由于易于计算平均值,因此在行业中得到了更广泛的应用,它为我们提供了一个快速的数字它在行业中并不经常使用,但是比简单的数字总和要更完整和准确
它通常用于正常偏斜的数据集,即正态分布在数据中存在明显偏斜或数据尾巴较长时,描述数据集特别方便。它被广泛使用,其中轮廓绘制器在数据中占很大的比重,这意味着不是一个好的计算方法
它不是用于计算集中趋势的可靠工具这是一个非常强大的工具,因为它可以确定数据中的权重,通常在较长的尾巴上权重较高
对异常值非常敏感它受异常值的影响要小得多
使用简单本质上很复杂
无法对分类数据进行计算,因为无法对这些值求和由于无法对其进行逻辑排序,因此无法将其标识为分类的名义数据。

结论

除了均值和中位数,还有另一种方法通常用于测量中心趋势即众数。众数是最常出现在数据集中的一个值,该模式具有优于均值和中位数的优势,可以在数值和分类数据集中找到它。

尽管存在众数和中位数,但均值仍是更好的结果和分析方法的优势,但均值仍然是集中趋势的最合适度量,尤其是在数据集为正态分布且数据通常为偏斜的情况下。

作为一名优秀的分析师,应使用所有三种数据方法来衡量中心趋势,并应考虑和仔细分析分析中的差异,以在数据集中产生更好,更准确的结果。