1. EducationMathStatistics统计和直方图
带有在线练习的傻瓜统计工作簿,第二版

黛博拉·J·鲁姆西

直方图是为定量数据制作的条形图。由于数据是数字数据,因此您可以将其分成几组,而在它们之间不会留有任何空隙(因此,条形图已连接)。 Y轴显示属于每个组的数据的频率(计数)或相对频率(百分比)。

如何创建直方图

要制作直方图,首先需要将数据划分为合理数量的长度相等的组。计算属于每个组的数据集中的值的数量(换句话说,制作频率表)。如果数据点落在边界上,请决定要放入哪个组,并确保保持一致(始终将其放在两个组中的较高者,或始终将其放在两个组中的较低者)。使用组及其频率(频率直方图)制作条形图。

如果将频率除以总样本量,则得出每个组的百分比。显示组及其百分比的表是相对频率表。对应的直方图是相对频率直方图。

您可以使用Minitab或其他软件包制作直方图,也可以手工制作直方图。无论哪种方式,您选择的间隔宽度(计算机程序包称为箱)可能与图中所示的有所不同,只要您看起来相似,就可以。只要您不使用数量很少或太少的条形图,并且您的条形图具有相同的宽度,它们就会使用。

您也可以为每个间隔选择不同的起点/终点,这也很好。只需确保清楚标记所有内容,以使您的老师可以看到您要做什么。并且对于最终在边界上的值要保持一致;始终将它们放在较低的组中,或始终将它们放在较高的组中。但是,如果可以选择的话,可以使用Minitab之类的计算机软件包来制作直方图。它使您的任务更加轻松。

有关制作两种直方图的示例,请参见以下内容。

下表显示了30位学生的测试成绩。

频率直方图和相对频率直方图看起来相同;它们只是在Y轴上使用不同的比例来完成。

下图显示了得分数据的频率直方图。

频率直方图

您可以通过将每个频率除以30(总样本大小)来找到相对频率。这三组的相对频率为8/30 = 0.27或27%; 16/30 = 0.53或53%;和6/30 = 0.20或20%。

基于相对频率的直方图看起来与(相同数据的)直方图相同。唯一的区别是Y轴上的标签。

理解直方图

直方图为您提供有关定量(数值)数据的三个主要特征的一般信息:形状,中心和扩展。

直方图的形状由其一般样式显示。可能有很多模式,有些是常见的,包括以下几种:

  • 钟形:看起来像钟形,中间有一个大块,尾巴以相同的速度向下垂。 (图一) 右偏:数据的很大一部分偏向左侧,一些较大的观测值偏向右侧。 (图b) 左偏斜:大部分数据偏向右侧,一些较小的观测值偏向左侧。 (图c) 均匀:所有条形都具有相似的高度。 (图d) 双峰:两个峰,或(图e) U形:双峰,低端和高端都有两个峰,中间的数据较少。 (见图4-1(图f) 对称:将其拆分成中间时,每一侧看起来都相同;钟形,均匀和U形直方图都是对称数据的示例。 (图a,d和f)
常见的直方图模式

您可以通过两种方式查看直方图的中心。一个是x轴上的图形平衡点,其中考虑了数据的实际值。该点称为平均值,您可以通过找到平衡点来找到它(假设数据在跷跷板上)。查看中心的另一种方法是在直方图中定位线条,其中50%的数据位于两侧。该线称为中位数,它代表数据集的物理中间值。想象一下将直方图切成两半,以使一半区域位于直线的两侧。

传播是指数据之间的距离,相对于彼此或相对于某个中心点。一种测量价差的粗略方法是找到范围,即最大值和最小值之间的距离。另一种方法是寻找到中心的平均距离,也就是标准偏差。仅通过查看直方图很难得出标准偏差,但是如果将范围除以6,您会得到一个大概的想法。如果靠近中间的条形的高度看起来很高,则意味着大多数该值接近平均值,表示标准偏差小。如果条形显示较短,则可能会有较大的标准偏差。

您可以进行实际的汇总统计数据以计算定量数据,但是直方图可以为您提供找到这些里程碑的大致方向。与饼图和条形图一样,并非所有直方图都是公平,完整和准确的。您必须知道要寻找什么才能对其进行评估。

如何使用直方图理顺偏斜的数据

您需要对偏斜的数据集进行特殊考虑,就最适合使用哪种统计信息以及何时使用这些统计信息而言。您还应该知道使用错误的统计信息会如何提供误导性的答案。

您可以关联均值和中位数以了解数据的形状。均值和中位数接近相等将创建一个大致对称的形状

平均值受数据中异常值的影响,但中位数不受此影响。如果均值和中位数彼此接近,则数据不会偏斜,并且一侧或另一侧可能不会包含离群值。这意味着数据在中间的每一侧看起来都差不多,这就是对称数据的定义(请参见上图中的a,d或f)。

平均值和中位数接近可以告诉您数据大致对称的事实可用于另一种类型的测试题中。假设有人问您数据是否对称,并且您没有直方图,但是您有平均值和中位数。比较平均值和中位数这两个值,如果它们很接近,则数据是对称的。如果不是,则数据是不对称的。

如何发现误导性的直方图

直方图可能会误导读者,这是条形图无法做到的。请记住,直方图处理的是数字数据,而不是分类数据,这意味着您必须确定如何将数字数据分解为多个组以在水平轴上显示。以及如何确定这些分组可以使图形看起来非常不同。注意使用比例尺误导读者的直方图。与条形图一样,您可以通过在直方图的垂直轴上使用较小的比例来放大差异,而可以使用较大的比例来缩小差异。