应用统计学
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3 频数分配

在统计分组的基础上,把数据按组归并排列,形成各个数据单位在各组间的分布,称为频数分配,也称分布数列、分配数列,俗称“数数”。

各组分配的数据个数叫作次数,又叫频数;各组次数占总体数据的比重称为频率。表2-6为某高校在校生性别频数分布表。

当数值型数据采用“上下组限重叠”的组距式分组方式时,组限变量值既是小组的上组限又是相邻大组的下组限,这个变量值应该划归到哪个组呢?为了解决重复的问题,在频数分配时习惯上按照“上组限不在内”的原则,即不将它算在小组内,而计算在大组内。下面的某班学生考试成绩数据制作成了表2-7的频数分布表。

其中成绩80分既是组70~80分的上组限,又是组80~90分的下组限。在进行频数分配时,应该把它归入哪个组呢?按照“上组限不在内”的原则,80分应该划归到组80~90分,而不应该划给组70~80分。以此类推,成绩90分应该划在组“90分以上”,而不应该归入组80~90分。所以,划入组80~90分的数据有:80、87、82、80、89、88、85。该组的频数为7人。

对于顺序型数据和数值型数据,频数分配表中不仅可以计算频数、频率,还可以计算累积频数和累积频率。

累积频数(频率)是将各组的频数(频率)逐级累加起来得到的频数(频率),频数(频率)的累积方法有两种:一是从上到下进行累积,称为向下累积;二是从下到上进行累积,称为向上累积。

【例子2-2】为评价家电行业售后服务的质量,随机抽取了由300个家庭构成的一个样本。服务质量的等级分别为:非常不满意、不满意、一般、满意、非常满意。调查结果的频数分布表如表2-8所示。

表2-8 家电行业售后服务质量评价频数分布表

在向下累积中,数值225指的是对售后服务质量的评价在一般以下的有225户,占比75%;在向上累积中,数值168指的是对售后服务质量的评价在一般以上的有168户,占比56%。

某市120家企业利润额频数分布表中,在向下累积中,数值91指的是利润额小于500万元的企业有91家,占比75.8%;在向上累积中,数值71指的是利润额在400万元以上的企业有71家,占比59.2%(见表2-9)。

表2-9 某市120家企业利润额频数分布表