为什么要进行组距分组?

如题所述

原因是:组距式变量数列计算算术平均数时,用组中值代表组内变量的一般水平,有一个假设条件,即各组的变量值在本组内呈均匀分布。组距计算时取组中值作为这一组的平均值,且如果是开区间的分组,第一组与最后一组的组中值是由组距决定的!还有组距计算时,其实是加权平均值。

根据组距数列计算求得的算术平均数是一个近似值。在分组整理统计量数时,组的大小可因系列内量数的全距及所要划分的组数的不同而有所不同。

采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

 


扩展资料:

采用组距分组需要经过的步骤:

第一步:

确定组数。一组数据与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。

组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K:K=1+lgn/lg2

其中n为数据的个数,对结果用四舍五入的办法取整数即为组数。例如,对前例的数据有:K=1+lg50/lg2≈7,即应分为7组。当然,这只是一个经验公式,实际应用时,可根据数据的多少和特点及分析的要求,参考这一标准灵活确定组数。

第二步:

确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值(即极差)及所分的组数来确定,即组距=(最大值-最小值)÷组数。例如,对于前例的数据,最大值为139,最小值为107,则组距=(139-107)÷7=4.6。

为便于计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取5。

参考资料来源:百度百科-组距

温馨提示:答案为网友推荐,仅供参考
相似回答