编制组距式变量数列时需要明确的要素有哪些

如题所述

上一页  下一页  返回 

你的位置:第三章 | 第三节|二、变量数列的编制

二、变量数列的编制
变量数列的编制比较复杂,因此有必要对变量数列的编制方法、编制步骤以及编制过程中需注意的问题进行探讨。
(一)阵列,求全距
首先对原始资料进行初步整理,即将各个变量值按大小顺序排列,形成一个阵列,并确定其全距R。全距是指资料中的最大值与最小值之差,能反映资料中各变量值波动的范围大小。通过初步整理,可使我们大致了解该资料的某些特征和变动规律,从而为正确编制变量数列提供必要的依据。
(二)确定变量数列的形式
编制单项数列还是组距数列,主要取决于所研究变量的类型以及变量变动的幅度。对于连续变量,因其所描述对象的数量特征,在一个区间内可以有无限多个数值,无法按一定次序将其变量值一一列举,所以只能编制组距数列。对于离散变量,则要根据其变量值的多少和变异幅度的大小来确定。如变量值较少以及变异幅度较小的,可编制单项数列;如变量值较多以及变异幅度较大的,应编制组距数列。具体如何分组,要结合分析目的及资料特点确定。
(三)确定组距和组数
组距的大小和组数的多少互为制约成反比关系。组距越大,组数就越少;组距越小,组数就越多。组数过少,容易把不同质的单位归在一个组内;组数过多,又容易把同质单位划入到不同的组内。两者都不符合分组的要求,都不能确切地反映总体的分布特征。因 此,确定组距和组数,应全面分析资料所反映的经济内容、变量值的离散程度或集中趋势以及数据多少等因素,要使组距能如实地反映出各组之间的数量界限,将同质单位归入同一组,而将不同质单位划分为不同的组,准确、真实地揭示出总体的分布特征及规律性。
当变量值变动比较均匀,并且可能编制等距数列的条件下,其组距也可采用斯特奇斯公式求得。这是一种假定总体各单位按其标志分布趋于正态分布的条件下,根据总体单位数目近似确定分组数目并计算组距近似值的方法,是由经验总结得来。计算公式为:
组距(i)=      
需要指出,根据经验,由此公式求出的组数,当数据较少时,往往过多;当数据较多时,则往往过少。所以该公式只能作为参考之用。
组距数列有等距数列和异距数列两种,选等距分组还是异距分组,应根据统计研究的任务和所研究现象变化的特点来决定。一般而言,凡是现象的变动比较均匀的,宜采用等距分组。如按工资,按身高、体重,按零件尺寸误差等分组。等距分组,由于各组组距相同,各组单位数(次数)只受标志变量的影响,因此可直接比较各组的次数。同时,根据等距数列资料,便于直接绘制统计图,计算各项综合指标并进行对比分析。因此,应尽可能采用等距分组。但在社会经济统计中,有些现象性质差异的变动并不均衡,往往波动很大,如急剧上升或下降,这就难以用等距分组的方法来划分不同性质的组,从现象量的变化中反映出不同质的差别,这就必须采用异距分组。
采用异距分组编制的异距数列,由于各组次数要受组距大小不同的影响,为消除此影响,更确切地反映出各组次数的实际分布状况,可计算次数密度或标准组距次数。
次数密度,就是单位组距内分布的次数,又称为频数密度。计算公式为:
次数密度=  
标准组距次数,即选定数列中某一合适的组距作为标准组距,用标准组距除以各组组距,得各组组距折合为标准组距的系数,再将各组的折合系数分别乘各组的次数,即可得各组的标准组距次数。
次数密度与标准组距次数其实质是相同的,它们都是对异距数列进行分析的重要指标。两者计算上的联系表现为:标准组距次数等于次数密度与标准组距的乘积。
(四)确定组限
组距、组数确定后,需进一步确定组限。组限应根据变量的性质来确定,更要有利于反映出总体各单位的实际分布特征。具体应考虑以下几个方面。(1)组限最好采用整数表示,各组下限尽可能取所选定组距的倍数。(2)组限一般不用负值表示,最小为零。(3)应使最小组下限不大于资料中的最小变量值,最大组上限不小于资料中的最大变量值。(4)对连续变量和离散变量组限的划分和表示方法,在技术上有不同的要求。对连续变量,相邻两组的组限应重叠,并且习惯上按照“上限不在本组内,应归入到下一组”的原则处理与上限相同的变量值。
(五)计量各组单位数
通过手工汇总或电子计算机汇总,在变量分组确定以后,直接计量各组内总体单位数目,得出各组总体单位的分配次数或以组次数占总次数的比率形式,则变量数列的编制结束,根据变量数列可进行各种统计分析。
温馨提示:答案为网友推荐,仅供参考
相似回答