统计学中,样本量的计算方法?

比如:有流行病调查发现,A病在北京的发病率为5%。我想做A病的病例研究,需要研究多少人啊?软件是stata。另外查阅了文献,都是发病率的结果,并没有说到误差之类的其他数据。
所以就只有一个5%可供参考,其他的文献报道,都是直接说结果,比如亚洲发病率7-10%,欧美地区10-15%等等。没有其他参数。

(1)重复抽样方式下:n为样本容量、d为抽样误差范围、σ为标准差,一般取0.5。

变量总体重复抽样计算公式:

属性总体重复抽样:

(2)不重复抽样方式下:

变量总体不重复抽样计算公式:

属性总体不重复抽样:

扩展资料

合理确定样本容量的意义:

1、样本容量过大,会增加调查工作量,造成人力、物力、财力、时间的浪费;

2、样本容量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性;

3、样本容量确定的科学合理,一方面,可以在既定的调查费用下,使抽样误差尽可能小,以保证推算的精确度和可靠性;另一方面,可以在既定的精确度和可靠性下,使调查费用尽可能少,保证抽样推断的最大效果。

参考资料来源:百度百科-样本量

参考资料来源:百度百科-样本容量

温馨提示:答案为网友推荐,仅供参考
第1个回答  2018-07-28
确定样本量方法有以下两种:一、根据允许的抽样误差的范围确定样本量在excel里设置α、p和△的值;计算累积机率值;选择“NORMINV”函数;计算Z值,计算样本量。二、根据特定目的确定样本量 1、样本若分成不同的组,总样本量要保证每组的样本量都不能低于100个; 2、当每组样本还需按不同的特性或配额划分成更小的组时,要保证每个小组的样本量至少在20-50个之间;拇指定律常用于总体数量庞大且有配额要求的调研,比如大众消费品市场的研究。例如,要调查某城市消费者对某品牌香烟的态度,我们可以把受访的消费者分成重度吸烟者和轻度吸烟者两组,如果重度吸烟者的人数少,约占所有香烟消费者的10%,为了保证重度消费者的样本量不低于100人,用简单随机抽样法,则总样本量就需要1000人。如果将重度吸烟者再细分成收入高、中、低三档,其中收入高的人数最少,只占总体人数的1%,按照拇指定律,要求该组样本量不少于20人,那么总样本量至少需2000人。因此,这个品牌香烟的调查项目样本量就应该是2000人。确定样本量要考虑样本结构、精度要求、调研经费以及总体特征易变性等因素。比如说,如果总体易变性强,或者说是样本之间的差异性大的时候,则需要适当增加样本量。
第2个回答  2014-11-16
你好,具体确定样本量还有相应的统计学公式,根据样本量计算公式,我们知道,样本量的大小不取决于总体的多少,而取决于(1) 研究对象的变动程度;(2) 所要求或允许的误差大小;(3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,如果不同城市分别进行推断时,"大城市多抽,小城市少抽"这种说法原则上是不对的。在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。
从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。
总之,在确定抽样方法和样本量的时候,既要考虑调查目的,调查性质,精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本量的选择。
第3个回答  2010-08-15
2年啊,这个课题时间太长了啊。这个量也不是固定的,最好不要错失。可以考虑下用样本方差的。样本关于给定点x在直线上散布的数字特征之 一,其中的点x称为方差中心。样本方差数值上等于构成样本的随机变量对离散中心 x之方差的平方和.设X、,…,戈是同分布实随机变 量,点x是选定的方差中心(x〔R’).那么,量 s。(x)=艺(x一x)z 称为关于点x的样本方差(sample variance),由于 s。(x)=s。(见)+n(无一x),)s。(无)二s。, 其中了二(X、+…十戈)加,可见当x二了时关于 x的样本方差取最小值.较小的S。说明样本元素关 于见集中;相反,较大的S。说明样本元素分散. 样本方差的概念,可以自然地推广到多维样本的样本协方差矩阵.
第4个回答  推荐于2017-09-18
  从总体中抽取的样本元素的总个数。
  样本量的计算公式为: N=Z 2 ×(P ×(1-P))/E 2
  其中,Z为置信区间、n为样本容量、d为抽样误差范围、σ为标准差,一般取0.5。
  研究中实际观测或调查的一部分个体称为样本(sample),研究对象的全部称为总体。为了使样本能够正确反映总体情况,对总体要有明确的规定;总体内所有观察单位必须是同质的;在抽取样本的过程中,必须遵守随机化原则;样本的观察单位还要有足够的数量。又称“子样”。按照一定的抽样规则从总体中取出的一部分个体。样本中个体的数目称为“样本容量”。
相似回答