统计学中的参数估计是通过样本统计量来估计总体参数的过程。常见的估计方法有点估计和区间估计。
(一)点估计
点估计是通过样本统计量的具体数值直接估计总体参数。例如,基于随机样本,可以用样本均值估计总体均值,用样本发生率估计总体率,用样本方差估计总体方差。以营销方法A的实验组(假设有1000人)为例,若用户访问到完单转化率计算结果为68.9%,则可认为使用该营销方法后,访问到完单转化率将达到68.9%。
点估计方法简单,但未考虑抽样误差,估计值难以代表真值。
(二)区间估计
区间估计将样本统计量与标准误结合,确定一个包含总体参数的范围,即总体参数的置信区间。置信度通常记为1-α,α为检验水准,由研究者决定,一般取值为0.05。置信区间由上下置信限构成,较小的数值为置信下限,较大的数值为置信上限。置信区间为开区间,不包括上下置信限。
95%双侧置信区间的正确解释:该置信区间包含总体参数的可能性为95%。可理解为,如果实验重复100次,每次样本含量相同,则估算的100个置信区间中,有95个包含总体参数,5个不包含。面试中,面试者常错误地解释为:总体参数落入置信区间的可能性为95%。
区间估计结合样本统计量与标准误确定。统计量是通过样本计算出的均值或发生率;标准误描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映样本均数之间的变异。
实际工作中,对总体进行多次有放回采集样本不现实。根据一次抽样结果估算总体参数的95%置信区间,需根据样本量大小和统计量的类型得到的标准误进行估算。标准误的估算方式根据样本统计量是均数还是发生率分为两类:
样本标准差估计总体均值的标准误,公式为:
[公式]
其中,[公式]表示总体均值的标准误,[公式]表示样本标准差,[公式]表示样本量。
样本发生概率估计总体频率的标准误,公式为:
[公式]
其中,[公式]表示总体频率的标准误,[公式]表示样本发生概率,[公式]表示样本量。
理解了标准误及其计算方式,即可计算总体参数的置信区间。
总体均值的置信区间
(1)当总体标准差未知且样本量较小时[公式],样本均值概率分布服从[公式]分布,总体均数[公式]的双侧[公式]置信区间为:
[公式]
其中[公式]是均值,[公式]指在自由度为[公式]下,双侧检验水准为[公式]时对应的[公式]值,[公式]为样本标准差,[公式]为样本量。
(2)当总体标准差已知且样本量较大时[公式],样本均值概率分布服从[公式]分布,总体均数[公式]的双侧[公式]置信区间为:
[公式]
其中[公式]是指在标准正态分布下,在双侧概率值为[公式]时对应的取值,[公式],[公式]。
总体概率的置信区间
(1)当样本量较小时[公式],特别当[公式]非常接近于0或1时,可以通过查表法确定总体概率的置信区间。
(2)当样本量足够大时[公式],且[公式]及[公式]均大于5时,总体概率[公式]的双侧[公式]置信区间为:
[公式]
在点估计的举例中,使用营销方式A的实验组用户访问到完单转化率双侧95%的置信区间为:
[公式]
结果为:(66.0%,71.8%)
(三)置信区间的实际意义
统计学中假设检验回答了组别之间的差异是否具有统计学意义,但置信区间不仅可以回答差异是否具有统计学意义,还可以提示差异是否具有实际意义。例如,在A/B Test实验开始前,若要求营销方法A至少使用户访问到完单转化率达到67%才认为满足了ROI,则67%是具有实际意义的值。上述案例计算得到的置信区间为(66.0%,71.8%),67%大于置信下限值66%,提示使用营销方法A可能有实际意义。若定义至少要到70%才能满足ROI,由于70%在计算的总体参数置信区间中,并不能说明营销方法A具有实际意义,因为营销方法A得到用户访问到完单转化率总体值有可能小于70%。
结合上图可以看到:
置信区间在数据分析的实际应用中很多,例如,一个产品的差评率高,如果只给出点估计的值,可能会受到产品和运营的怀疑。作为一个专业的数据分析师,给出的是差评率的置信区间,且置信区间的下限已超过差评率的控制线,此时说明你的专业性。
温馨提示:答案为网友推荐,仅供参考